# RAAspotter Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis. Conçu pour être utilisé dans une CI. Peut envoyer par email et sur Mastodon les résultats. ## Installation Il est recommandé d'utiliser virtualenv : ```bash virtualenv --python=/usr/bin/python3 . source bin/activate pip3 install -r requirements.txt ``` Vous devez avoir installé OCRmyPDF, les données `eng` et `fra` de Tesseract, et le démon Tor. ## Utilisation Pour lancer la récupération de toutes les administrations supportées : ```bash make ``` Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier `data/` afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement. Il est possible de ne lancer l'analyse que pour une seule administration, avec la commande : `./cli.py --pref identifiant` ## Administrations supportées - Préfecture de police de Paris (identifiant : `ppparis`) - Préfecture des Alpes-de-Haute-Provence (identifiant : `pref04`) - Préfecture des Alpes-Maritimes (identifiant : `pref06`) - Préfecture des Bouches-du-Rhône (identifiant : `pref13`) - Préfecture de l'Hérault (identifiant : `pref34`) - Préfecture d'Ille-et-Vilaine (identifiant : `pref35`) - Préfecture de l'Isère (identifiant : `pref38`) - Préfecture du Nord (identifiant : `pref59`) - Préfecture du Pas-de-Calais (identifiant : `pref62`) - Préfecture des Hautes-Pyrénées (identifiant : `pref65`) - Préfecture du Rhône (identifiant : `pref69`) - Préfecture du Var (identifiant : `pref83`) - Préfecture de Mayotte (identifiant : `pref976`) ## Licence [CeCILL_V2.1-fr](https://cecill.info/licences/Licence_CeCILL_V2.1-fr.html) (voir le fichier `LICENSE`)