# RAAspotter Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis. Conçu pour être utilisé dans une CI. Peut envoyer par email et sur Mastodon les résultats. ## Installation Il est recommandé d'utiliser virtualenv : ```bash virtualenv --python=/usr/bin/python3 . source bin/activate pip3 install -r requirements.txt ``` Vous devez avoir installé OCRmyPDF, les données `eng` et `fra` de Tesseract, et le démon Tor. ## Utilisation Pour lancer la récupération de toutes les administrations supportées : ```bash make ``` Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier `data/` afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement. Il est possible de ne lancer l'analyse que pour une seule administration, avec la commande : `./cli.py --pref identifiant` ## Administrations supportées - Préfecture des Alpes-Maritimes (identifiant : `pref06`) - Préfecture des Bouches-du-Rhône (identifiant : `pref13`) - Préfecture d'Ille-et-Vilaine (identifiant : `pref35`) - Préfecture du Nord (identifiant : `pref59`) - Préfecture du Pas-de-Calais (identifiant : `pref62`) - Préfecture de police de Paris (identifiant : `ppparis`) ## Licence [CeCILL_V2.1-fr](https://cecill.info/licences/Licence_CeCILL_V2.1-fr.html) (voir le fichier `LICENSE`)