Skip to content
Extraits de code Groupes Projets

RAAspotter

Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.

Conçu pour être utilisé dans une CI.

Peut envoyer par email et sur Mastodon les résultats.

Installation

Il est recommandé d'utiliser virtualenv :

virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt

Vous devez avoir installé OCRmyPDF, les données eng et fra de Tesseract, et le démon Tor.

Utilisation

Pour lancer la récupération de toutes les administrations supportées :

make

Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier data/ afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.

Il est possible de ne lancer l'analyse que pour une seule administration, en lançant le fichier correspondant à l'administration.

Administrations supportées

  • Préfecture des Alpes-Maritimes (pref06.py)
  • Préfecture des Bouches-du-Rhône (pref13.py)
  • Préfecture d'Ille-et-Vilaine (pref35.py)
  • Préfecture de police de Paris (ppparis.py)

Licence

CeCILL_V2.1-fr (voir le fichier LICENSE)