Skip to content
Extraits de code Groupes Projets

RAAspotter

Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.

Conçu pour être utilisé dans une CI.

Peut envoyer par email et sur Mastodon les résultats.

Installation

Il est recommandé d'utiliser virtualenv :

virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt

Vous devez avoir installé OCRmyPDF, les données eng et fra de Tesseract, et le démon Tor.

Utilisation

Pour lancer la récupération de toutes les administrations supportées :

make

Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier data/ afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.

Il est possible de ne lancer l'analyse que pour une seule administration, avec la commande : ./cli.py --pref identifiant

Administrations supportées

  • Préfecture de police de Paris (identifiant : ppparis)
  • Préfecture des Alpes-de-Haute-Provence (identifiant : pref04)
  • Préfecture des Alpes-Maritimes (identifiant : pref06)
  • Préfecture des Bouches-du-Rhône (identifiant : pref13)
  • Préfecture de l'Hérault (identifiant : pref34)
  • Préfecture d'Ille-et-Vilaine (identifiant : pref35)
  • Préfecture de l'Isère (identifiant : pref38)
  • Préfecture du Nord (identifiant : pref59)
  • Préfecture du Pas-de-Calais (identifiant : pref62)
  • Préfecture des Hautes-Pyrénées (identifiant : pref65)
  • Préfecture du Rhône (identifiant : pref69)
  • Préfecture du Var (identifiant : pref83)
  • Préfecture de Mayotte (identifiant : pref976)

Licence

CeCILL_V2.1-fr (voir le fichier LICENSE)