Skip to content
Extraits de code Groupes Projets
Sélectionner une révision Git
  • e2a3d0240c7e18fc007d50cae35a31669f148c35
  • main par défaut protégée
2 résultats

README.md

Blame
  • RAAspotter

    Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.

    Conçu pour être utilisé dans une CI.

    Peut envoyer par email et sur Mastodon les résultats.

    Installation

    Il est recommandé d'utiliser virtualenv :

    virtualenv --python=/usr/bin/python3 .
    source bin/activate
    pip3 install -r requirements.txt

    Vous devez avoir installé OCRmyPDF, les données eng et fra de Tesseract, et le démon Tor.

    Utilisation

    Pour lancer la récupération de toutes les administrations supportées :

    make

    Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier data/ afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.

    Il est possible de ne lancer l'analyse que pour une seule administration, avec la commande : ./cli.py --pref identifiant

    Administrations supportées

    • Préfecture de police de Paris (identifiant : ppparis)
    • Préfecture des Alpes-Maritimes (identifiant : pref06)
    • Préfecture des Bouches-du-Rhône (identifiant : pref13)
    • Préfecture d'Ille-et-Vilaine (identifiant : pref35)
    • Préfecture du Nord (identifiant : pref59)
    • Préfecture du Pas-de-Calais (identifiant : pref62)
    • Préfecture du Rhône (identifiant : pref69)

    Licence

    CeCILL_V2.1-fr (voir le fichier LICENSE)