Skip to content
Extraits de code Groupes Projets

RAA-spotter

Une série de scripts en Python qui récupèrent les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.

Conçu pour être utilisé dans une CI.

Installation

Il est recommandé d'utiliser virtualenv :

virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt

Par ailleurs, vous devez avoir installé OCRmyPDF ainsi que les données eng et fra de Tesseract.

Utilisation

Pour lancer la récupération de toutes les administrations supportées :

make

Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier data/ afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.

Il est possible de ne lancer l'analyse que pour une seule administration, en lançant le fichier correspondant à l'administration.

Administrations supportées

  • Préfecture de police de Paris (ppparis.py)
  • Préfecture des Bouches-du-Rhône (pref13.py)

Licence

CeCILL_V2.1-fr (voir le fichier LICENSE)