Newer
Older
# RAA-spotter
Une série de scripts en Python qui récupèrent les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.
Conçu pour être utilisé dans une CI.
## Installation
Il est recommandé d'utiliser virtualenv :
```bash
virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt
```
Par ailleurs, vous devez avoir installé OCRmyPDF ainsi que les données `eng` et `fra` de Tesseract.
## Utilisation
Pour lancer la récupération de toutes les administrations supportées :
```bash
make
```
Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier `data/` afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.
Il est possible de ne lancer l'analyse que pour une seule administration, en lançant le fichier correspondant à l'administration.
## Administrations supportées
- Préfecture de police de Paris (`ppparis.py`)
- Préfecture des Bouches-du-Rhône (`pref13.py`)
## Licence
[CeCILL_V2.1-fr](https://cecill.info/licences/Licence_CeCILL_V2.1-fr.html) (voir le fichier `LICENSE`)