Newer
Older
Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.
Peut envoyer par email et sur Mastodon les résultats.
## Installation
Il est recommandé d'utiliser virtualenv :
```bash
virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt
```
Vous devez avoir installé OCRmyPDF, les données `eng` et `fra` de Tesseract, et le démon Tor.
## Utilisation
Pour lancer la récupération de toutes les administrations supportées :
```bash
make
```
Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier `data/` afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.
Il est possible de ne lancer l'analyse que pour une seule administration, avec la commande : `./cli.py --pref identifiant`
- Préfecture de police de Paris (identifiant : `ppparis`)
- Préfecture des Alpes-de-Haute-Provence (identifiant : `pref04`)
- Préfecture des Alpes-Maritimes (identifiant : `pref06`)
- Préfecture des Bouches-du-Rhône (identifiant : `pref13`)
- Préfecture de l'Hérault (identifiant : `pref34`)
- Préfecture d'Ille-et-Vilaine (identifiant : `pref35`)
- Préfecture de l'Isère (identifiant : `pref38`)
- Préfecture du Nord (identifiant : `pref59`)
- Préfecture du Pas-de-Calais (identifiant : `pref62`)
- Préfecture des Hautes-Pyrénées (identifiant : `pref65`)
- Préfecture du Rhône (identifiant : `pref69`)
- Préfecture du Var (identifiant : `pref83`)
- Préfecture de Mayotte (identifiant : `pref976`)
## Licence
[CeCILL_V2.1-fr](https://cecill.info/licences/Licence_CeCILL_V2.1-fr.html) (voir le fichier `LICENSE`)