Skip to content
Extraits de code Groupes Projets
README.md 1,3 ko
Newer Older
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

Une série de scripts en Python qui récupère les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

Conçu pour être utilisé dans une CI.

Peut envoyer par email et sur Mastodon les résultats.

Bastien Le Querrec's avatar
Bastien Le Querrec a validé
## Installation

Il est recommandé d'utiliser virtualenv :

```bash
virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt
```

Vous devez avoir installé OCRmyPDF, les données `eng` et `fra` de Tesseract, et le démon Tor.
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

## Utilisation

Pour lancer la récupération de toutes les administrations supportées :

```bash
make
```

Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier `data/` afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

Il est possible de ne lancer l'analyse que pour une seule administration, en lançant le fichier correspondant à l'administration.

## Administrations supportées

- Préfecture des Alpes-Maritimes  (`pref06.py`)
- Préfecture des Bouches-du-Rhône (`pref13.py`)
- Préfecture d'Ille-et-Vilaine (`pref35.py`)
- Préfecture de police de Paris (`ppparis.py`)
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

## Licence

[CeCILL_V2.1-fr](https://cecill.info/licences/Licence_CeCILL_V2.1-fr.html) (voir le fichier `LICENSE`)