Skip to content
Extraits de code Groupes Projets
README.md 1,16 ko
Newer Older
Bastien Le Querrec's avatar
Bastien Le Querrec a validé
# RAA-spotter

Une série de scripts en Python qui récupèrent les derniers recueils des actes administratifs (RAA) pour y rechercher certains mots-clés prédéfinis.

Conçu pour être utilisé dans une CI.

## Installation

Il est recommandé d'utiliser virtualenv :

```bash
virtualenv --python=/usr/bin/python3 .
source bin/activate
pip3 install -r requirements.txt
```

Par ailleurs, vous devez avoir installé OCRmyPDF ainsi que les données `eng` et `fra` de Tesseract.

## Utilisation

Pour lancer la récupération de toutes les administrations supportées :

```bash
make
```

Attention, le premier lancement prendra plusieurs jours ! Si vous utilisez une CI, vous devez mettre en cache le dossier `data/` afin que les fichiers déjà analysés ne soient pas téléchargés à chaque lancement.
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

Il est possible de ne lancer l'analyse que pour une seule administration, en lançant le fichier correspondant à l'administration.

## Administrations supportées

- Préfecture de police de Paris (`ppparis.py`)
- Préfecture des Bouches-du-Rhône (`pref13.py`)
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

## Licence

[CeCILL_V2.1-fr](https://cecill.info/licences/Licence_CeCILL_V2.1-fr.html) (voir le fichier `LICENSE`)