Skip to content
Extraits de code Groupes Projets
ppparis.py 1,74 ko
Newer Older
Bastien Le Querrec's avatar
Bastien Le Querrec a validé
import argparse
import logging

from RAAspotter import RAAspotter
from RAAspotter_ppparis import RAAspotter_ppparis
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

# Config
__RAA_PAGE = 'https://www.prefecturedepolice.interieur.gouv.fr/actualites-et-presse/arretes/accueil-arretes'
__USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36'
__headless_mode = True
__KEYWORDS = os.getenv('KEYWORDS') or 'vidéoprotection,caméras,captation,aéronef'
Bastien Le Querrec's avatar
Bastien Le Querrec a validé
__DATA_DIR = os.path.dirname(os.path.abspath(__file__))+'/data/ppparis/'

# Début du script
parser = argparse.ArgumentParser(prog='ppparis.py', description='Télécharge les RAA de la Préfecture de police de Paris et recherche des mots-clés')
parser.add_argument('-k', '--keywords', action='store', help='liste des termes recherchés, séparés par une virgule (par défaut : vidéoprotection,caméras,captation,aéronef)')
Bastien Le Querrec's avatar
Bastien Le Querrec a validé
parser.add_argument('-v', action='store_true', help='relève le niveau de verbosité à INFO')
parser.add_argument('-vv', action='store_true', help='relève le niveau de verbosité à DEBUG')
args = parser.parse_args()

Bastien Le Querrec's avatar
Bastien Le Querrec a validé
  logging.basicConfig(level=logging.INFO)

Bastien Le Querrec's avatar
Bastien Le Querrec a validé
  logging.basicConfig(level=logging.DEBUG)

if args.keywords:
  __KEYWORDS = args.keywords
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

# On crée le dossier de téléchargement
os.makedirs(__DATA_DIR, exist_ok=True)

raa_spotter = RAAspotter_ppparis(__DATA_DIR, __USER_AGENT)
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

RAAspotter_ppparis.print_output('RAAspotter_ppparis')
RAAspotter_ppparis.print_output(f'Termes recherchés: {__KEYWORDS}')
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

page_content = raa_spotter.get_session(__RAA_PAGE, "block-decree-list-block")
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

raa_elements = raa_spotter.get_raa(page_content)
Bastien Le Querrec's avatar
Bastien Le Querrec a validé

raa_spotter.parse_raa(raa_elements, __KEYWORDS.split(','))