'div.fr-card.fr-card--horizontal.fr-card--sm.fr-enlarge-link div.fr-card__body div.fr-card__content h2.fr-card__title a.fr-card__link',# Carte avec un élément (mois ou arrêté seul)
'ul.fr-pagination__list li a.fr-pagination__link.fr-pagination__link--next.fr-pagination__link--lg-label',# Pager
'div.fr-card.fr-card--horizontal.fr-card--sm.fr-enlarge-link div.fr-card__body div.fr-card__content div.fr-card__end p.fr-card__detail',# Détails (avec la date de publication)
self.hostname
):
date=datetime.datetime.strptime(card['details'].replace('Publié le ','').strip(),'%d/%m/%Y')
ifdate>=self.not_before:
self.page_urls_to_parse.append(card['url'])
defget_raa_elements(self,page_content):
elements=[]
# On charge le parser
soup=BeautifulSoup(page_content,'html.parser')
# On récupère chaque balise a
forainsoup.select('a.fr-link.fr-link--download'):
forainsoup.select('div.fr-downloads-group.fr-downloads-group--bordered ul li a,div a.fr-link.fr-link--download'):