Skip to content
Extraits de code Groupes Projets

Jura

Tous les fils de conversation ont été résolus !
Fermé ketsapiwiq requested to merge ketsapiwiq/Attrap:jura into main
Tous les fils de conversation ont été résolus !
1 fichier
+ 5
6
Comparer les modifications
  • Côte à côte
  • En ligne
+ 5
6
@@ -77,9 +77,9 @@ class Attrap_pref39(Attrap):
# On charge le parser
soup = BeautifulSoup(page_content, "html.parser")
# On récupère chaque balise a
for a in soup.select("a.fr-card__link"):
# On récupère chaque block de card
for block in soup.select(".fr-card__content"):
a = block.select("a.fr-card__link")[0]
if a.get("href") and a["href"].endswith(".pdf"):
if a["href"].startswith("/"):
url = f"{self.__HOST}{a['href']}"
@@ -89,9 +89,8 @@ class Attrap_pref39(Attrap):
url = unquote(url)
name = a.get_text().strip()
date_str = soup.select("p.fr-card__detail").get_text().replace("Publié le ", "")
print(date_str)
date = datetime.datetime.strptime(date_str, "%Y-%m-0%d")
date_str = block.select("p.fr-card__detail")[0].get_text().replace("Publié le ", "")
date = datetime.datetime.strptime(date_str, "%d/%m/%Y")
raa = Attrap.RAA(url, date, name)
elements.append(raa)
Chargement en cours