diff --git a/francedata/spiders/dossier.py b/francedata/spiders/dossier.py index b068ba5a6c2a4085564a510d4768e62381c2bbfb..567634912fb3391514de0a9cd3fe1db6e496293c 100644 --- a/francedata/spiders/dossier.py +++ b/francedata/spiders/dossier.py @@ -23,7 +23,10 @@ class DossierSpider(BaseSpider): ] start_urls = [ + 'http://www.assemblee-nationale.fr/12/documents/index-dossier.asp', + 'http://www.assemblee-nationale.fr/13/documents/index-dossier.asp', 'http://www.assemblee-nationale.fr/14/documents/index-dossier.asp', + 'http://www.assemblee-nationale.fr/15/documents/index-dossier.asp', 'http://www.senat.fr/dossiers-legislatifs/index-general-projets-propositions-de-lois.html' # noqa ] diff --git a/francedata/spiders/parl.py b/francedata/spiders/parl.py index f2303dbe2a93e7b32b5c0b806d9e6797dca1b6fc..71df0200f36f856ab8fdff9aec060398c940de25 100644 --- a/francedata/spiders/parl.py +++ b/francedata/spiders/parl.py @@ -14,6 +14,9 @@ class ParlSpider(CrawlSpider): ns_photo_url = 'http://www.nossenateurs.fr/senateur/photo/%s' allowed_domains = [ + "2002-2007.nosdeputes.fr", + "2007-2012.nosdeputes.fr", + "2012-2017.nosdeputes.fr", "www.nosdeputes.fr", "www.nossenateurs.fr", "api-adresse.data.gouv.fr"