Skip to content

Fix issue #10: duplicatas lors du scrapping des votes AN

La combinaison de requêtes XPath utilisée pour le scrapping des votes de l'Assemblée Nationale était incorrecte et causait l'enregistrement les mêmes votes plusieurs fois.

La raison était que, lors de itération sur les résultats de la requête sélectionnant les différents groupes, la sous-requête de résultats de chaque division (pour, contre, abstention) retournait les résultats de l'ensemble de tous les groupes, et pas seulement ceux du groupe courant. Par conséquent, chaque vote était enregistré une fois par groupe, au lieu d'une seule fois. Dans le cas d'une page avec 6 groupes, le nombre de votes était donc 6 fois trop grand !

Ce commit simplifie le scrapping en se basant sur le fait qu'il n'est pas utile de séparer les résultats par groupe (puisque cette information n'apparaît pas dans le résultat final et n'est utilisée nulle part). Une seule requête XPath est donc utilisée par division, tous groupes confondus.

fixes #10 (closed)

Merge request reports