Scénario "ministre et membres du gouvernement"
@manolesc nous avons légèrement changé le fusil d'épaule avec @nbarret sur le sujet en passant des députés (577 personnes) aux ministres et autres membres du gouvernement (41 personnes) afin de nous faciliter le repérage de choses à présenter lors de la démo.
Ci-après voici tous les éléments relatifs aux sources et traitement qui ont été opérés :
• Les ministres et membres du gouvernement :
Source des données -> https://www.gouvernement.fr/composition-du-gouvernement.
Source SpreadSheet qui a généré le csv "Ministre_gouv_2023" avec la liste des membres du gouvernement -> https://docs.google.com/spreadsheets/d/1Nr6Gr2Gm8SF4GchbLE1UZi3Q1f9GDaGOG8SBlraoul8/edit?hl=fr#gid=0
Télécharger les fichiers : Ministre_gouv_2023.csvministre_gouv_2023.json
• Les déclarations auprès de la HATVP des ministres et membres du gouvernement :
Origine des 82 fichiers avec les déclarations (41 d'intérêt et 41 de patrimoine) au format XML des membres du gouvernement. À chaque fois j'ai cliqué sur la fiche du membre du gouvernement puis sur le lien "Déclaration d’intérêts : Consulter la déclaration sur le site de la Haute autorité pour la transparence de la vie publique" et de cette nouvelle page j'ai téléchargé au format XML.
Exemple pour Elisabeth Borne :
Lien 1 : https://www.gouvernement.fr/composition-du-gouvernement
Lien 2 : https://www.gouvernement.fr/personnalite/elisabeth-borne?mission=premiere-ministre
Lien 3 : https://www.hatvp.fr/fiche-nominative/?declarant=borne-elisabeth
Puis j'ai téléchargé la déclaration "intérêts" (indicateur "di" dans le nom du fichier xml ex : di22412 pour Elisabeth Borne) et "patrimoine" (indicateur "dsp" dans le nom du fichier xml ex : dsp22413 pour Elisabeth Borne)
Télécharger les fichiers : ministre_decla_xml.zip
Version agglomérée: tout.xml
Version agglomérée avec tags nom
et prenom
en un seul tag nom
: tout2.xml
• Les entreprises du SBF 120 (le SBF 120 est un indice boursier de la bourse de Paris tout comme le CAC 40) :
Source initiale : https://www.egalite-femmes-hommes.gouv.fr/sites/efh/files/migration/2021/10/6.-Annexe-5_Details_Palmares_2020.pdf (PDF également en PJ)
Pre-processing: passé par Tabula (https://tabula.technology/) pour convertir le PDF (qui contient un unique tableau) en JSON (JSON-data). Ensuite, filtré pour ne garder que les colonnes "rang" et "société".
Télécharger les fichiers : SBF_120.csv SBF_120.json 6.-Annexe-5_Details_Palmares_2020.pdf
• Les entreprises du CAC 40 :
Source initiale du Cac 40 -> https://live.euronext.com/fr/product/indices/FR0003500008-XPAR/market-information#index-composition
Source SpreadSheet qui a généré le csv "CAC_40.csv" qui est ensuite convertit en JSON grâce au cide python du notebook Google Collab avec la liste des entreprises coté en bourse sous cet indice : https://docs.google.com/spreadsheets/d/17xwvac7FMe-OeD2v4M_LEab9HEW4kCP603lovAYZlB0/edit?usp=sharing
Télécharger les fichiers : Cac_40.csv CAC_40.json
Lien vers le collab qui transforme les csv en JSON -> https://colab.research.google.com/drive/1RAwD8Ox8ctRqF04TzG3SC2j2uuwaAERm#scrollTo=3eU-ryuPgq7G
Le lien vers l'ébauche de présentation du use-case pour le 4 mai est dans l'issue correspondante.