cipherbliss_blog
Jeux de données publiés sur DataGouv
C'est difficile de publier des données ?
Pour tester la difficulté de la mise en place de publication de données par les administrations qui manquent 99 fois sur 100 à remplir leurs obligations en matière de publication de données (merci la CADA), j'ai voulu tester moi même. Hé bien c'est vraiment pas compliqué, on a même pas besoin d'avoir de folles compétences informatiques. On crée son compte, on crée un jeu de données, et dans ces jeux de données on dépose des fichiers en décrivant ce que c'est. Et pour les mettre à jour on modifie un fichier et on valide. Et voilà. C'est vraiment pas sorcier, pas plus que de savoir envoyer un email. Hé oui Jammy.
Y'a même des guides et des formations disponibles. https://www.data.gouv.fr/pages/onboarding/producteurs
Souvent cela consiste à partager des infos que l'on a déjà sous forme de tableur, de comptes rendus écrits, ou des photos. C'est ainsi que des municipalités de communes de moins de 300 habitants parviennent à libérer des tas d'infos toutes simples et très utiles à la vie des administrés. Sans oublier que la publication de données publique doit être la base, sans avoir besoin que des gens le réclament, dans un format facilement lisible par des logiciels, dans des standards ouverts, et de façon systématique. Vous pourrez en savoir plus via le forum Team Open Data: https://teamopendata.org ou en consultant la loi Lemaire de 2016, effective depuis bientôt 10 ans à la date où j'écris ces lignes. Détail important, les organismes obligés de publier les données ne doivent pas attendre que les données "présentent bien" ou "soient retravaillées". Beaucoup de gens ne peuvent pas travailler correctement à cause de ce genre de comportement irresponsable.
Ce que je publie
Voici quelques jeux de données issus d'OpenStreetMap publiés sur DataGouv au nom de l'organisation CipherBliss: https://www.data.gouv.fr/fr/organizations/cipherbliss-ei/#/datasets
On y trouve donc plusieurs jeux de données qui sont de simples extractions à l'échelle nationale depuis OpenStreetMap en utilisant Overpass Turbo. Mais aussi des données que je me suis amusé à remplir à partir d'informations librement récupérées sur le wouaibe, et reconstitués à la mano par bibi en ayant parfois un coup de main d'autres généreux bénévoles. Comme par exemple ce jeu de données qui réunit les conférences State Of The Map de 2013 à 2024.
Ou encore la liste des fanzines que l'on pouvait trouver sur le site de Meluzine.org, dont j'avais fait la bibliothèque en ligne et une représentation graphique des liens entre ceux ci il y a quelques années.
- https://www.cipherbliss.com/2016/la-galaxie-des-fanzines
- https://www.cipherbliss.com/2017/statistiques-sur-les-fanzines-references-par-meluzine
- https://www.data.gouv.fr/fr/datasets/fanzines-repertories-par-lassociation-meluzine-org
J'ai pu scripter l'extraction de données depuis overpass turbo et leur conversion en format geojson dans ce dépot: https://forge.chapril.org/tykayn/mapping-geojson-osm
Par exemple pour l'extraction des ponts c'est ce script ci: https://forge.chapril.org/tykayn/mapping-geojson-osm/src/branch/main/mappings/extractors/ponts.sh
Les jeux de données:
Le premier lien mène à la page décrivant le jeu de données pour chacun des ensembles, puis vous avez en détail les différents fichiers en téléchargement direct.
Exports d'OpenStreetMap
- Ponts de France ayant un nom https://www.data.gouv.fr/fr/datasets/base-ouverte-des-ponts-de-france
- Caméras de surveillance de France https://www.data.gouv.fr/fr/datasets/cameras-de-surveillance-en-france
- Parking pour vélo cargo de France https://www.data.gouv.fr/fr/datasets/parking-velo-cargo-de-france-extraction-osm
- Hackerspaces https://www.data.gouv.fr/fr/datasets/hackerspaces-de-france
- Planing familiaux de France https://www.data.gouv.fr/fr/datasets/liste-des-planning-familiaux-francais
- Toilettes publiques de France https://www.data.gouv.fr/fr/datasets/toilettes-publiques-de-france
- Espaces de coworking de France https://www.data.gouv.fr/fr/datasets/espaces-de-coworking-de-france-depuis-openstreetmap
- Musées de France https://www.data.gouv.fr/fr/datasets/musees-de-france
Actions féministes
- Lieux participant à Ask Angela dans le monde https://www.data.gouv.fr/fr/datasets/lieux-ask-angela-dans-le-monde
- Médecins féministes GynAndCo https://www.data.gouv.fr/fr/datasets/medecins-feministes-de-gynandco
OSM France
- Conférences State Of The Map France depuis 2013 https://www.data.gouv.fr/fr/datasets/conferences-dopenstreetmap-france-sotm-et-ca-openstreetmap-france
Fanzinat
- Fanzines répertoriés par l'association Méluzine https://www.data.gouv.fr/fr/datasets/fanzines-repertories-par-lassociation-meluzine-org
- catégories de fanzines, csv
- séries de festival, csv
- agenda des évènements publiés,csv
- partenaires, csv
- liens entre volume de fanzine (numéros dans une série) et catégories
- jours de festival, csv
- contenus de volume de fanzine, csv
- format de support papier ou numérique, csv
- liste de fichiers à télécharger, csv
- liste des organisations de fanzines, csv
- liste des catégories de fanzines, csv
License
Précisez la license dans vos jeux de données, l'Odbl permet une réutilisation vertueuse afin que les données continuent de circuler librement.
Un guide pratique de la fédé des pros est sorti sur le sujet https://fposm.fr/publication-du-guide-pratique-tout-savoir-sur-la-licence-odbl Télécharger le PDF
Vous aussi, publiez vos jeux de données et des réutilisations, go go opendata!