Les freins à l’exploitation de l’open data : l’exemple du logement social

juin 2021

Transparence, évaluation des politiques publiques, moteur d’innovation … Les bienfaits de l’ouverture des données sont établis. Pourtant, parfois, réutiliser les données est ardu et l’on peine à les qualifier d’ « ouvertes ».
Spallian et Datactivist ont enquêté sur l’open data des demandes de logements sociaux : comment révéler leur plein potentiel ?

DÉCOUVRIR L’ARTICLE COMPLET

Une obligation légale

Depuis la loi Lemaire parue en 2016, l’administration française est tenue de mettre à disposition du public un certain nombre de données. Ministères, collectivités territoriales, établissements publics… se doivent de publier leurs données dont la publication présente un intérêt économique, social, sanitaire ou environnemental.
2 millions : c’est le nombre de demandes de logements sociaux en cours au début de l’année 2020.
Le Groupement d’Intérêt Public en charge du Système National d’Enregistrement est appelé GIP SNE. Il publie ces données statistiques sur la plateforme data.logement.gouv.fr et participe ainsi à la production d’open data.

De multiples réutilisations possibles…

L’open data du GIP SNE constituent un puissant outil de diagnostic du marché de l’habitat social pour les collectivités territoriales et les bailleurs sociaux. Nous avons identifié 3 réutilisations majeures :

1- Cartographier les demandes de logement social

Projeter les demandes de logements par commune introduit une dimension spatiale à notre analyse et permet d’identifier les zones prioritaires dans lesquelles construire des logements.

2- Évaluer l’offre à l’aune de la demande, par croisement de jeux ouverts

Projeter les logements sociaux existants (ou seulement les logements vacants) par-dessus les données sur la demande ouvre des possibilités d’analyse plus poussées. La superposition de ces informations nous permet de confronter l’offre et la demande du logement social.

3- Illustrer les données pour les analyser et arbitrer

Les statistiques des demandes de logement social présentent l’avantage d’être particulièrement bien détaillées. Une distinction des demandes est opérée selon leurs caractéristiques (l’ancienneté de la demande, l’âge du demandeur ou encore les revenus de son ménage…). Ainsi les bailleurs sociaux peuvent construire des logements en adéquation avec la demande locale.

…mais une exploitation (très) complexe

La manière dont les données sont fournies par le GIP SNE n’est pas propice à leur réutilisation, et il est très difficile de réaliser les visualisations que nous venons de présenter.
Les trois principaux freins à la réutilisation des données SNE que nous avons identifiés sont les suivants :

1- Une interface complexe, beaucoup de fichiers

« Plus de 5000 jeux de données sont téléchargeables au travers du moteur de recherche ».
Le GIP SNE a fait le choix de créer une interface web permettant à l’utilisateur de télécharger des rapports ciblés. Mais le portail pousse un peu trop loin les possibilités de tri, il est finalement compliqué de trouver ce que l’on cherche. Cette première barrière exclut les non experts de la donnée.

2- Une structure de fichier inadaptée aux machines

Si la structure des rapports a été pensée pour être facilement lisible par un humain, avec des titres, des sauts de colonnes, des fusions de cellules, etc. , celle-ci empêche leur exploitation par un ordinateur.

3- Pas de code géographique, pas de croisement !

Il demeure une barrière pour pouvoir réutiliser les données, et non des moindres : l’absence de codes géographiques, pourtant nécessaires pour croiser des jeux de données à des data territoriales. Un croisement manuel des données, commune par commune, est chronophage et limite fortement les usages.

Nos suggestions

A l’heure actuelle, les données SNE ne peuvent pas être considérées comme de l’Open Data. En effet, l’un des critères pour pouvoir considérer une donnée comme ouverte est son caractère réutilisable.
Mais quelques modifications permettraient de révéler le potentiel de ces données.
– Proposer des fichiers CSV regroupant l’ensemble des données brutes sur les demandes de logement social,
– Rajouter le code officiel géographique de chaque territoire dans ces fichiers,
Documenter les données.

Ce faisant, le GIP SNE donnerait aux acteurs du logement un outil puissant pour mieux loger la population française, et aux citoyens un gage de transparence sur l’accès aux logements sociaux.

Ces dashboards peuvent
vous intéresser

Carte récapitulative des destinations

Quelle est votre destination de vacances idéale ?

22 juillet 2021

Le conseil municipal est l’organe politique le plus proche des citoyens français. Il est constitué d’élus municipaux dont le rôle est crucial, et pour lesquels on s’attend qu’ils soient le reflet de la population qu’ils représentent…à commencer par le sexe.

Découvrir

Offre de soins par commune

Décortiquez les inégalités territoriales [dataviz]

8 janvier 2021

Le conseil municipal est l’organe politique le plus proche des citoyens français. Il est constitué d’élus municipaux dont le rôle est crucial, et pour lesquels on s’attend qu’ils soient le reflet de la population qu’ils représentent…à commencer par le sexe.

Découvrir