« A voté » : à chaque bureau de vote ses électeurs

« A voté » : à chaque bureau de vote ses électeurs

Quel lien y a-t-il entre la sociologie des différents quartiers au sein d’une ville et leur vote ? Les résultats d’une élection sont analysés à différentes échelles géographiques, la plus fine étant habituellement celle de la commune. Il est ainsi classique de relier le taux de participation à une élection dans une commune au revenu de ses habitants. Mais il était jusqu’à présent compliqué d’analyser de façon précise les différences de vote pouvant exister par quartier au sein d’une commune, dans les 6 800 communes contenant plusieurs bureaux de vote.

L’Insee vient d’y remédier, en mettant à disposition les données permettant de tracer des contours géographiques pour chaque bureau de vote, sous la forme d’un fichier qui relie les adresses des électeurs (adresses anonymisées issues du Répertoire électoral unique REU) et leur bureau de vote de rattachement. L’Insee fournit également des programmes informatiques pour utiliser ces données qui permettent d’approximer des « aires » ou « contours » de bureaux de vote et de les croiser avec d’autres informations (niveau de vie, âge de la population, etc.). Couplées aux résultats électoraux mis à disposition par le ministère de l’Intérieur et des Outre-mer pour chaque bureau de vote, ces données permettent ainsi d’étudier les comportements électoraux à un niveau infra-communal.

Depuis longtemps, chercheurs et journalistes souhaitent mettre en regard les résultats des élections avec les caractéristiques sociodémographiques des électeurs à une échelle géographique infra-communale. Mais jusqu’à récemment, il n’existait pas de fichier national consolidé contenant le lien entre les adresses des électeurs et leur bureau de vote. Pour étudier la géographie du vote, il fallait recueillir les informations auprès de chaque préfecture de département (elles sont communicables dans les conditions définies par l’article L 37 du code électoral). Ces informations, aux formats très divers (fichiers textuels comportant des noms de rues, plans au format papier, etc.), étaient difficilement exploitables. Ainsi, la géographie du vote était principalement analysée au niveau communal et supra-communal, faute de pouvoir facilement obtenir des informations à l’échelle infra-communale. Le projet Cartelec, porté par une équipe de chercheurs il y a une dizaine d’années, a représenté néanmoins une initiative importante en ce sens, dans la limite des informations disponibles à l’époque.

La loi n° 2016-1048 du 1er août 2016, modifiant l’article 16 du code électoral, a créé un répertoire électoral unique et permanent (REU), tenu par l’Insee pour la gestion du processus électoral. Le REU contient, entre autres, les adresses des électeurs inscrits sur les listes électorales et leur bureau de vote. À la suite de l’avis favorable rendu par la Commission d’accès aux documents administratifs, et en concertation avec le ministère de l’Intérieur et des Outre-mer, l’Insee a développé une méthode permettant de publier certaines informations issues du REU en données ouvertes (ou open-data), tout en ne divulguant aucune information sur les noms et prénoms de personnes. Le projet a bénéficié du soutien de la Direction interministérielle du numérique (Dinum – Etalab), l’organisme public qui coordonne la politique d’ouverture et de partage des données publiques. Ce billet de blog présente la démarche que l’Insee a menée pour permettre la diffusion et l’utilisation de ces données.

Des données géolocalisées anonymisées…

Les données du REU proviennent des services des mairies lorsqu’ils valident l’inscription électorale d’un électeur. Même si l’on élimine les données de noms et prénoms des électeurs, leurs adresses peuvent contenir des éléments directement nominatifs (par exemple, des « chez M. X » pour les personnes hébergées chez un tiers). Pour « purger » les adresses de toute information directement nominative, l’Insee a remplacé les libellés d’adresses du REU par ceux de la Base d’Adresses Nationale (BAN) : seules ces adresses normalisées et anonymes sont publiées en données ouvertes. Elles sont accompagnées de la géolocalisation issue de la BAN.

Ce fichier de correspondance entre les adresses des électeurs et les bureaux de vote permet de construire le zonage d’habitation des électeurs par bureau de vote afin de le rapprocher de diverses données statistiques. Il peut manquer quelques adresses, notamment si des habitants disposent d’un autre logement dans une autre commune où ils sont inscrits sur les listes électorales, ou encore si certaines adresses n’ont pas pu être correctement retrouvées dans la BAN (leur libellé étant, par exemple, trop imprécis). Mais ces quelques manques ponctuels n’empêchent pas de construire des contours statistiquement pertinents.

… pour construire les contours des bureaux de vote…

En définitive, les utilisateurs disposent à présent d’un fichier standardisé, comprenant une liste d’adresses géolocalisées, des variables décrivant la qualité de la géolocalisation, et le bureau de vote auquel chaque adresse est rattachée (la documentation technique de constitution du fichier et les codes écrits dans le langage de programmation Python associés sont disponibles). À noter que le REU est un répertoire vivant, mis à jour en permanence : le fichier des adresses diffusé aujourd’hui a été produit à partir d’une photographie de ce répertoire en septembre 2022.

Cette base des adresses géolocalisées permet d’approcher les « aires » ou « contours » de bureaux de vote, qui correspondent à la zone géographique regroupant l’ensemble des adresses des électeurs d’un même bureau de vote.

En pratique, il existe de multiples manières d’approximer les contours de bureaux de vote, qui n’ont généralement pas de tracé formalisé. L’Insee a construit une méthode de production automatisée de ces contours à partir des adresses géolocalisées du REU via la BAN, reposant sur les polygones de Voronoï, pour aider à réaliser des études statistiques. Un polygone de Voronoï est une zone géométrique délimitée autour d’une adresse géolocalisée, qui contient tous les points de l’espace qui sont plus proches de cette adresse que de toute autre adresse géolocalisée (figure 1). Dans un premier temps, les polygones de Voronoï permettent ainsi de créer une partition des communes étudiées. Dans un second temps, le regroupement de ces polygones par bureau de vote permet de constituer une approximation des contours des bureaux de vote.

Figure 1 – Exemple de polygones de Voronoï (traits fins) pour une distribution de points

Exemple de polygones de Voronoï (traits fins) pour une distribution de points
Sources : Insee REU, Filosofi 2019 ; Mairie de Strasbourg.

Cette méthode est mise à disposition via la publication d’un programme informatique en langage R dans une librairie nommée MapvotR, en libre accès sur la plateforme de diffusion des codes de l’Insee. Les hypothèses et techniques utilisées y sont explicitées de façon totalement transparente (en particulier la manière de repérer et traiter les adresses probablement mal positionnées). L’utilisateur est libre d’améliorer et d’adapter le code à son cas d’utilisation, il peut aussi y suggérer des corrections si nécessaire.

À noter que la Direction interministérielle du numérique (Dinum) propose également un outil informatique, écrit en Python et complémentaire de MapvotR, pour exploiter la base de donnée des adresses diffusée par l’Insee.

Certaines communes publient déjà les contours de leurs bureaux de vote, ce qui permet de comparer leur découpage communal avec celui produit par MapvotR. Sur l’exemple de Strasbourg (figure 2), les approximations réalisées par l’Insee épousent globalement bien les contours publiés par la mairie dans les zones denses du centre-ville (même si elles sont visuellement moins harmonieuses, car elles ne sont pas découpées à partir des lignes de la voirie). Il est néanmoins possible d’observer des différences (un exemple est visible au nord-est de la carte de Strasbourg, dans la grande zone industrielle autour du port fluvial), mais celles-ci sont essentiellement situées dans des zones très peu denses, où la position géographique d’un petit nombre de ménages peut grandement influencer l’emprise du contour. Par conséquent, même quand l’emprise des zonages diverge, les contours regroupent des populations très similaires, et donc des agrégats sociodémographiques proches. À titre d’exemple, la figure 3 permet d’observer le revenu médian calculé sur les contours de la mairie de Strasbourg et sur les contours approximés par MapvotR : les différences sont en général très faibles.

Figure 2 – Contours des bureaux de vote à Strasbourg selon la mairie (en haut) et approximés à partir des adresses du REU (en bas)

Contours des bureaux de vote à Strasbourg selon la mairie (en haut) et approximés à partir des adresses du REU (en bas)
Sources : Insee, REU ; Mairie de Strasbourg.

Figure 3 – Les contours approximés de Strasbourg contiennent des populations aux revenus médians très similaires aux contours diffusés par la mairie

Les contours approximés de Strasbourg contiennent des populations aux revenus médians très similaires aux contours diffusés par la mairie
Sources : Insee REU, Filosofi 2019 ; Mairie de Strasbourg.

… et habiller ensuite ces « contours » de données, pour éclairer le débat public

Une fois les contours de bureaux de vote définis, il devient possible de caractériser la population résidente et de mettre en regard son comportement de vote.

L’Insee fournit plusieurs sources de données permettant d’obtenir des informations socio-démographiques des populations à l’échelle infra-communale. Parmi elles, le dispositif sur les revenus localisés sociaux et fiscaux (Filosofi) contient des informations agrégées sur le revenu déclaré, le revenu disponible des ménages, et la pauvreté monétaire à l’iris et pour les quartiers prioritaires de la politique de la ville. Aux mêmes niveaux géographiques, le recensement de la population fournit des statistiques sur les caractéristiques des habitants (répartition par sexe, âge, profession, nationalité, mode de transport pour aller travailler, etc.) et de leur logement (type de logement, type de construction, nombre de pièces, etc.). En plus des données à l’iris et au quartier, Filosofi est consultable sous forme de données carroyées. Les données individuelles ne sont évidemment pas mises à disposition de tous pour des raisons de respect de la confidentialité, mais elles peuvent être accessibles (sans les patronymes) aux chercheurs qui en font la demande via le Centre d’accès sécurisé des données et après avis du Comité du secret statistique. De nombreuses autres sources peuvent aussi être mobilisées pour caractériser les contours de bureau de vote, telles que le fichier des allocataires des caisses d’allocations familiales ou celui des inscrits à Pôle emploi par exemple.

Ces caractéristiques des électeurs à l’échelle des contours de bureaux de vote peuvent alors être mises en regard des résultats électoraux fournis par le ministère de l’Intérieur et des Outre-mer et disponibles en données ouvertes sur data.gouv.fr. Ces résultats portent sur les différentes élections (présidentielles, législatives, etc.) et sont souvent ventilés par bureaux de vote. Pour les élections présidentielles, elles contiennent pour chaque tour les résultats des différents candidats, le taux de participation, les votes blancs et nuls.

Ainsi, les données et les programmes MapvotR mis à disposition par l’Insee simplifient l’étude du comportement électoral en fonction des caractéristiques des populations et des quartiers. Par exemple, on peut analyser la relation entre l’âge moyen des populations et les résultats d’un candidat ou d’un groupe de candidats aux élections présidentielles toutes choses égales par ailleurs (en contrôlant des effets liés aux revenus des habitants, à l’agglomération, etc.), la relation entre le niveau de vie de la population et la participation aux élections, l’existence (ou non) de traditions politiques locales indépendantes des caractéristiques socio-démographiques actuelles des populations, etc.

Par ailleurs, l’utilisateur dispose d’un nombre beaucoup plus grand d’observations à l’échelle des bureaux de vote qu’il n’en disposait à l’échelle communale. Les résultats économétriques sont donc nettement plus robustes.

Un exemple : l’étude de la participation électorale en fonction du revenu

Prenons l’exemple du taux de participation au premier tour de l’élection présidentielle de 2022, en regard du niveau de vie médian en 2019 dans les 25 plus grandes communes françaises. La figure 4b, disponible à l’échelle des bureaux de vote, confirme la relation forte entre niveau de vie et taux de participation au sein des villes étudiées. Chaque point sur la figure représente un bureau de vote : en général, plus le niveau de vie médian du contour du bureau de vote est élevé, plus les électeurs inscrits sur ce bureau se sont déplacés pour voter. Ce phénomène est moins visible à l’échelle communale du fait du faible nombre de points : chaque point représente ici une commune (figure 4a). Cette relation croissante entre niveau de vie et taux de participation, avec un plateau autour de 80 % de participation, se retrouve dans chacune des 25 villes étudiées (figure 5). De nouveaux territoires à explorer s’ouvrent donc pour la sociologie électorale.

Figure 4 – Une forte corrélation entre niveau de vie et taux de participation électorale

Une forte corrélation entre niveau de vie et taux de participation électorale
Sources : Insee REU, Filosofi 2019 ; ministère de l’Intérieur.

Figure 5 – Un lien de corrélation semblable au sein de l’ensemble des communes étudiées

Un lien de corrélation semblable au sein de l’ensemble des communes étudiées
Note : chaque courbe correspond, pour une commune donnée, à la tendance de la relation entre le taux de participation et le niveau de vie médian observée à l’échelle des bureaux de votes.
Sources : Insee REU, Filosofi 2019 ; ministère de l’Intérieur.

Pour en savoir plus

Crédits photo : © Chlorophylle – stock.adobe.com

Plus d'articles

Impacts économiques et sociaux des Jeux Olympiques et Paralympiques : à vos stats, prêts, partez !

Impacts économiques et sociaux des Jeux Olympiques et Paralympiques : à vos stats, prêts, partez !

Utiliser les données bancaires pour disposer d’instantanés sur la situation financière des ménages

Utiliser les données bancaires pour disposer d’instantanés sur la situation financière des ménages

La consommation alimentaire diminue : oui mais de combien ?

La consommation alimentaire diminue : oui mais de combien ?

Regarder la croissance sous l’angle du PIB ressenti rebat les hiérarchies économiques internationales

Regarder la croissance sous l’angle du PIB ressenti rebat les hiérarchies économiques internationales

8 minutes

Partager

Auteurs/Autrices