L’oeil du cartographe
De la valorisation du carroyage de L’INSEE
En 2013, l’Institut national de la statistique et des études économiques français (INSEE) a vécu une petite révolution en publiant des données issues des déclarations fiscales sur une maille de carreaux. Il fournit ainsi un matériau de premier choix pour l’observation géographique. Pour le cartographe, ce carroyage est l’opportunité de représenter l’espace social de manière innovante, mais aussi de ressusciter des modes de valorisation oubliés.
Le 23 janvier 2013, l’INSEE met en ligne un grand nombre de variables à une échelle plus fine que la commune, le quartier « Iris ». Il s’agit d’une maille régulière composée de carreaux de 200 mètres par 200 mètres, que l’on désigne par « carroyage ». Nous disposons de données sur les ménages (composition, logement, revenus…) et les individus (âge essentiellement). L’intérêt de ce produit pour l’observation locale des territoires est considérable : une information démographique et sociale à l’échelle de l’équivalent d’un pâté de maison et affranchie des limites administratives et empiriques.
UNE OUVERTURE EN DEUX TEMPS
Une information aussi détaillée apporte son lot d’appréhension. Quid du respect de la vie privée et du droit à la non-diffusion des données personnelles, surtout quand elles touchent à un sujet aussi sensible que l’argent ? L’INSEE assure ne publier aucune information si le carreau compte moins de 11 ménages. Or, pas du tout. Les vérifications nécessaires avant diffusion ont été négligées : le seuillage n’a pas eu lieu. Ainsi, on peut avoir le revenu médian des ménages d’un carreau qui ne contient… qu’une seule famille. Ce qui revient donc à connaître les revenus que ce même ménage a déclarés aux impôts. Ce qui aurait pu devenir l’outil miraculeux du marketing et du data mining disparaît. À l’automne 2013, l’institut accouche d’une nouvelle version. Alors qu’il suffisait d’intégrer le précédent carroyage à n’importe quel logiciel de système d’information géographique (SIG) et de consulter chaque carreau pour accéder aux variables, le nouveau nécessite d’avoir une certaine connaissance du SIG pour recomposer l’information. Dorénavant, nous disposons de deux carroyages : le premier, toujours formé de carreaux de 200 mètres par 200, ne contient plus comme variable que le nombre d’habitants. Le second est composé de rectangles aux dimensions plus ou moins lâches selon la densité de la zone, c’est celui-ci qui contient les données « sensibles ». En effectuant une opération de pondération de ces données par la population localisée sur les carreaux du premier carroyage, l’utilisateur obtient les variables désirées et, par là même, l’entière responsabilité de leur constitution : première mesure de floutage de l’information. La variable la plus sensible, le revenu fiscal par unité de consommation médian des ménages, a été
remplacé par une « somme des revenus fiscaux par unité de consommation winsorisés des individus », qu’il convient de diviser par le nombre d’individus d’un rectangle : seconde mesure de floutage. L’INSEE parvient à réaliser une pirouette consistant à ouvrir à un large public une information floue et difficile à comprendre. Le cartographe n’est a priori pas l’expert qui se formalisera le plus sur cette perte de précision. À défaut de donner une mesure exacte, le chiffre obtenu ne remet pas en question l’indication qu’il apporte sur un phénomène sociospatial, déconnecté ou non de ses carreaux voisins, et n’empêchera pas non plus de travailler sur des corrélations avec d’autres indicateurs. Une information plus fine n’a pas et ne doit pas avoir pour corollaire une information plus exacte.
SÉMIOLOGIE GRAPHIQUE
Ce carroyage offre aux spécialistes et aux amateurs de la valorisation de l’information géographique de nombreuses possibilités, notamment en matière graphique. Habituellement traité en aplat, un carroyage donne l’image d’un champ de pixels avec une plus ou moins grande visibilité, souvent rectifiée par l’effet d’un traitement en lissage donnant un effet « tache d’huile », joli et dans l’ensemble assez instructif, mais la rupture avec une information fine est cette fois consommée. Nous souhaiterions tout de même conserver une information qualitative et quantitative. En puisant notre inspiration dans les principes fondamentaux de la sémiologie graphique, nous opterons pour la traditionnelle représentation des valeurs absolues par une forme proportionnelle (un cercle le plus souvent). Or cette maille de cercles de tailles variées ressuscite d’une certaine manière les cartes en « semis régulier de cercles croissants » chères à Jacques Bertin (1918-2010) (CF. CARTE 1). Cette valorisation, au départ peu fréquente, car compliquée à mettre en oeuvre et à automatiser et, par la suite, jetée aux oubliettes par les logiciels spécialisés, n’en reste pas moins intéressante. Certes, la particularité de ce type de représentation résidait dans la génération d’un semis régulier de symboles pour chaque unité géographique de la carte. Ce que ne permet pas le carroyage, car il s’affranchit de tout zonage. Il permet en revanche de comparer visuellement des microzones (CF. CARTE 4). Le relief, le contraste monochrome qu’il propose n’est pas sans évoquer les trames ponctuelles utilisées dans la sérigraphie et l’imprimerie. Maintenant que la technologie permet de nous affranchir des problèmes d’automatisation, nous pouvons ajouter une dimension qualitative à cette représentation, une valeur relative (la part des ménages dont les revenus sont inférieurs ou égaux au seuil de pauvreté, par exemple, CF. CARTE 3) ou la classe d’une typologie (CF. CARTE 2), en agissant sur le remplissage des cercles. La secrétisation est visuelle de fait : si la variable est trop faible (nombre de ménages par exemple), la taille du cercle rend la donnée illisible. L’information est claire, comparable et quantifiable.