20 Minutes

Le big data, faux concurrent des sondages

L’analyse des opinions sur le Web ne remplace pas les sondages

- Laure Beaudonnet

Personne n’avait vraiment vu venir Donald Trump à la MaisonBlan­che, ni François Fillon au premier tour de la primaire de la droite et du centre. Le big data, si. Les sondages semblent moins performant­s depuis le Brexit, et l’opinion, de plus en plus volatile, est difficile à saisir. Qui dit big data, dit flot des données – tweets, commentair­es, articles… – qui inondent le Web en continu. Filteris, basée au Canada, ou Linkfluenc­e, en France, ont toutes les deux développé une technologi­e : des algorithme­s qui collectent et classent ces contenus publics en temps réel. Filteris analyse ensuite de quelle personnali­té parlent les commentair­es et s’ils sont positifs ou négatifs. Et les résultats sont publiés brut, sans être réajustés. « L’élection de Donald Trump, on l’a annoncée un mois avant, se vante Jérôme Coutard, le président de Filteris. Son poids numérique était supérieur à celui de Hillary Clinton. On peut être élu parce qu’on est plus visible sur le Web quand bien même on nous critiquera­it. »

Que mesure-t-on ?

« Les résultats de la présidenti­elle ne sont écrits nulle part sur Internet, explique Guilhem Fouetillou, cofondateu­r de Linkfluenc­e, beaucoup moins affirmatif que son confrère canadien. On peut croiser les data dans tous les sens, tout dépend de ce qu’on mesure. » Le big data ne donne pas les intentions de vote, mais des tendances. Dire que les sondages ne voient plus rien, c’est faux. « Ils ont vu François Hollande en 2012, Nicolas Sarkozy en 2007. Aux Etats-Unis, si on s’en tenait au vote populaire, Hillary Clinton gagnait en voix », souligne Bruno Cautrès, directeur de recherche du CNRS au Cevipof. La candidate démocrate a remporté deux millions de voix de plus que son rival. Certes, les sondages ont de plus en plus de mal à faire des photograph­ies de l’opinion à un temps T et ils reposent sur du déclaratif, leur principale faiblesse. Mais de leur côté, « les algorithme­s produisent leurs propres marges d’erreur. Ils ne comprennen­t pas tout », avertit Guilhem Fouetillou. Ils peinent à détecter l’ironie, le double sens. Et surtout, ils n’ont pas accès à l’ensemble de la population de manière représenta­tive. « Sur Twitter, on aura les moins de 35 ans, mais pas les autres », note David Chavalaria­s, directeur de recherche au CNRS au Centre d’analyses de mathématiq­ues sociales. « Il va falloir intégrer le big data aux sondages », analyse Jérôme Coutard. Les instituts s’y mettent doucement. Loin de mettre une claque aux enquêtes d’opinion, le big data crée une rupture. Mais, pour savoir qui passe au second tour, il va falloir attendre le 23 avril…

 ??  ?? ##JEL#37-66-http://bit.ly/2oG1u67##JEL# Les algorithme­s montrent des tendances et non des intentions de vote.
##JEL#37-66-http://bit.ly/2oG1u67##JEL# Les algorithme­s montrent des tendances et non des intentions de vote.

Newspapers in French

Newspapers from France