LES MÉGADONNÉES EN ACTION
LES FERMES À TRAVERS LE TEMPS
Grâce aux données des recensements canadiens (depuis 1871), d’extraits de journaux et d’autres sources, Joshua MacFadyen, professeur à l’Université de l’Île-du-Prince-Édouard, et son équipe du laboratoire GeoREACH ont élaboré 2 500 profils de fermes en Ontario, au Québec et dans les provinces maritimes. En les rassemblant sur une carte géographique, le projet permet d’avoir une vue d’ensemble de l’évolution de ces fermes et de mieux comprendre les différents enjeux agricoles à travers les époques.
Quelques profils de fermes ont déjà été publiés. Pour les créer, le professeur et ses collègues ont réuni les données relatives à la production de chaque établissement en matière d’animaux, de pâturages, de récolte de céréales ou de légumes au fil des décennies pour ensuite brosser des tableaux de la production de chaque ferme. Un travail fastidieux et exigeant qui aurait été impossible à accomplir au moyen de méthodes classiques. Aujourd’hui, le projet permet de saisir la transformation des exploitations agricoles dans ces provinces. « Nous avons analysé ces mégadonnées pour leur donner un visage humain », mentionne Joshua MacFadyen. Ainsi, il sera possible de savoir ce que c’était de vivre dans une ferme cultivant des pommes au Québec dans les années 1970 ou dans une exploitation fournissant du bois pour les bateaux à vapeur près du lac Ontario.
INNOVATION : DES SITES WEB BAVARDS
Même si nous tentons de mesurer l’innovation des entreprises depuis des décennies, l’exercice s’est toujours avéré périlleux. La collecte d’informations est difficile et les données gouvernementales datent souvent de quelques années.
Il y a cependant un endroit où les renseignements sur les compagnies sont accessibles et constamment mis à jour : leurs sites Web. Catherine Beaudry, professeure au Département de mathématiques et de génie industriel de Polytechnique Montréal, a parié que ces sites pouvaient nous aider à mieux comprendre la forme que prend l’innovation dans les entreprises. En comparant les informations obtenues grâce à l’analyse des données massives avec celles provenant de méthodes plus classiques, la chercheuse s’est aperçue que les nouveaux outils sont prometteurs.
Ce que l’équipe tentait de valider, c’était de savoir s’il y avait une différence notable entre l’information obtenue au moyen des sites Web et celle recueillie par les méthodes de collecte traditionnelles. « Et ce qu’on démontre, c’est qu’il n’y en a pas, indique Catherine Beaudry. À la limite, [ce qu’on tire des sites] pourrait être substitué aux questionnaires qu’on utilise normalement. » Une technique qui, proprement appliquée, pourrait permettre aux chercheurs de gagner énormément de temps. L’étude pilote montre que le recours aux sites Web pourrait améliorer la gestion des mesures pro-innovation. « Si l’on a des données en temps réel qui sont correctement validées par les séries temporelles [une suite de valeurs numériques, utilisées en statistique, pour étudier des variables à travers le temps] que l’on connaît, on sera capable d’offrir des indicateurs aux décideurs et aux gouvernements pour leur dire si un programme ne semble pas avoir l’effet désiré ou, au contraire, s’il faut investir davantage dans un autre qui fonctionne rondement », illustre-t-elle.
COMPRENDRE LES SOUS-CULTURES DU JEU VIDÉO
Les joueurs de jeux vidéos en ligne n’achètent pas qu’un divertissement. Bien souvent, ils cherchent également une communauté. Ces cultures ont des normes, des valeurs et des manières de les communiquer.
Avec son équipe, Maude Bonenfant, professeure à l’Université du Québec à Montréal et titulaire de la Chaire de recherche du Canada sur les communautés de joueurs et les données massives, s’intéresse à ces groupes afin de mieux comprendre leur naissance, leur évolution et leur déclin. Grâce à un croisement de méthodes traditionnelles et d’analyses de mégadonnées, il lui est possible de comprendre comment ces collectivités se bâtissent dans le jeu, mais aussi en dehors de celui-ci sur différents réseaux sociaux.
La chercheuse s’intéresse notamment aux conduites toxiques adoptées parfois dans ces communautés. Celles-ci sont définies comme des actes dans le jeu qui ont pour but de nuire au plaisir des autres joueurs. Souvent, la personne qui agit ainsi y trouve le sien.
En utilisant un logiciel d’analyse textuelle pour catégoriser les commentaires, Maude Bonenfant et ses collaborateurs ont pu observer de quoi parlent les joueurs et ce qu’ils considèrent comme toxique. Grâce à différents traqueurs mis en place par les studios de jeu vidéo, l’équipe a ensuite voulu voir si ces échos s’actualisaient dans les comportements pendant le jeu (les cas où ces agissements ont été relevés, dans quel genre de partie, avec quel type de joueurs, etc.). Cela a permis aux chercheurs de nuancer la réalité entre ce qui se dit sur les réseaux sociaux et ce qui se fait en jouant. Ils ont aussi évalué si certaines mécaniques de jeu favorisent cette toxicité et comment leur modification pourrait amener une diminution de ces agissements.
Si cette recherche porte sur les jeux vidéos, Maude Bonenfant, elle, a un intérêt pour toutes les plateformes de communication en ligne. Elle croit que ses travaux pourraient s’appliquer ailleurs. « On peut se poser la question à savoir si, dans Twitter ou dans Facebook, il y a des éléments qu’on pourrait enlever ou ajouter qui viendraient réduire la toxicité des échanges qui s’y déroulent », indique-t-elle.
RÉACTUALISER UN AUTEUR DU 19e SIÈCLE
Leigh Hunt est une figure importante de la littérature britannique, aujourd’hui tombée dans un relatif oubli. Influent à son époque, il a fréquenté et publié de nombreux intellectuels marquants du 19e siècle. C’est aussi quelqu’un qui a beaucoup, beaucoup écrit. Des poèmes et des nouvelles, mais surtout des critiques littéraires, des essais et des articles de journaux. Cette impressionnante bibliographie impose des limites aux chercheurs qui s’y intéressent, ne serait-ce que par leur incapacité, bien humaine, de tout lire et de tout retenir.
Le professeur d’anglais de l’Université de Montréal Michael Eberle Sinatra et ses étudiants ont donc entrepris de créer le corpus de Leigh Hunt en ligne afin de pouvoir, avec des chercheurs d’ailleurs dans le monde, utiliser la puissance des algorithmes pour fouiller ses textes. Le projet s’appelle Digital Leigh Hunt.
Leur travail consiste principalement à s’assurer que le corpus est « propre », c’est-à-dire qu’il ne contient pas d’erreurs de numérisation, et à entraîner l’intelligence artificielle afin qu’elle comprenne certaines subtilités du texte. L’informatisation de l’oeuvre ouvre l’exploration d’une manière inédite. Comme l’analyse traverse une immense quantité d’écrits, il devient possible de vérifier l’importance d’un thème pour l’écrivain, même s’il n’est central dans aucune de ses oeuvres. « Cela nous donne l’occasion de poser des questions contemporaines à des auteurs anciens, comme savoir s’ils s’intéressaient à l’esclavage ou s’ils étaient féministes », dit Michael Eberle Sinatra.
Le groupe noue des partenariats avec des chercheurs de partout qui fabriquent, eux aussi, des corpus semblables. Avec le temps, la diffusion de ceux-ci permettra de croiser les oeuvres des auteurs à travers les époques, les disciplines et les langues pour approfondir notre compréhension de leurs influences d’hier à aujourd’hui.