Le « data scientist », un sorcier de la donnée très convoité
PROFIL Tous les secteurs économiques le convoitent et sont prêts à casser leur tirelire pour le séduire. Son nom : le data scientist. Un terme inventé en 2008 par D.J. Patil et Jeff Hammerbacher, ingénieurs statisticiens chez LinkedIn et Facebook, et élu en 2012 « métier le plus sexy du xxie siècle » par la Harvard Business Review. L’inflation de données générée par les outils numériques (le big data), une réglementation de plus en plus complexe à l’exemple du RGPD (Règlement général pour la protection des données), l’arrivée progressive de l’IA et du machine learning, la montée en puissances des recherches vocales : tous ces facteurs nécessitent de disposer d’un de ces sorciers de la donnée capables de tirer la substantifique moelle des monceaux de datas recueillies. Les entreprises cherchent des profils à la fois en mesure de comprendre et d’utiliser les techniques mathématiques théoriques et de les implémenter pour améliorer leurs produits et services. « Le data scientist est un expert de l’exploitation des données. Il doit savoir les manipuler et en extraire de la valeur ajoutée via ses connaissances en informatique et en mathématiques. Les applications de son travail pouvant englober un grand nombre de missions au sein d’une entreprise, il est souvent amené à travailler sur des projets très variés », explique Mayeul Picard, data scientist chez Weborama, société créée en 1998 et rachetée en 2005 par Alain Levy (fils du patron de Publicis, Maurice Levy, qui a lui-même commencé comme informaticien). Pour devenir data scientist, mieux vaut être bon en maths et en informatique. Pour Mayeul Picard, diplômé de Télécom ParisTech et Polytechnique, un diplôme d’ingénieur, avec une spécialisation en dernière année, est la formation idéale pour les data scientists : « À ma connaissance, la plupart des écoles d’ingénieurs généralistes ont ouvert ces dernières années des cursus de data science, éventuellement sous forme de master 2 en collaboration avec des universités. ». À l’université, on peut aussi suivre à bac + 2 un cursus Miage (méthodes informatiques appliquées à la gestion des entreprises) qui mène à un master (bac+5). Il existe également des parcours moins académiques, avec des formations disponibles sur des plateformes d’éducation en ligne comme Coursera, Udemy ou OpenClassrooms, dont certaines sont proposées gratuitement.
FORMATIONS ONÉREUSES MAIS SALAIRES ÉLEVÉS
Pour ceux qui envisagent une formation dans les grandes écoles (Polytechnique, Essec CentraleSupélec, Télécom ParisTech, Paris-Dauphine, EM Lyon, etc.) il faut compter entre 12"000 et 20"000 euros par an. À noter que le Cnam (Conservatoire national des arts et métiers) propose une formation beaucoup plus abordable appelée « Certificat de spécialisation analyste de données massives, informaticiens, mathématiciens ou statisticiens » pour les étudiants de niveau ingénieur ou master et exerçant en entreprise. Les masters de l’université Paris-Saclay (AIC, Tried, IMSD, Data Science) sont également beaucoup moins onéreux que les cursus privés. Pour attirer ces experts du traitement de la donnée, les entreprises doivent mettre la main au portefeuille tant la concurrence est rude. Un data scientist débutant de niveau ingénieur va gagner entre 35"000 et 55"000 euros bruts (43"500 pour le salaire de base moyen selon le site Glassdoor), de 45"000 à 70"000 euros s’il est confirmé, un chiffre qui peut atteindre les 150"000 euros avec dix ans d’ancienneté. « Après trois ans, l’intitulé du poste a tendance à changer, en fonction de l’évolution hiérarchique du data scientist, avec des postes de data science manager, lead data scientist, head of data science ou chief data officer », précise Mayeul Picard.
Dans les années à venir, le data scientist sera toujours très convoité puisque l’arrivée de milliards d’objets connectés, dans la smart home par exemple, et de capteurs, dans la smart city et l’industrie, va continuer de faire grossir le flux continu de données. On pourrait alors assister à une spécialisation par fonction. « J’imagine que, dans le futur, le terme data scientist sera complété par une expertise dans un des domaines qu’englobe la data science (machine learning, programmation informatique, interprétation et visualisation de données) » , estime le data scientist de Weborama. Une formation intéressante pour les jeunes forts en maths car la demande est très importante et permet de trouver rapidement un poste bien rémunéré. « Attention tout de même à l’effet de mode : certaines entreprises ne sont pas encore très matures sur leurs besoins, ni très réalistes sur ce que l’exploitation des données peut concrètement leur apporter », tempère Mayeul Picard.
nP. C.