Scikit- learn, la biliothèque de ML généraliste
Développée par l’inria, Scikit- learn s’impose parmi les librairies d’auto- apprentissage généralistes les plus prisées. Elle fournit clefs en main les algorithmes les plus fréquemment utilisés pour l’apprentissage automatique : forêt aléatoire, régression linéaire, régression logistique, Xgboost… Elle implémente de bonnes pratiques très utiles, telles que la validation croisée. Cette technique consiste à mettre plusieurs algorithmes en compétition pour déterminer celui qui se révélera le plus fiable pour une problématique donnée. Sur le terrain des frameworks d’apprentissage automatique, deux grandes catégories de solutions se distinguent. D’abord les bibliothèques de Machine Learning généralistes. Conçues pour motoriser des algorithmes statistiques ( classification, régression…), elles sont notamment utilisées pour réaliser des modèles prédictifs en partant de données chiffrées. Dans la seconde catégorie, les bibliothèques de Deep learning s’adossent, elles, à la notion de réseau de neurones artificiels. Souvent considéré comme un sous- domaine du Machine Learning, le Deep learning peut s’appliquer aussi bien à des chiffres qu’à des contenus audio ou graphiques, ce qui le rend plus adapté à la reconnaissance vocale ou d’images. Dans un tel système, chaque couche du réseau de neurones se charge d’interpréter les résultats issus de la couche précédente. L’IA s’affine ainsi par itérations successives. Dans l’analyse de texte par exemple, la première couche s’attellera à la détection des lettres, la deuxième des mots, la troisième des groupes nominaux ou verbaux, et ainsi de suite. Les frameworks de Deep learning permettent de mettre en musique l’ensemble du dispositif.