L’apprentissage automatique doit permettre aux ordinateurs de reconnaître des modèles et d’apprendre des règles. Plutôt que de réagir à la saisie d’un utilisateur humain, les machines doivent être en mesure de prendre des décisions de façon autonome en se basant sur les règles qu’elles ont apprises. Les algorithmes peuvent par exemple apprendre à identifier correctement les spams ou à comprendre le contenu d’une image. Les développeurs et les scientifiques utilisent différentes méthodes pour les entraîner. La méthode la plus fréquemment utilisée est certainement le Supervised Learning, c’est-à-dire l’apprentissage supervisé.
Dans le Supervised Machine Learning, les développeurs mettent à la disposition des algorithmes un ensemble de données préparées qui serviront de base à l’entraînement. Par conséquent, le résultat est déjà connu. La tâche des algorithmes consiste uniquement à identifier les modèles : c’est-à-dire pourquoi telle information est classée dans la catégorie A et telle autre dans la catégorie B.
L’apprentissage supervisé est donc utilisé pour les algorithmes devant classer des données naturelles (photos, manuscrits, paroles, etc.). Par ailleurs, les problèmes de régression sont l’un des domaines d’application de prédilection de l’apprentissage supervisé. Dans ce cadre, les algorithmes doivent être capables de réaliser des prédictions, par exemple sur l’évolution des prix ou sur l’augmentation de la clientèle.
Il existe une forme mixte appelée apprentissage semi-supervisé. Dans cette méthode d’apprentissage, seule une partie de l’ensemble de données dispose d’étiquettes. Le reste n’est pas classé et doit être attribué par les algorithmes de façon autonome. La reconnaissance faciale de Facebook en est un bon exemple. Il suffit d’indiquer le nom de vos amis sur quelques photos et l’algorithme détermine les autres par lui-même.