Qu’est-ce que l’Unsupervised Learning ?

À l’heure actuelle, l’intelligence artificielle est le sujet le plus important dans le domaine de l’informatique. Les programmes apprennent à imiter la pensée et l’action des êtres humains et peuvent prendre leurs propres décisions après une phase d’apprentissage. Dans le domaine de l’intelligence artificielle, on parle d’apprentissage automatique, un terme qui décrit le processus nécessaire à des programmes et à des machines pour apprendre de façon autonome. Une des méthodes utilisées à cette fin est l’Unsupervised Learning ou l’apprentissage non supervisé.

Qu’est-ce que l’apprentissage non supervisé (Unsupervised Learning) ?

L’Unsupervised Learning est une méthode d’analyse des données dans le domaine de l’intelligence artificielle dans laquelle un réseau neuronal artificiel s’appuie sur des similitudes entre les différentes valeurs d’entrée. Dans l’apprentissage non supervisé, l’ordinateur essaie d’identifier par lui-même des modèles et des structures au sein des valeurs saisies.

L’apprentissage non supervisé s’oppose ainsi à l’apprentissage supervisé. Dans cette méthode, les développeurs gardent un contrôle total et détaillent le but de l’apprentissage au préalable. Une troisième méthode est à mi-chemin entre ces deux méthodes d’apprentissage : l’apprentissage par renforcement dans lequel les développeurs donnent uniquement des impulsions afin d’orienter l’entraînement des algorithmes.

Comment fonctionne l’Unsupervised Machine Learning ?

Pour faire simple, cette méthode d’apprentissage est un réseau neuronal artificiel analysant une grande quantité d’informations saisies afin de déterminer des contextes, des modèles et des similitudes dans les données. Différents processus interviennent dans ce cadre. Cette méthode d’apprentissage utilise la technologie de clustering, également appelée « partitionnement des données », dans laquelle les algorithmes doivent former des clusters – c’est-à-dire des grappes – de façon autonome. Des données sont ensuite attribuées à ces clusters.

Par exemple, si les données sont des photos de chiens et de chats, le programme trie tout d’abord toutes les photos de chiens et de chats entre ces deux catégories. Contrairement à l’apprentissage supervisé, ce résultat n’est toutefois pas prédéterminé. Dans l’Unsupervised Machine Learning, les algorithmes prennent cette décision de façon autonome sur la base de points communs et de différences entre les photos.

L’association est un autre processus intervenant dans cette méthode. Elle permet de classer les données qui peuvent être liées à d’autres données via certains attributs. La tâche des algorithmes consiste donc à trouver des objets en lien les uns avec les autres sans pour autant qu’il s’agisse des mêmes objets. Reprenons l’exemple des photos de chiens : lors de l’association, l’algorithme d’apprentissage non supervisé ne regrouperait pas tous les chiens ensemble mais par exemple une laisse avec un chien.

Pour afficher cette vidéo, des cookies de tiers sont nécessaires. Vous pouvez consulter et modifier vos paramètres de cookies ici.

Dans quels cas l’apprentissage non supervisé est-il utilisé ?

Il existe de nombreux exemples pratiques de l’Unsupervised Learning. Grâce à cette méthode d’apprentissage, les programmes capables d’apprendre des règles du jeu et des stratégies de victoire peuvent être utilisés en bourse de façon rentable. Il est par exemple possible de mettre à disposition les cours boursiers sous forme de données brutes et de laisser le programme identifier certaines activités en bourse et prédire des tendances.

Toutefois, l’intelligence artificielle, en particulier l’Unsupervised Learning, est déjà présente dans de nombreux autres domaines. Le partitionnement des données permet de composer des groupes de personnes qui se révéleront tout particulièrement utiles en marketing. Dans ce domaine, le groupe cible joue en effet un rôle central et sert de base à l’élaboration d’une stratégie publicitaire. Les algorithmes peuvent apprendre à composer de tels groupes de personnes de façon autonome.

L’apprentissage non supervisé est également bien ancré dans le domaine de la reconnaissance vocale. Cette technologie nous permet par exemple d’utiliser des programmes d’assistance comme Siri, Alexa ou le Google Assistant. Dans ce cadre, les programmes apprennent les particularités vocales du propriétaire et peuvent comprendre des énoncés toujours plus précis avec le temps, même si le propriétaire a un tic de langage ou parle un dialecte.

De nombreux smartphones utilisent déjà l’Unsupervised Learning pour organiser automatiquement les galeries de photo. Grâce à un apprentissage autonome et non supervisé, l’appareil est capable d’identifier la même personne sur des photos ou de trouver des lieux de prise identiques dans les métadonnées. Les photos peuvent ainsi être organisées selon le lieu de prise ou selon les personnes apparaissant sur la photo.

L’Unsupervised Learning a également fait ses preuves dans les chats : une grande partie des internautes a déjà eu affaire à des chatbots qui gèrent par exemple l’interaction sociale dans les conversations virtuelles. Les bots identifient d’eux-mêmes les insultes, le harcèlement, les déclarations racistes ainsi que la discrimination et retire les utilisateurs concernés du chat ou les rappelle à l’ordre. L’intelligence artificielle intervient également dans ce cadre. Les chats automatisés dans les services client et les services de commande en ligne fonctionnent de façon similaire. Que ce soit dans une messagerie ou sur un téléphone, les bots apprennent de façon autonome, en partie sans être supervisés.

Exemple négatif : les chatbots dans les réseaux sociaux

En 2016, Microsoft a toutefois constaté à ses dépens que l’apprentissage non supervisé pouvait également avoir des effets négatifs. Leur IA « Tay » avait accès à Twitter et apprenait en communiquant avec d’autres utilisateurs de la plate-forme. Au départ, le programme était encore relativement peu efficace, mais il a rapidement appris à utiliser des smileys et à former des phrases complètes. Toutefois, l’IA n’évaluait pas la qualité des énoncés et s’est très rapidement mise à harceler les étrangers et les féministes ainsi qu’à propager des théories du complot, le tout en l’espace de 24 heures. En soi, le programme n’avait d’opinion ni raciste ni politique mais il a simplement appris des gens. L’histoire ne dit pas si et combien d’utilisateurs de Twitter blaguaient en alimentant Tay avec ces données.

Exemple positif : la recherche génétique

L’Unsupervised Learning a toutefois des effets positifs dans la recherche génétique. Le partitionnement des données est en effet utilisé pour analyser le matériel génétique. L’intelligence artificielle et ses méthodes d’apprentissage ont permis de rapprocher les domaines médical et technique et d’accélérer la recherche de façon colossale de sorte que des maladies héréditaires comme la drépanocytose ainsi qu’une forme de cécité héritée pourront à l’avenir être traitées et soignées.

Avantage de l’apprentissage non supervisé par rapport à d’autres méthodes

L’apprentissage automatique n’est pas uniquement synonyme de progrès technique et permet également de soulager les gens et de leur faciliter la vie dans de nombreux domaines de la vie quotidienne. Il enrichit le quotidien, l’économie et la recherche. Contrairement aux deux autres méthodes d’apprentissage (apprentissage supervisé et par renforcement), les développeurs ne participent pas à l’entraînement à proprement parler, ce qui permet non seulement un gain de temps, mais présente également un autre avantage : l’Unsupervised Learning permet d’identifier des modèles qu’un être humain n’aurait pas su identifier. Grâce à l’apprentissage automatique, les algorithmes ont ainsi la possibilité de développer des idées créatives.