L’Un­su­per­vi­sed Learning, ou ap­pren­tis­sage non supervisé, consiste à entraîner un modèle d’IA à l’aide de données non éti­que­tées afin de découvrir des modèles, des cor­ré­la­tions et des si­mi­li­tudes cachés.

Qu’est-ce que l’Un­su­per­vi­sed Learning ?

L’Un­su­per­vi­sed Learning est une méthode d’analyse des données dans le domaine de l’in­tel­li­gence ar­ti­fi­cielle. Il s’agit d’une approche du Machine Learning où les al­go­rithmes explorent des données non éti­que­tées afin d’en extraire des schémas, des relations et des groupes. Lors de l’ap­pren­tis­sage non supervisé, l’or­di­na­teur essaie de re­con­naître de manière autonome des modèles et des struc­tures au sein des valeurs d’entrée.

Dans cette méthode, les dé­ve­lop­peurs four­nis­sent les données, mais l’al­go­rithme découvre lui-même les struc­tures et les relations entre elles. Con­trai­re­ment à l’ap­pren­tis­sage supervisé, abordé plus en détail ci-dessous, l’Un­su­per­vi­sed Learning ne nécessite pas de données préa­la­ble­ment éti­que­tées. En effet, dans l’ap­pren­tis­sage supervisé, les dé­ve­lop­peurs doivent annoter ma­nuel­le­ment les données avant l’en­traî­ne­ment, ce qui permet à l’al­go­rithme d’apprendre à associer chaque entrée à une sortie spé­ci­fique. L’ap­pren­tis­sage non supervisé, lui, explore les données de manière autonome pour iden­ti­fier des tendances et des re­grou­pe­ments sans in­ter­ven­tion humaine directe.

Outils d'IA
Exploitez toute la puissance de l'in­tel­li­gence ar­ti­fi­cielle
  • Créez votre site Web en un temps record
  • Boostez votre activité grâce au marketing par IA
  • Gagnez du temps et obtenez de meilleurs résultats

Comment fonc­tionne l’Un­su­per­vi­sed Learning ?

Pour faire simple, cette méthode d’ap­pren­tis­sage repose sur des al­go­rithmes, souvent des réseaux neuronaux ar­ti­fi­ciels, capables d’analyser de grandes quantités de données afin d’y iden­ti­fier des contextes, des modèles et des si­mi­li­tudes. Plusieurs processus sont impliqués, notamment le clus­te­ring, aussi appelé « par­ti­tion­ne­ment des données ». Cette technique permet aux al­go­rithmes de regrouper au­to­ma­ti­que­ment les données en clusters (ou grappes) en fonction de leurs ca­rac­té­ris­tiques communes.

Si les données re­pré­sen­tent, par exemple, des photos de chiens et de chats, le programme d’Un­su­per­vi­sed Learning com­pa­re­rait et re­grou­pe­rait ces photos en fonction de leurs ca­rac­té­ris­tiques. Con­trai­re­ment au Su­per­vi­sed Learning, l’al­go­rithme n’a pas pour ins­truc­tion explicite de dis­tin­guer entre les photos de chiens et celles de chats, mais cela reste possible. Ces al­go­rithmes de Machine Learning re­grou­pent les images en fonction de leurs si­mi­la­ri­tés et dif­fé­rences, par exemple en se basant sur la couleur du pelage de l’animal.

L’as­so­cia­tion est un autre processus in­ter­ve­nant dans cette méthode. Elle permet de classer les données qui peuvent être liées à d’autres données via certains attributs. La tâche des al­go­rithmes consiste donc à trouver des objets en lien les uns avec les autres, sans pour autant qu’il s’agisse des mêmes objets. Reprenons l’exemple des photos de chiens : lors de l’as­so­cia­tion, l’al­go­rithme d’Un­su­per­vi­sed Learning ne re­grou­pe­rait pas tous les chiens ensemble, mais par exemple une laisse avec un chien.

JnnaDNNb380.jpg Pour afficher cette vidéo, des cookies de tiers sont né­ces­saires. Vous pouvez consulter et modifier vos pa­ra­mètres de cookies ici.

Dans quels cas l’ap­pren­tis­sage non supervisé est-il utilisé ?

L’Un­su­per­vi­sed Learning trouve de nom­breuses ap­pli­ca­tions pratiques, notamment dans l’analyse des marchés fi­nan­ciers. Grâce à cette méthode, les al­go­rithmes peuvent iden­ti­fier des modèles ré­cur­rents dans les fluc­tua­tions des cours boursiers, repérer des anomalies et regrouper des actifs fi­nan­ciers selon des ca­rac­té­ris­tiques communes. Par exemple, en analysant des données brutes sur les va­ria­tions de prix et les volumes de tran­sac­tions, un al­go­rithme peut détecter des schémas de com­por­te­ment des in­ves­tis­seurs ou iden­ti­fier des évé­ne­ments in­ha­bi­tuels sur les marchés. Ces in­for­ma­tions peuvent ensuite être utilisées par des analystes ou intégrées à d’autres modèles pré­dic­tifs pour affiner les stra­té­gies d’in­ves­tis­se­ment.

L’in­tel­li­gence ar­ti­fi­cielle, en par­ti­cu­lier l’Un­su­per­vi­sed Learning, est aussi présente dans de nombreux autres domaines. Le par­ti­tion­ne­ment des données permet de composer des groupes de personnes qui se ré­vé­le­ront tout par­ti­cu­liè­re­ment utiles en marketing. Dans ce domaine, le groupe cible joue en effet un rôle central et sert de base à l’éla­bo­ra­tion d’une stratégie pu­bli­ci­taire. Les al­go­rithmes peuvent apprendre à composer de tels groupes de personnes de façon autonome.

L’ap­pren­tis­sage non supervisé est également bien ancré dans le domaine de la re­con­nais­sance vocale. Cette tech­no­lo­gie nous permet par exemple d’utiliser des pro­grammes d’as­sis­tance comme Siri, Alexa ou le Google Assistant. Dans ce cadre, les pro­grammes ap­pren­nent les par­ti­cu­la­ri­tés vocales du pro­prié­taire et peuvent com­prendre des énoncés toujours plus précis avec le temps, même si le pro­prié­taire a un tic de langage ou parle un dialecte.

De nombreux smart­phones utilisent déjà l’Un­su­per­vi­sed Learning pour organiser au­to­ma­ti­que­ment les galeries de photo. Grâce à un ap­pren­tis­sage autonome et non supervisé, l’appareil est capable d’iden­ti­fier la même personne sur des photos ou de trouver des lieux de prise iden­tiques dans les mé­ta­don­nées. Les photos peuvent ainsi être or­ga­ni­sées selon le lieu de prise ou selon les personnes ap­pa­rais­sant sur la photo.

L’Un­su­per­vi­sed Learning joue aussi un rôle dans les con­ver­sa­tions en ligne, notamment à travers les chatbots utilisés pour gérer les in­te­rac­tions vir­tuelles. Ces bots sont capables d’analyser les échanges pour repérer certains motifs de langage et adapter leurs réponses. Toutefois, la détection des insultes, du har­cè­le­ment ou des discours haineux repose gé­né­ra­le­ment sur des modèles su­per­vi­sés, qui ont été entraînés sur des exemples annotés. En revanche, l’ap­pren­tis­sage non supervisé peut être utilisé pour iden­ti­fier de nouveaux com­por­te­ments in­ha­bi­tuels ou regrouper les con­ver­sa­tions en thé­ma­tiques.

Les chatbots au­to­ma­ti­sés, utilisés dans les services client et les systèmes de commande en ligne, fonc­tion­nent de manière similaire. Que ce soit dans une mes­sa­ge­rie ou par téléphone, ces bots amé­lio­rent pro­gres­si­ve­ment leur com­pré­hen­sion des demandes des uti­li­sa­teurs, parfois en combinant des approches su­per­vi­sées et non su­per­vi­sées pour affiner leurs réponses.

Exemple négatif : les chatbots sur les réseaux sociaux

En 2016, Microsoft a constaté à ses dépens que l’ap­pren­tis­sage non supervisé pouvait également avoir des effets négatifs. Son IA « Tay » avait accès à Twitter et apprenait en com­mu­ni­quant avec d’autres uti­li­sa­teurs de la pla­te­forme. Au départ, le programme était re­la­ti­ve­ment peu efficace, mais il a ra­pi­de­ment appris à utiliser des smileys et à former des phrases complètes. Toutefois, l’IA ne possédait aucun filtre éthique et a reproduit les discours haineux qu’il apprenait de ses in­te­rac­tions sur Twitter ; il s’est très ra­pi­de­ment mise à propager des propos haineux et des théories du complot, le tout en l’espace de 24 heures. En soi, le programme n’avait d’opinion ni raciste ni politique mais il a sim­ple­ment appris des uti­li­sa­teurs humains.

Exemple positif : la recherche génétique

L’Un­su­per­vi­sed Learning est par­ti­cu­liè­re­ment utile dans le domaine de la recherche génétique. Il permet d’analyser et de regrouper de grandes quantités de séquences gé­né­tiques afin d’iden­ti­fier des modèles et des cor­ré­la­tions entre certaines mutations et des pa­tho­lo­gies. En utilisant des tech­niques de clus­te­ring et d’analyse des si­mi­la­ri­tés, ces al­go­rithmes fa­ci­li­tent la clas­si­fi­ca­tion des gènes et l’iden­ti­fi­ca­tion de marqueurs gé­né­tiques associés à des maladies hé­ré­di­taires.

Grâce à l’IA et aux méthodes d’ap­pren­tis­sage au­to­ma­tique, l’analyse des données bio­lo­giques s’est accélérée de manière sig­ni­fi­ca­tive, per­met­tant aux cher­cheurs d’explorer plus ra­pi­de­ment les in­te­rac­tions gé­né­tiques et d’optimiser le dé­ve­lop­pe­ment de trai­te­ments per­son­na­li­sés. Par exemple, ces avancées aident à mieux com­prendre des maladies comme la dré­pa­no­cy­tose ou certaines formes de cécité hé­ré­di­taire, ouvrant la voie à de nouvelles approches thé­ra­peu­tiques et à une médecine plus pré­dic­tive.

Avantage de l’ap­pren­tis­sage non supervisé par rapport à d’autres méthodes

Le Machine Learning ne se limite pas aux avancées tech­no­lo­giques, il facilite aussi la vie quo­ti­dienne, l’économie et la recherche. Con­trai­re­ment à l’ap­pren­tis­sage supervisé, l’Un­su­per­vi­sed Learning ne nécessite pas d’an­no­ta­tion humaine préalable, ce qui permet d’explorer librement les struc­tures cachées dans les données. Cela re­pré­sente un gain de temps, mais aussi un avantage majeur : il permet d’iden­ti­fier des modèles et des cor­ré­la­tions complexes que l’analyse humaine ne pourrait pas détecter aussi ef­fi­ca­ce­ment. Grâce à lui, les al­go­rithmes peuvent révéler des struc­tures inédites dans les données, ouvrant la voie à de nouvelles ap­pli­ca­tions et in­no­va­tions.

Dif­fé­rences avec le Su­per­vi­sed et le Semi-Su­per­vi­sed Learning

En plus de l’Un­su­per­vi­sed Learning, il existe également le Su­per­vi­sed Learning et le Semi-su­per­vi­sed Learning, qui pré­sen­tent tous deux quelques dif­fé­rences avec l’ap­pren­tis­sage non supervisé. Nous abordons briè­ve­ment ces dif­fé­rences dans les pa­ra­graphes suivants.

Un­su­per­vi­sed vs Su­per­vi­sed Learning

Dans le Su­per­vi­sed Learning, con­trai­re­ment à l’Un­su­per­vi­sed Learning, les données d’entrée et les sorties cor­res­pon­dantes sont connues dès le départ. De plus, ses objectifs sont dif­fé­rents : étant donné qu’il existe déjà une réponse « correcte » pour chaque point de données, ce procédé d’ap­pren­tis­sage vise à ce que l’IA puisse répondre « cor­rec­te­ment » après l’en­traî­ne­ment.

En plus de leurs uti­li­sa­tions et de leurs objectifs dif­fé­rents, ces deux types d’ap­pren­tis­sage sont aussi très dif­fé­rents en termes d’ef­fi­ca­cité et de clarté. L’ap­pren­tis­sage non supervisé ne nécessite que des données brutes pour l’en­traî­ne­ment et la re­con­nais­sance de modèles. En revanche, les résultats sont souvent très abstraits par rapport à l’ap­pren­tis­sage supervisé, et doivent parfois être analysés ma­nuel­le­ment. En revanche, les coûts initiaux de l’ap­pren­tis­sage supervisé sont très élevés, car l’en­traî­ne­ment ne peut se faire qu’avec des données en­tiè­re­ment éti­que­tées. L’avantage de cette méthode est que les objectifs de la formation sont très clai­re­ment définis par l’éti­que­tage des données et que les résultats finaux sont gé­né­ra­le­ment très com­pré­hen­sibles.

Un­su­per­vi­sed vs. Semi-Su­per­vi­sed Learning

Dans le cas du Semi-Su­per­vi­sed Learning, des données éti­que­tées et non éti­que­tées sont utilisées pour l’ap­pren­tis­sage. Le modèle apprend d’abord à partir des données éti­que­tées afin de créer un modèle de clas­si­fi­ca­tion ru­di­men­taire. Ce modèle est ensuite utilisé pour faire des pré­dic­tions pour les données non éti­que­tées. Ensuite, le modèle est à nouveau entraîné, cette fois avec les données éti­que­tées et les pré­dic­tions utilisées comme éti­quettes. Ce processus peut ensuite être poursuivi de manière itérative.

Étant donné que l’ap­pren­tis­sage semi-supervisé, comme l’ap­pren­tis­sage supervisé, est plutôt adapté aux problèmes de clas­si­fi­ca­tion, cette méthode est fon­da­men­ta­le­ment dif­fé­rente de l’ap­pren­tis­sage non supervisé, qui est prin­ci­pa­le­ment utilisé pour le clus­te­ring et l’as­so­cia­tion. Toutefois, le Semi-Su­per­vi­sed Learning présente une si­mi­li­tude avec l’Un­su­per­vi­sed Learning : ses coûts initiaux re­la­ti­ve­ment faibles.

Autres méthodes d’ap­pren­tis­sage de l’IA : le Rein­for­ced Learning

Il existe une autre méthode d’ap­pren­tis­sage : dans le cas du Rein­for­ce­ment Learning (ap­pren­tis­sage par ren­for­ce­ment), les dé­ve­lop­peurs dé­fi­nis­sent un système de ré­com­penses per­met­tant aux al­go­rithmes d’apprendre par essais et erreurs. Pour chaque décision, l’or­di­na­teur reçoit un feedback positif ou négatif de l’en­vi­ron­ne­ment d’en­traî­ne­ment. Ainsi, l’in­tel­li­gence ar­ti­fi­cielle peut re­con­naître les relations à long terme et dé­ve­lop­per des stra­té­gies afin d’obtenir le plus de feedbacks positifs possible.

Par exemple, on pourrait utiliser l’ap­pren­tis­sage par ren­for­ce­ment pour entraîner un robot à trouver un objet dans une pièce, en le plaçant à chaque fois à un endroit différent. Le robot recevrait un feedback négatif pour les col­li­sions et le temps perdu. À long terme, le robot dé­ve­lop­pe­rait des stra­té­gies pour optimiser son processus de recherche.

Aller au menu principal