Le Su­per­vi­sed Learning, ou ap­pren­tis­sage supervisé, consiste à entraîner un modèle d’IA à faire des pré­dic­tions ou des clas­si­fi­ca­tions pour de nouvelles données inconnues à l’aide de données éti­que­tées.

Qu’est-ce que le Su­per­vi­sed Learning ?

L’ap­pren­tis­sage au­to­ma­tique (Machine Learning) doit permettre aux or­di­na­teurs de re­con­naître des modèles et d’apprendre des règles. Plutôt que de réagir à la saisie d’un uti­li­sa­teur humain, les machines doivent être en mesure de prendre des décisions de façon autonome en se basant sur les règles qu’elles ont apprises. Les al­go­rithmes peuvent par exemple apprendre à iden­ti­fier cor­rec­te­ment les spams ou à com­prendre le contenu d’une image. Les dé­ve­lop­peurs et les scien­ti­fiques utilisent dif­fé­rentes méthodes pour les entraîner. La méthode la plus fré­quem­ment utilisée est cer­tai­ne­ment le Su­per­vi­sed Learning, c’est-à-dire l’ap­pren­tis­sage supervisé.

En ap­pren­tis­sage supervisé, les al­go­rithmes sont entraînés à partir de données annotées fournies par les dé­ve­lop­peurs, qui serviront de base à l’en­traî­ne­ment. Par con­sé­quent, le résultat est déjà connu. La tâche des al­go­rithmes consiste uni­que­ment à iden­ti­fier les modèles ; à savoir pourquoi telle in­for­ma­tion est classée dans la catégorie A et telle autre dans la catégorie B.

Le Su­per­vi­sed Learning est donc utilisé pour les al­go­rithmes devant classer des données, qu’elles soient tex­tuelles, visuelles ou audio. Par ailleurs, les problèmes de ré­gres­sion sont l’un des domaines d’ap­pli­ca­tion de pré­di­lec­tion de l’ap­pren­tis­sage supervisé. Dans ce cadre, les al­go­rithmes doivent être capables de réaliser des pré­dic­tions, par exemple sur l’évolution des prix ou sur l’aug­men­ta­tion de la clientèle.

Une approche in­ter­mé­diaire, appelée ap­pren­tis­sage semi-supervisé, combine des données éti­que­tées et non éti­que­tées. Dans ce modèle, seule une partie des données d’en­traî­ne­ment est annotée, tandis que le reste est analysé par l’al­go­rithme, qui apprend à classer les éléments de manière autonome. Un exemple courant est la re­con­nais­sance faciale sur les réseaux sociaux : après avoir identifié ma­nuel­le­ment quelques visages, l’al­go­rithme est capable de re­con­naître les autres au­to­ma­ti­que­ment.

L’ap­pren­tis­sage supervisé expliqué à travers un exemple

Supposons que nous sou­hai­tions entraîner un al­go­rithme à dis­tin­guer les photos de chats de celles de chiens. Les dé­ve­lop­peurs préparent à cet effet un très vaste ensemble de données com­pre­nant des photos déjà dotées d’une étiquette, c’est-à-dire ap­par­te­nant déjà à une catégorie. On pourrait alors imaginer trois groupes : chiens, chats et autres. Il est essentiel que l’ensemble de données montre la plus grande diversité possible. Pour faire simple, si les données d’en­traî­ne­ment com­por­tent uni­que­ment des photos de chats noirs, l’al­go­rithme partira du principe que tous les chats ont un pelage noir. L’ensemble de données doit refléter le mieux possible l’éventail de variantes.

Lors de l’en­traî­ne­ment, l’al­go­rithme reçoit d’abord les données brutes, effectue une première clas­si­fi­ca­tion et compare ses pré­dic­tions aux résultats attendus, préa­la­ble­ment définis par les dé­ve­lop­peurs. Il ajuste ensuite ses pa­ra­mètres en fonction de l’écart entre ses pré­dic­tions et les valeurs correctes, affinant pro­gres­si­ve­ment son modèle. L’ap­pren­tis­sage se poursuit jusqu’à ce que les pré­dic­tions de l’al­go­rithme at­teig­nent un niveau de précision sa­tis­fai­sant.

Avantages et in­con­vé­nients du Su­per­vi­sed Machine Learning

Le choix de la méthode dépend largement des tâches que l’al­go­rithme devra accomplir. Pour les problèmes de ré­gres­sion et de clas­si­fi­ca­tion, l’ap­pren­tis­sage supervisé est souvent pri­vi­lé­gié par rapport aux autres méthodes. Il permet d’entraîner les al­go­rithmes de manière ciblée afin qu’ils soient par­fai­te­ment adaptés à leur domaine d’ap­pli­ca­tion. Cette approche offre un contrôle total sur le jeu de données d’en­traî­ne­ment, mais exige un travail rigoureux d’an­no­ta­tion et de pa­ra­mé­trage. Pour garantir un modèle per­for­mant, l’échan­til­lon de données doit être suf­fi­sam­ment varié et re­pré­sen­ta­tif. L’ap­pren­tis­sage supervisé demande donc des efforts con­si­dé­rables de la part des dé­ve­lop­peurs, car chaque donnée doit être soig­neu­se­ment étiquetée.

Bien que l’effort soit re­la­ti­ve­ment important, il permet de com­prendre assez fa­ci­le­ment ce qui se passe. Alors que dans l’ap­pren­tis­sage non supervisé, bon nombre de choses restent obscures puisque les al­go­rithmes tra­vail­lent sans disposer d’ins­truc­tions réelles, dans l’ap­pren­tis­sage supervisé, le dé­ve­lop­peur sait ce que fait la machine. Mais cela peut également être un in­con­vé­nient : les al­go­rithmes su­per­vi­sés sont limités aux modèles qu’ils ont appris et ne peuvent pas générer de nouvelles con­nais­sances hors de ce cadre.

Outils d'IA
Exploitez toute la puissance de l'in­tel­li­gence ar­ti­fi­cielle
  • Créez votre site Web en un temps record
  • Boostez votre activité grâce au marketing par IA
  • Gagnez du temps et obtenez de meilleurs résultats

Dif­fé­rences avec l’Un­su­per­vi­sed et le Semi-Su­per­vi­sed Learning

Outre le Su­per­vi­sed Learning, il existe également l’Un­su­per­vi­sed Learning (ap­pren­tis­sage non supervisé) et le Semi-Su­per­vi­sed Learning (ap­pren­tis­sage semi-supervisé). Dans ce qui suit, nous abordons res­pec­ti­ve­ment les dif­fé­rences entre ces deux méthodes et l’ap­pren­tis­sage supervisé.

Su­per­vi­sed vs Un­su­per­vi­sed Learning

Alors que le Su­per­vi­sed Learning utilise des ensembles de données dont on connaît à la fois les entrées et les sorties, l’Un­su­per­vi­sed Learning analyse uni­que­ment les entrées sans in­di­ca­tion de sortie attendue. Par con­sé­quent, il vise à découvrir des modèles ou des struc­tures inconnus dans les données et convient à d’autres types de tâches que l’ap­pren­tis­sage supervisé, comme le clus­te­ring (re­grou­pe­ment de points de données sans les classer dans des ca­té­go­ries).

Étant donné que les sorties de l’ensemble d’ap­pren­tis­sage ne sont pas éti­que­tées dans le cas de l’Un­su­per­vi­sed Learning, l’effort des dé­ve­lop­peurs est beaucoup plus faible que dans le cas du Su­per­vi­sed Learning. En revanche, le processus d’ap­pren­tis­sage et le résultat final sont beaucoup plus opaques. Il est donc difficile d’évaluer la per­for­mance et la précision des modèles entraînés.

Su­per­vi­sed vs Semi-Su­per­vi­sed Learning

Un in­con­vé­nient majeur de l’ap­pren­tis­sage supervisé est le temps con­si­dé­rable que les dé­ve­lop­peurs doivent consacrer à l’éti­que­tage des données. L’ap­pren­tis­sage semi-supervisé utilise à la fois des données marquées et non marquées pour pallier cet in­con­vé­nient. Le modèle apprend d’abord à partir des données éti­que­tées et s’améliore ensuite grâce à l’uti­li­sa­tion des données non éti­que­tées, en re­con­nais­sant les modèles et les struc­tures.

Le principal avantage du Semi-Su­per­vi­sed Learning est l’ef­fi­ca­cité, étant donné que moins de données doivent être éti­que­tées et que le processus peut toujours présenter une précision re­la­ti­ve­ment élevée. Il peut donc être utilisé pour des problèmes de clas­si­fi­ca­tion si­mi­laires à ceux du Su­per­vi­sed Learning, la dif­fé­rence étant qu’il essaiera d’optimiser le processus d’ap­pren­tis­sage. La com­plexité de la mo­dé­li­sa­tion et l’ajus­te­ment de l’équilibre entre les données éti­que­tées et non éti­que­tées peuvent cependant cons­ti­tuer un défi.

Autres méthodes d’ap­pren­tis­sage

L’ap­pren­tis­sage supervisé, non supervisé et semi-supervisé ne sont pas les seules méthodes de Machine Learning utilisées pour entraîner les in­tel­li­gences ar­ti­fi­cielles.

Le Deep Learning est un processus d’ap­pren­tis­sage dans lequel les modèles déjà entraînés ap­pren­nent et évoluent en fonction de leurs entrées. Ces modèles sont basés sur des réseaux neuronaux, qui sont inspirés du cerveau humain.

Il existe également le Rein­for­ce­ment Learning, en français ap­pren­tis­sage par ren­for­ce­ment, où un or­di­na­teur apprend par essais et erreurs quelles sont les bonnes décisions à prendre. Il vise à établir une stratégie optimale pour maximiser une ré­com­pense sur le long terme. Une IA qui apprend à jouer à un jeu vidéo en est un exemple : l’IA reçoit un feedback de l’en­vi­ron­ne­ment d’en­traî­ne­ment sur chaque décision et développe ainsi des stra­té­gies de jeu.

En résumé

Le Su­per­vi­sed Learning est une variante très populaire de l’ap­pren­tis­sage d’al­go­rithmes, car les dé­ve­lop­peurs gardent le contrôle total. Alors qu’avec d’autres variantes d’ap­pren­tis­sage, les résultats restent souvent flous, avec le Su­per­vi­sed Machine Learning, le résultat final attendu du processus d’ap­pren­tis­sage est très clair dès le début. Cependant, l’effort à fournir par les dé­ve­lop­peurs est d’autant plus important.

Aller au menu principal