Un réseau neuronal ar­ti­fi­ciel (en anglais : ar­ti­fi­cial neural network) est un système in­for­ma­tique dont la structure est inspirée du cerveau humain et qui dote les or­di­na­teurs de ca­rac­té­ris­tiques d’in­tel­li­gence ar­ti­fi­cielle. Les réseaux neuronaux en sont un élément central, et l’une des nom­breuses méthodes utilisées dans les ap­pli­ca­tions modernes d’IA, comme pour les chatbots.

Il existe dif­fé­rents types de réseaux neuronaux ar­ti­fi­ciels, chacun offrant dif­fé­rentes pos­si­bi­li­tés de trai­te­ment de l’in­for­ma­tion dans le contexte du Deep Learning. La recherche dans ce domaine a connu des avancées majeures au cours des dernières années. Les réseaux neuronaux cons­ti­tuent une tech­no­lo­gie centrale pour apprendre aux machines à penser par elles-mêmes, ce qui permet aux or­di­na­teurs de résoudre des problèmes de manière autonome et d’améliorer leurs capacités. Entre-temps, les réseaux neuronaux font partie de systèmes mul­ti­mo­daux qui peuvent combiner texte, image, audio et vidéo.

Comment fonc­tionne un réseau neuronal ar­ti­fi­ciel ?

Les réseaux neuronaux ar­ti­fi­ciels s’inspirent de la structure du cerveau humain, qui traite les in­for­ma­tions via un réseau de neurones.

Les réseaux neuronaux ar­ti­fi­ciels sont gé­né­ra­le­ment composés d’au moins trois couches : une couche d’entrée, une ou plusieurs couches cachées (hidden layers), et une couche de sortie. Les réseaux modernes tels que les réseaux neuronaux con­vo­lu­tifs (CNN) ou les modèles de trans­for­meurs né­ces­si­tent souvent de nom­breuses couches, même pour des tâches simples, car la pro­fon­deur contribue à leur ef­fi­ca­cité. Chaque couche contient un grand nombre de neurones ar­ti­fi­ciels, chacun ap­pli­quant une trans­for­ma­tion spé­ci­fique aux données d’entrée.

Outils d'IA
Exploitez toute la puissance de l'in­tel­li­gence ar­ti­fi­cielle
  • Créez votre site Web en un temps record
  • Boostez votre activité grâce au marketing par IA
  • Gagnez du temps et obtenez de meilleurs résultats

Trai­te­ment de l’in­for­ma­tion dans le réseau de neurones ar­ti­fi­ciels

Au sein d’un réseau neuronal ar­ti­fi­ciel, le trai­te­ment de l’in­for­ma­tion suit toujours la même séquence : les in­for­ma­tions sont trans­mises sous la forme de signaux aux neurones de la couche d’entrée, où elles sont traitées. Chaque connexion entre neurones est associée à un poids, qui détermine l’im­por­tance du signal transmis. Associé à la fonction dite de transfert, le poids permet de dé­ter­mi­ner quelles in­for­ma­tions peuvent entrer dans le système.

À l’étape suivante, une fonction dite d’ac­ti­va­tion associée à une valeur seuil calculent et pondèrent la valeur de sortie du neurone. En fonction de cette valeur, un nombre plus ou moins grand de neurones sont connectés et activés.

Ces con­nexions pondérées forment un modèle ma­thé­ma­tique qui permet au réseau d’apprendre des relations entre les données. Chaque nouvelle itération permet d’ajuster la pon­dé­ra­tion et donc l’al­go­rithme de façon à ce que le réseau donne à chaque fois un résultat plus précis et fiable.

Réseau neuronal ar­ti­fi­ciel : exemple d’ap­pli­ca­tion

Les réseaux de neurones ar­ti­fi­ciels peuvent être utilisés en matière de re­con­nais­sance d’images. Con­trai­re­ment au cerveau humain, un or­di­na­teur ne peut pas dé­ter­mi­ner d’un coup d’œil si une pho­to­gra­phie montre un être humain, une plante ou un objet. Il est obligé d’examiner l’image pour en discerner les ca­rac­té­ris­tiques in­di­vi­duelles. C’est l’al­go­rithme mis en place qui lui permet de savoir quelles ca­rac­té­ris­tiques sont per­ti­nentes ; à défaut, il peut le découvrir par lui-même grâce à l’analyse des données.

Au sein de chaque couche du réseau de neurones, le système vérifie les signaux d’entrée, c’est-à-dire les images, dé­com­po­sés en critères in­di­vi­duels tels que la couleur, les angles ou les formes. Chaque nouveau teste permet à l’or­di­na­teur de dé­ter­mi­ner avec plus de justesse ce que montre l’image.

Ini­tia­le­ment, les résultats sont né­ces­sai­re­ment sujets à un certain nombre d’erreurs. Si le réseau de neurones ar­ti­fi­ciels reçoit un retour d’in­for­ma­tion d’origine humaine qui lui permet ainsi d’adapter son al­go­rithme, on parle de Machine Learning. Le concept de Deep Learning a pour but d’éliminer le besoin en in­ter­ven­tion humaine. Le système apprend alors de sa propre ex­pé­rience ; il s’améliore à chaque fois qu’une image lui est soumise.

En théorie, on obtient à l’arrivée un al­go­rithme capable d’iden­ti­fier sans erreur le contenu d’une pho­to­gra­phie, qu’elle soit en couleurs ou en noir et blanc, quelle que soit la position du sujet ou l’angle sous lequel il est re­pré­senté.

Types de réseaux neuronaux

On fait appel à dif­fé­rentes struc­tures de réseaux de neurones ar­ti­fi­ciels en fonction de la méthode d’ap­pren­tis­sage utilisée et de l’objectif recherché.

Per­cep­tron

À l’origine, la forme la plus simple de « réseau » neuronal ar­ti­fi­ciel était composée d’un seul neurone modifié par des pon­dé­ra­tions et doté d’une valeur seuil. Le terme « Per­cep­tron » désigne un modèle simple de réseau neuronal, souvent utilisé comme base pour les réseaux de neurones à action directe (feed­for­ward neural networks).

Réseaux de neurones à action directe

Un réseau de neurones à action directe ne peut trans­mettre l’in­for­ma­tion que dans un unique sens de trai­te­ment. Les réseaux peuvent être mo­no­couches, c’est-à-dire cons­ti­tués uni­que­ment de couches d’entrée et de sortie, ou mul­ti­couches, c’est-à-dire disposant d’un certain nombre de couches cachées (hidden layers).

Note

Apprenez-en plus sur les réseaux à action directe dans notre article dédié !

Réseaux de neurones ré­cur­rents

Dans les réseaux de neurones ré­cur­rents, il est possible de faire passer l’in­for­ma­tion dans des boucles de ré­troac­tion, et ainsi de la faire revenir vers une couche pré­cé­dente. Ces ré­troac­tions per­met­tent au système de se cons­ti­tuer une mémoire. Les réseaux de neurones ré­cur­rents sont utilisés par exemple en matière de re­con­nais­sance vocale, de tra­duc­tion et de re­con­nais­sance d’écriture ma­nus­crite.

Note

Vous pouvez en apprendre plus sur le sujet dans notre article sur les réseaux neuronaux ré­cur­rents.

Réseaux de neurones con­vo­lu­tifs

Un réseau neuronal con­vo­lu­tif est un type de réseau mul­ti­couche. Il est composé d’un minimum de cinq couches. Sur chaque couche, une re­con­nais­sance des formes est effectuée, le résultat d’une couche étant transféré à la suivante. Ce type de réseau neuronal ar­ti­fi­ciel est utilisé en matière de re­con­nais­sance d’images.

Note

Vous trouverez des in­for­ma­tions plus dé­tail­lées à ce sujet dans notre guide sur les réseaux neuronaux con­vo­lu­tifs.

Méthodes d’ap­pren­tis­sage

Pour veiller à ce que les con­nexions au sein d’un réseau de neurones ar­ti­fi­ciels soient cor­rec­te­ment établies, il faut au préalable procéder à son « en­traî­ne­ment ». On peut dis­tin­guer ici deux pro­cé­dures de base : l’ap­pren­tis­sage supervisé et l’ap­pren­tis­sage non supervisé.

Ap­pren­tis­sage supervisé

L’ap­pren­tis­sage supervisé repose sur un ensemble de données annotées, où chaque entrée est associée à une sortie correcte per­met­tant d’ajuster les poids du réseau. Par exemple, si on présente au système une pho­to­gra­phie de chats afin qu’il la re­con­naisse, il faut contrôler le fonc­tion­ne­ment du système et donner un retour d’in­for­ma­tion pour dé­ter­mi­ner si l’image est cor­rec­te­ment reconnue ou non. Cette méthode permet de modifier les pon­dé­ra­tions au sein du réseau de neurones ar­ti­fi­ciels et d’optimiser l’al­go­rithme.

Ap­pren­tis­sage non supervisé

L’ap­pren­tis­sage non supervisé permet au réseau de détecter des motifs ou des struc­tures cachées dans les données sans in­ter­ven­tion humaine. On utilise à cet effet la règle d’ap­pren­tis­sage de Hebb ou la théorie de la résonance adap­ta­tive. De nos jours, la pratique se focalise sur des al­go­rithmes tels que l’al­go­rithme de descente sto­chas­tique.

Les réseaux de neurones ar­ti­fi­ciels et leurs ap­pli­ca­tions

Les réseaux de neurones ar­ti­fi­ciels sont un outil puissant dans les cas où l’on est confronté à une grande quantité de données sans savoir au préalable vers quoi doit s’orienter la solution. On les utilise ty­pi­que­ment dans le domaine de la re­con­nais­sance d’écriture, d’image et de voix, où un système in­for­ma­tique recherche certaines ca­rac­té­ris­tiques afin de procéder à leur af­fec­ta­tion.

Les réseaux neuronaux con­vo­lu­tifs (CNN) sont par­ti­cu­liè­re­ment efficaces pour l’analyse d’images et per­met­tent aux or­di­na­teurs d’iden­ti­fier des objets ou des visages. Cette tech­no­lo­gie est par exemple utilisée dans l’analyse d’images médicales ou dans le contrôle de qualité au­to­ma­tisé dans l’industrie. Là, les réseaux neuronaux sont en partie utilisés comme technique de ré­gu­la­tion, dans laquelle ils sur­veil­lent des valeurs de consigne et prennent des contre-mesures au­to­ma­ti­sées en cas d’écarts ou dans laquelle ils pres­cri­vent de manière autonome des valeurs de consigne sur la base de leur éva­lua­tion des données.

Les modèles lin­guis­tiques tels que ChatGPT, basés sur des réseaux neuronaux ar­ti­fi­ciels, génèrent des textes réalistes, répondent à des questions ou analysent de grandes quantités de données tex­tuelles.

Les réseaux neuronaux ar­ti­fi­ciels peuvent également être utilisés pour dé­ter­mi­ner des pré­vi­sions et créer des si­mu­la­tions, par exemple dans les pré­vi­sions mé­téo­ro­lo­giques ou les diag­nos­tics médicaux. Les réseaux neuronaux con­vo­lu­tifs per­met­tent ainsi aux or­di­na­teurs de re­con­naître le contenu d’images. Cette tech­no­lo­gie est utilisée dans l’analyse d’images médicales, par exemple pour iden­ti­fier des tumeurs sur des ra­dio­gra­phies.

Le dé­ve­lop­pe­ment de l’ap­pren­tis­sage non supervisé des réseaux de neurones ar­ti­fi­ciels permet aujourd’hui d’élargir con­si­dé­ra­ble­ment leurs per­for­mances et leur champ d’ap­pli­ca­tion. L’exemple très connu de la synthèse vocale figure parmi les ap­pli­ca­tions les plus im­por­tantes des réseaux de neurones ar­ti­fi­ciels à ap­pren­tis­sage au­to­ma­tique : des systèmes comme Alexa, Siri ou Google Assistant utilisent des réseaux neuronaux pour convertir le langage parlé en texte et y réagir. Les modèles de trans­for­meurs tels que GPT ou BERT ont ré­vo­lu­tionné la qualité des tra­duc­tions au­to­ma­tiques.

His­to­rique et pers­pec­tives d’avenir

Les réseaux de neurones ar­ti­fi­ciels ont fait leur ap­pa­ri­tion dans la sphère publique au cours des dix dernières années dans le cadre du débat sur l’in­tel­li­gence ar­ti­fi­cielle, mais la création de la tech­no­lo­gie elle-même remonte déjà à plusieurs décennies.

Les premières ré­flexions sur le sujet datent du début des années 1940. Warren McCulloch et Walter Pitts décrivent à l’époque un modèle basé sur la structure du cerveau humain et con­nec­tant des unités élé­men­taires. L’idée est alors de pouvoir effectuer presque toutes les fonctions arith­mé­tiques. En 1949, Donald Hebb développe la règle d’ap­pren­tis­sage qui portera son nom, utilisée aujourd’hui encore dans le fonc­tion­ne­ment de nombreux réseaux neuronaux.

En 1960, un premier réseau neuronal ar­ti­fi­ciel trouve une uti­li­sa­tion com­mer­ciale d’envergure mondiale en assurant le filtrage d’écho dans les té­lé­phones ana­lo­giques. La recherche dans ce domaine connaît par la suite un coup d’arrêt, lié d’une part aux con­clu­sions d’éminents scien­ti­fiques qui es­ti­maient que le modèle des réseaux de neurones ar­ti­fi­ciels ne pouvait pas servir à résoudre des problèmes majeurs, et d’autre part au fait qu’un ap­pren­tis­sage efficace né­ces­si­tait de disposer de grandes quantités de données nu­mé­riques, ce qui n’était pas le cas à l’époque.

Ce n’est qu’avec l’avènement du Big Data que la recherche a repris de manière con­sé­quente. L’in­tro­duc­tion de l’al­go­rithme de ré­tro­pro­pa­ga­tion a permis l’ap­pren­tis­sage de réseaux mul­ti­couches, qui a posé les bases des modèles modernes de Deep Learning. La com­bi­nai­son d’énormes quantités de données et de la puissance de calcul des pro­ces­seurs gra­phiques (GPU) modernes a conduit à une percée de la tech­no­lo­gie dans les années 2010. Des fra­me­works comme Ten­sor­Flow et PyTorch ont rendu le dé­ve­lop­pe­ment de réseaux neuronaux plus ac­ces­sible.

L’intérêt pour l’in­tel­li­gence ar­ti­fi­cielle et les réseaux neuronaux est revenu et la victoire d’un CNN au concours ImageNet en 2012 a marqué le début du Deep Learning moderne. Depuis, cette tech­no­lo­gie a connu une crois­sance ful­gu­rante et influence presque tous les domaines de l’in­for­ma­tique.

Le dé­ve­lop­pe­ment de cette tech­no­lo­gie se poursuit à un rythme effréné. Aussi pro­met­teurs que soient les résultats, les réseaux neuronaux ne sont pas la seule tech­no­lo­gie qui puisse im­plé­men­ter l’in­tel­li­gence ar­ti­fi­cielle dans les or­di­na­teurs. Ils ne re­pré­sen­tent qu’une pos­si­bi­lité, même s’ils sont souvent présentés dans le débat public comme la seule voie existante. Aujourd’hui, la recherche va au-delà des réseaux neuronaux ar­ti­fi­ciels clas­siques. Les modèles mul­ti­mo­daux combinant texte, image et parole et les approches visant à réduire la con­som­ma­tion d’énergie sont au centre des préoc­cu­pa­tions. Pa­ral­lè­le­ment, les réseaux de neurones ar­ti­fi­ciels sont de plus en plus intégrés dans des ap­pli­ca­tions quo­ti­diennes, des smart­phones aux appareils ménagers in­tel­li­gents.

Aller au menu principal