Qu’est-ce qu’un réseau neuronal artificiel ?
Un réseau neuronal artificiel (en anglais : artificial neural network) est un système informatique dont la structure est inspirée du cerveau humain et qui dote les ordinateurs de caractéristiques d’intelligence artificielle. Les réseaux neuronaux en sont un élément central, et l’une des nombreuses méthodes utilisées dans les applications modernes d’IA, comme pour les chatbots.
Il existe différents types de réseaux neuronaux artificiels, chacun offrant différentes possibilités de traitement de l’information dans le contexte du Deep Learning. La recherche dans ce domaine a connu des avancées majeures au cours des dernières années. Les réseaux neuronaux constituent une technologie centrale pour apprendre aux machines à penser par elles-mêmes, ce qui permet aux ordinateurs de résoudre des problèmes de manière autonome et d’améliorer leurs capacités. Entre-temps, les réseaux neuronaux font partie de systèmes multimodaux qui peuvent combiner texte, image, audio et vidéo.
Comment fonctionne un réseau neuronal artificiel ?
Les réseaux neuronaux artificiels s’inspirent de la structure du cerveau humain, qui traite les informations via un réseau de neurones.
Les réseaux neuronaux artificiels sont généralement composés d’au moins trois couches : une couche d’entrée, une ou plusieurs couches cachées (hidden layers), et une couche de sortie. Les réseaux modernes tels que les réseaux neuronaux convolutifs (CNN) ou les modèles de transformeurs nécessitent souvent de nombreuses couches, même pour des tâches simples, car la profondeur contribue à leur efficacité. Chaque couche contient un grand nombre de neurones artificiels, chacun appliquant une transformation spécifique aux données d’entrée.
- Créez votre site Web en un temps record
- Boostez votre activité grâce au marketing par IA
- Gagnez du temps et obtenez de meilleurs résultats
Traitement de l’information dans le réseau de neurones artificiels
Au sein d’un réseau neuronal artificiel, le traitement de l’information suit toujours la même séquence : les informations sont transmises sous la forme de signaux aux neurones de la couche d’entrée, où elles sont traitées. Chaque connexion entre neurones est associée à un poids, qui détermine l’importance du signal transmis. Associé à la fonction dite de transfert, le poids permet de déterminer quelles informations peuvent entrer dans le système.
À l’étape suivante, une fonction dite d’activation associée à une valeur seuil calculent et pondèrent la valeur de sortie du neurone. En fonction de cette valeur, un nombre plus ou moins grand de neurones sont connectés et activés.
Ces connexions pondérées forment un modèle mathématique qui permet au réseau d’apprendre des relations entre les données. Chaque nouvelle itération permet d’ajuster la pondération et donc l’algorithme de façon à ce que le réseau donne à chaque fois un résultat plus précis et fiable.
Réseau neuronal artificiel : exemple d’application
Les réseaux de neurones artificiels peuvent être utilisés en matière de reconnaissance d’images. Contrairement au cerveau humain, un ordinateur ne peut pas déterminer d’un coup d’œil si une photographie montre un être humain, une plante ou un objet. Il est obligé d’examiner l’image pour en discerner les caractéristiques individuelles. C’est l’algorithme mis en place qui lui permet de savoir quelles caractéristiques sont pertinentes ; à défaut, il peut le découvrir par lui-même grâce à l’analyse des données.
Au sein de chaque couche du réseau de neurones, le système vérifie les signaux d’entrée, c’est-à-dire les images, décomposés en critères individuels tels que la couleur, les angles ou les formes. Chaque nouveau teste permet à l’ordinateur de déterminer avec plus de justesse ce que montre l’image.
Initialement, les résultats sont nécessairement sujets à un certain nombre d’erreurs. Si le réseau de neurones artificiels reçoit un retour d’information d’origine humaine qui lui permet ainsi d’adapter son algorithme, on parle de Machine Learning. Le concept de Deep Learning a pour but d’éliminer le besoin en intervention humaine. Le système apprend alors de sa propre expérience ; il s’améliore à chaque fois qu’une image lui est soumise.
En théorie, on obtient à l’arrivée un algorithme capable d’identifier sans erreur le contenu d’une photographie, qu’elle soit en couleurs ou en noir et blanc, quelle que soit la position du sujet ou l’angle sous lequel il est représenté.
Types de réseaux neuronaux
On fait appel à différentes structures de réseaux de neurones artificiels en fonction de la méthode d’apprentissage utilisée et de l’objectif recherché.
Perceptron
À l’origine, la forme la plus simple de « réseau » neuronal artificiel était composée d’un seul neurone modifié par des pondérations et doté d’une valeur seuil. Le terme « Perceptron » désigne un modèle simple de réseau neuronal, souvent utilisé comme base pour les réseaux de neurones à action directe (feedforward neural networks).
Réseaux de neurones à action directe
Un réseau de neurones à action directe ne peut transmettre l’information que dans un unique sens de traitement. Les réseaux peuvent être monocouches, c’est-à-dire constitués uniquement de couches d’entrée et de sortie, ou multicouches, c’est-à-dire disposant d’un certain nombre de couches cachées (hidden layers).
Apprenez-en plus sur les réseaux à action directe dans notre article dédié !
Réseaux de neurones récurrents
Dans les réseaux de neurones récurrents, il est possible de faire passer l’information dans des boucles de rétroaction, et ainsi de la faire revenir vers une couche précédente. Ces rétroactions permettent au système de se constituer une mémoire. Les réseaux de neurones récurrents sont utilisés par exemple en matière de reconnaissance vocale, de traduction et de reconnaissance d’écriture manuscrite.
Vous pouvez en apprendre plus sur le sujet dans notre article sur les réseaux neuronaux récurrents.
Réseaux de neurones convolutifs
Un réseau neuronal convolutif est un type de réseau multicouche. Il est composé d’un minimum de cinq couches. Sur chaque couche, une reconnaissance des formes est effectuée, le résultat d’une couche étant transféré à la suivante. Ce type de réseau neuronal artificiel est utilisé en matière de reconnaissance d’images.
Vous trouverez des informations plus détaillées à ce sujet dans notre guide sur les réseaux neuronaux convolutifs.
Méthodes d’apprentissage
Pour veiller à ce que les connexions au sein d’un réseau de neurones artificiels soient correctement établies, il faut au préalable procéder à son « entraînement ». On peut distinguer ici deux procédures de base : l’apprentissage supervisé et l’apprentissage non supervisé.
Apprentissage supervisé
L’apprentissage supervisé repose sur un ensemble de données annotées, où chaque entrée est associée à une sortie correcte permettant d’ajuster les poids du réseau. Par exemple, si on présente au système une photographie de chats afin qu’il la reconnaisse, il faut contrôler le fonctionnement du système et donner un retour d’information pour déterminer si l’image est correctement reconnue ou non. Cette méthode permet de modifier les pondérations au sein du réseau de neurones artificiels et d’optimiser l’algorithme.
Apprentissage non supervisé
L’apprentissage non supervisé permet au réseau de détecter des motifs ou des structures cachées dans les données sans intervention humaine. On utilise à cet effet la règle d’apprentissage de Hebb ou la théorie de la résonance adaptative. De nos jours, la pratique se focalise sur des algorithmes tels que l’algorithme de descente stochastique.
Les réseaux de neurones artificiels et leurs applications
Les réseaux de neurones artificiels sont un outil puissant dans les cas où l’on est confronté à une grande quantité de données sans savoir au préalable vers quoi doit s’orienter la solution. On les utilise typiquement dans le domaine de la reconnaissance d’écriture, d’image et de voix, où un système informatique recherche certaines caractéristiques afin de procéder à leur affectation.
Les réseaux neuronaux convolutifs (CNN) sont particulièrement efficaces pour l’analyse d’images et permettent aux ordinateurs d’identifier des objets ou des visages. Cette technologie est par exemple utilisée dans l’analyse d’images médicales ou dans le contrôle de qualité automatisé dans l’industrie. Là, les réseaux neuronaux sont en partie utilisés comme technique de régulation, dans laquelle ils surveillent des valeurs de consigne et prennent des contre-mesures automatisées en cas d’écarts ou dans laquelle ils prescrivent de manière autonome des valeurs de consigne sur la base de leur évaluation des données.
Les modèles linguistiques tels que ChatGPT, basés sur des réseaux neuronaux artificiels, génèrent des textes réalistes, répondent à des questions ou analysent de grandes quantités de données textuelles.
Les réseaux neuronaux artificiels peuvent également être utilisés pour déterminer des prévisions et créer des simulations, par exemple dans les prévisions météorologiques ou les diagnostics médicaux. Les réseaux neuronaux convolutifs permettent ainsi aux ordinateurs de reconnaître le contenu d’images. Cette technologie est utilisée dans l’analyse d’images médicales, par exemple pour identifier des tumeurs sur des radiographies.
Le développement de l’apprentissage non supervisé des réseaux de neurones artificiels permet aujourd’hui d’élargir considérablement leurs performances et leur champ d’application. L’exemple très connu de la synthèse vocale figure parmi les applications les plus importantes des réseaux de neurones artificiels à apprentissage automatique : des systèmes comme Alexa, Siri ou Google Assistant utilisent des réseaux neuronaux pour convertir le langage parlé en texte et y réagir. Les modèles de transformeurs tels que GPT ou BERT ont révolutionné la qualité des traductions automatiques.
Historique et perspectives d’avenir
Les réseaux de neurones artificiels ont fait leur apparition dans la sphère publique au cours des dix dernières années dans le cadre du débat sur l’intelligence artificielle, mais la création de la technologie elle-même remonte déjà à plusieurs décennies.
Les premières réflexions sur le sujet datent du début des années 1940. Warren McCulloch et Walter Pitts décrivent à l’époque un modèle basé sur la structure du cerveau humain et connectant des unités élémentaires. L’idée est alors de pouvoir effectuer presque toutes les fonctions arithmétiques. En 1949, Donald Hebb développe la règle d’apprentissage qui portera son nom, utilisée aujourd’hui encore dans le fonctionnement de nombreux réseaux neuronaux.
En 1960, un premier réseau neuronal artificiel trouve une utilisation commerciale d’envergure mondiale en assurant le filtrage d’écho dans les téléphones analogiques. La recherche dans ce domaine connaît par la suite un coup d’arrêt, lié d’une part aux conclusions d’éminents scientifiques qui estimaient que le modèle des réseaux de neurones artificiels ne pouvait pas servir à résoudre des problèmes majeurs, et d’autre part au fait qu’un apprentissage efficace nécessitait de disposer de grandes quantités de données numériques, ce qui n’était pas le cas à l’époque.
Ce n’est qu’avec l’avènement du Big Data que la recherche a repris de manière conséquente. L’introduction de l’algorithme de rétropropagation a permis l’apprentissage de réseaux multicouches, qui a posé les bases des modèles modernes de Deep Learning. La combinaison d’énormes quantités de données et de la puissance de calcul des processeurs graphiques (GPU) modernes a conduit à une percée de la technologie dans les années 2010. Des frameworks comme TensorFlow et PyTorch ont rendu le développement de réseaux neuronaux plus accessible.
L’intérêt pour l’intelligence artificielle et les réseaux neuronaux est revenu et la victoire d’un CNN au concours ImageNet en 2012 a marqué le début du Deep Learning moderne. Depuis, cette technologie a connu une croissance fulgurante et influence presque tous les domaines de l’informatique.
Le développement de cette technologie se poursuit à un rythme effréné. Aussi prometteurs que soient les résultats, les réseaux neuronaux ne sont pas la seule technologie qui puisse implémenter l’intelligence artificielle dans les ordinateurs. Ils ne représentent qu’une possibilité, même s’ils sont souvent présentés dans le débat public comme la seule voie existante. Aujourd’hui, la recherche va au-delà des réseaux neuronaux artificiels classiques. Les modèles multimodaux combinant texte, image et parole et les approches visant à réduire la consommation d’énergie sont au centre des préoccupations. Parallèlement, les réseaux de neurones artificiels sont de plus en plus intégrés dans des applications quotidiennes, des smartphones aux appareils ménagers intelligents.