Deep learning : le cerveau humain, un modèle à imiter

Si vous parlez avec Siri, Alexa ou l’assistant vocal de Google, vous utilisez déjà sans le savoir le deep learning (également appelé apprentissage profond). Sans cette méthode d’apprentissage automatique, les assistants vocaux, incapables de répondre correctement ni même de comprendre ce qu’on leur dit, n’existeraient tout simplement pas.

L’apprentissage profond n’est pas une nouveauté, mais les progrès importants réalisés ces dernières années lui permettent d'apporter une réelle valeur ajoutée, à tel point qu’il fait aujourd’hui partie intégrante de notre quotidien. Son développement continue d’ailleurs d’avancer à grands pas. Les géants du secteur, comme Google, investissent massivement dans ce domaine, et ce n’est pas uniquement pour nous permettre de tenir des conversations avec nos machines connectées. Les domaines d’application du deep learning sont en effet multiples.

Nous expliquons comment cette technologie fonctionne, ses forces et ses faiblesses, et quels sont les domaines d’application qui émergent aujourd’hui et à l’avenir.

Qu'est-ce que le Deep Learning ?

Pour mériter d’être qualifiés d’« intelligents », les ordinateurs doivent être capables de se former de manière autonome au domaine dans lequel ils sont spécialisés. L’apprentissage profond relève de la recherche scientifique sur l’intelligence artificielle. Il appartient plus précisément au domaine de l’apprentissage machine.

Définition: deep learning

Également nommé apprentissage profond, est un sous-domaine de l’apprentissage machine, qui repose sur le traitement par les ordinateurs de grandes quantités de données à l’aide de réseaux de neurones artificiels dont la structure imite celle du cerveau humain. Chaque fois que de nouvelles informations sont intégrées, les connexions existantes entre les neurones sont susceptibles d’être modifiées et étendues, ce qui a pour effet de permettre au système d’apprendre les choses sans intervention humaine, de manière autonome, tout en améliorant la qualité de ses prises de décision et de ses prévisions.

On utilise des réseaux de neurones artificiels, constitués d’une couche de neurones d’entrée, d’une ou plusieurs couches intermédiaires et d’une couche de sortie, pour le traitement des informations. L’information entrante, ou vecteur d’entrée, atteint la couche d’entrée ; elle est ensuite transmise par les neurones artificiels aux couches intermédiaires, où elle se voit attribuer un « poids » ; enfin, elle adopte un certain motif lorsqu’elle atteint la couche de sortie. Plus un réseau de neuronal artificiel contient de couches, plus l’IA peut entreprendre des tâches complexes.

Exemple : la reconnaissance d’images

Pour un ordinateur, trier des images en fonction de ce qu’elles représentent (par exemple, des chiens, des chats ou des êtres humaines, est une tâche difficile. N’importe qui est capable de faire la différence au premier coup d’œil. De son côté, l’ordinateur doit d’abord procéder à une analyse dans le but d’identifier les caractéristiques de chaque image.

Dans le cadre de l’apprentissage profond, l’information d’entrée (ici une image) est analysée couche après couche. Par exemple, la première couche d'un réseau de neurones artificiel peut vérifier la couleur des pixels de l’image. Chaque pixel est alors traité par un neurone différent. Dans la couche suivante, ce sont les contours et les formes qui sont éventuellement identifiés, puis des caractéristiques encore plus complexes dans la suivante.

Les informations ainsi collectées sont cartographiées de façon à constituer un algorithme flexible. Le résultat de l’analyse d’une couche est transmis à la couche suivante et, ce faisant, modifie l’algorithme. L’ordinateur est ainsi capable, au terme d’une multitude d'opérations, de déterminer si une image appartient à la catégorie « chien », « chat » ou « être humain ».

Au début du processus, le système reçoit des instructions humaines qui visent à corriger les éventuelles erreurs d'allocation. L'algorithme est modifié en conséquence. Ce n’est qu’après cette phase que le système acquiert la capacité d’améliorer de manière autonome sa reconnaissance d'image. En modifiant les connexions établies entre les neurones du réseau et en ajustant la pondération des variables à l'intérieur de l’algorithme, on arrive à faire en sorte que la variation des motifs d'entrée (par exemple des images de chats présentées de façons différentes) conduise de plus en plus aux mêmes modèles de sortie (détection du chat), sans erreur. Plus on nourrit le système d’images à « apprendre », plus il peut s’améliorer.

Pour un observateur extérieur, il n’est pas toujours possible de comprendre quels motifs ont été reconnus par l'ordinateur en apprentissage profond pour aboutir à sa prise de décision. C’est d’autant plus difficile que le système lui-même optimise en permanence ses propres règles de prise de décision.

Histoire de l’apprentissage profond

L’expression « deep learning » est relativement récente, puisqu’elle n’est apparue pour la première fois qu’au début des années 2000. En revanche, la méthode elle-même, le concept d’utilisation de réseaux de neurones artificiels pour permettre aux ordinateurs de prendre des décisions intelligentes, remonte à plusieurs décennies.

Les débuts de la recherche fondamentale dans ce domaine datent des années 1940. C’est dans les années 1980 que de véritables réseaux de neurones artificiels ont été développés pour la première fois. Toutefois, la qualité de la prise de décisions s’est révélée décevante à l’époque. En effet, pour être efficace, l’apprentissage profond nécessite de nourrir l’ordinateur de grandes quantités de données sous format numérique, ce qui n’était tout simplement pas possible à l’époque. Ce n’est qu’au tournant du millénaire, avec l’arrivée du big data, que la recherche appliquée en deep learning a repris son essor avec le soutien des entreprises.

Forces et faiblesses

L’apprentissage profond a permis d’augmenter considérablement la puissance des intelligences artificielles. L’attention que lui portent les médias et le grand public est donc tout à fait justifiée. Mais pour que cette technologie réalise son plein potentiel, il convient de corriger certaines de ses faiblesses.

Les points forts de l’apprentissage profond

L’un des arguments les plus forts en faveur du deep learning repose sur la qualité des résultats obtenus. Dans les domaines de la reconnaissance d’image et du traitement de la parole, cette technologie est nettement supérieure à toutes les autres. À condition de disposer de données de haute qualité, l’apprentissage profond permet d’effectuer des tâches routinières de manière beaucoup plus efficace et rapide que n’importe quelle autre méthode, sans aucun signe de fatigue et avec une qualité constante.

D’autres formes d’apprentissage machine nécessitent une intervention des développeurs pour analysent les données brutes et définir régulièrement des caractéristiques supplémentaires que l’algorithme doit prendre en compte pour améliorer la puissance prédictive de l’IA. Dans l’apprentissage profond, c’est le système lui-même qui identifie les variables utiles et les intègre dans son processus d’apprentissage. Au terme d’une phase d’instruction initiale, il est capable de se former de façon autonome, sans intervention humaine. Cette conception permet d’économiser du temps et de l’argent, puisqu’il n’est pas nécessaire d’y affecter un personnel qualifié pour garantir le développement de ses fonctionnalités.

Par le passé, il fallait insérer manuellement de grandes quantités de données pour permettre l’apprentissage machine. Par exemple, dans le cas de la reconnaissance d’images de chiens et de chats, des préparateurs étaient chargés d'alimenter la machine en images à la main. Avec le deep learning, cette phase d’instruction manuelle est beaucoup plus courte. C’est un facteur d’une importance non négligeable. En effet, dans l'économie réelle, les entreprises acquièrent quotidiennement de grandes quantités de données, mais il n’arrive que très rarement qu’elles soient disponibles sous une donnée structurée (numéros de téléphone, adresses, cartes de crédit, etc.). Elles sont généralement stockées sous un format non structuré (photos, documents, emails, etc.). Contrairement aux méthodes alternatives d’apprentissage machine, l’apprentissage profond est capable d’analyser différentes sources de données non structurées en fonction de la tâche à accomplir.

L’argument selon lequel cette technologie est trop coûteuse pour une production de masse perd de sa force. De plus en plus de services comme Google Vision Site de Google Vision ou IBM Watson permettent aux entreprises de s’appuyer sur des réseaux de neurones artificiels existants, au lieu de devoir les développer à partir de zéro. Ce sont ces points forts qui permettront au deep learning de s’imposer dans le monde de l’entreprise.

Les points forts en un coup d'œil

  • Meilleurs résultats qu’avec d’autres méthodes d’apprentissage machine
  • Aucun développement manuel des fonctionnalités nécessaire, aucun étiquetage des données nécessaire
  • Exécution efficace des tâches de routine, sans écarts de qualité
  • Traitement des données non structurées
  • Diversification des services visant à simplifier l’utilisation des réseaux de neurones artificiels

Les faiblesses de l’apprentissage profond

L’apprentissage profond nécessite une énorme puissance de calcul, à la fois pour assurer la maintenance des réseaux de neurones artificiels et pour traiter la grande quantité de données requises. Cette puissance de calcul dépend dans une large mesure à la fois de la complexité et de la difficulté de la tâche à résoudre et de la masse de données utilisée. Jusqu’à présent, cette technologie se révélait donc coûteuse et par conséquent réservée au domaine de la recherche et à quelques géants du secteur.

Des progrès ont certes été réalisés dans ce domaine. Malgré tout, ce qui n’est pas près de changer, c’est le fait qu’il n’est pas possible de comprendre dans le détail la motivation des décisions prises via deep learning. Le réseau de neurones artificiels reste pour l’essentiel, jusqu’à nouvel ordre, une sorte de boîte noire. Cette technologie n’est donc pas utilisable pour le moment dans toutes les applications où la traçabilité est un enjeu crucial.

Pour fonctionner correctement, le deep learning doit pouvoir s’appuyer sur un grand nombre de données. Dans le cas contraire, aucun ordinateur n’est pour l’instant capable de donner de bons résultats par deep learning. Il est vrai qu’il existe désormais des bibliothèques de réseaux neuronaux artificiels, mises à disposition du grand public pour simplifier l'utilisation du deep learning. Il existe cependant certaines limitations : ces services ne conviennent pas à tous les cas d’utilisation de l’apprentissage profond, de sorte qu’il reste nécessaire d’investir beaucoup de temps dans l'élaboration des algorithmes, voire plus de temps que les méthodes alternatives d’apprentissage machine.

Les faiblesses en un coup d’œil

  • Nécessite une grande puissance de calcul
  • Le développement d’algorithmes d’apprentissage prend un temps relativement long
  • Nécessite une vaste base de données
  • Davantage de données d’instruction initiales requises qu’avec d’autres méthodes d'apprentissage machine
  • Décisions difficilement ou pas du tout compréhensibles (boîte noire)

Domaines d’application du deep learning

Le deep learning est déjà utilisé dans un certain nombre de secteurs et est appelé à investir de nombreux aspects de notre vie quotidienne à l’avenir.

Expérience d’utilisateur

Certains chatbots (agents conversationnels) ont déjà été optimisés par apprentissage profond, ce qui leur permet de mieux répondre aux demandes des clients et de soulager les services clients.

Assistants vocaux

Le fonctionnement de divers assistants vocaux existants, comme Siri, Alexa ou celui de Google, repose sur le deep learning. Cela leur permet d’étoffer de manière autonome leur vocabulaire et de renforcer leur compréhension du langage.

Traductions

L’apprentissage profond est déjà à l’œuvre dans certains programmes de traduction automatique. Cette technologie permet en effet de reconnaître automatiquement, à partir de fichiers d’image, la langue d’un texte, ce qui n’était pas possible avec les anciennes applications d’apprentissage automatique, qui utilisaient des données structurées.

Rédaction de textes

Un ordinateur est capable d’utiliser le deep learning pour rédiger un texte qui soit non seulement grammaticalement et orthographiquement correct, mais également fidèle au style d'un auteur donné - à condition bien sûr de recevoir suffisamment de matériel pour procéder à son apprentissage. Certains systèmes d'IA ont ainsi rédigé des articles pour Wikipédia et produit des textes aux sonorités shakespeariennes grâce à l’apprentissage profond.

Cybersécurité

Les systèmes d’IA s’appuyant sur le deep learning sont particulièrement adaptés à la détection d’irrégularités dans les activités d’un système en raison de leur capacité de se former en continu et de manière autonome. C’est une méthode désormais éprouvée pour repérer d'éventuelles attaques de pirates informatiques. Avec les systèmes de vidéosurveillance, les sites particulièrement vulnérables aux vols, comme les aéroports par exemple, peuvent renforcer leur sécurité grâce à l’intervention d’un ordinateur capable de repérer des anomalies dans le fonctionnement normal du site au quotidien.

Finances

Cette capacité à détecter les anomalies se révèle particulièrement utile dans le domaine sensible des transactions financières. Sous réserve d’instruire l’algorithme en conséquence, il est possible de repousser les attaques contre les réseaux bancaires et de repérer les fraudes à la carte de crédit de façon plus efficace qu'auparavant.

Marketing et ventes

Les systèmes d’IA peuvent utiliser l’apprentissage profond pour analyser les sentiments des clients : ils sont capables de passer au crible les messages des clients (par chat ou par email) pour repérer s’ils sont en colère, de façon à pouvoir déterminer leur degré d’urgence à l’intention des collaborateurs chargés du traitement des plaintes.

Ces systèmes pourraient également prendre des mesures automatiques prédéfinies de manière indépendante visant à préserver la satisfaction des clients et prévenir toute résiliation de services. En analysant ses données collectées dans un CRM, les systèmes disposant d’une IA avec deep learning peuvent prévoir le comportement futur d’un client, ce qui permet de mettre en œuvre des mesures ciblées pour faire basculer une décision d’achat ou convaincre le client de ne pas résilier son contrat.

Conduite autonome

Le développement des voitures sans conducteur semble appelé à participer à la sécurisation de la circulation routière à l’avenir. Mais la technologie nécessaire existe déjà. Il s'agit ici du fruit de la combinaison de différents algorithmes d'apprentissage profond : par exemple, un algorithme reconnaît les panneaux de signalisation tandis qu'un autre se spécialise dans la localisation des piétons.

Robots industriels

Les robots dotés d’une IA avec deep learning pourraient être utilisés dans de nombreux secteurs industriels. Il suffirait à un système d’observer le comportement d’une personne pour faire fonctionner les machines, puis à optimiser de façon autonome le processus de production.

Maintenance

D’autres applications industrielles potentielles existent dans le domaine de la maintenance industrielle. En effet, dans les systèmes complexes, un grand nombre de paramètres doivent être surveillés en permanence pour assurer la sécurité des processus. Un apprentissage profond permettrait non seulement de veiller à permettre un fonctionnement sans erreur de systèmes complexes, mais aussi d’anticiper les interventions de maintenance nécessaires sur telle ou telle unité du système (maintenance prévisionnelle).

Médecine

Les IA à apprentissage profond ont la capacité de scanner les images avec beaucoup plus de précision qu'un œil humain, même entraîné. Par exemple, en imagerie de tomodensitométrie ou de radiographie, il est possible d’utiliser des systèmes intelligents pour détecter les maladies plus tôt qu'avant, ce qui améliore les chances de guérison des patients.

Deep learning : un grand potentiel, mais pas la panacée

Dans le discours public, on a parfois l’impression que l’apprentissage profond est l’avenir unique de l’IA. De fait, dans de nombreuses applications, le deep learning permet d’obtenir des résultats nettement meilleurs que les méthodes précédentes. L'énorme potentiel des réseaux de neurones artificiels est loin d'être pleinement exploité et leur application n’en est qu’à ses débuts.

Toutefois, le deep learning n'est pas la meilleure solution technologique à apporter à tous les problèmes. Il existe d'autres approches qui permettent de rendre les ordinateurs « intelligents », des solutions qui fonctionnent à partir d’ensembles de données plus petits et dont le processus de prise de décision reste analysable.

Certains chercheurs en intelligence artificielle sont convaincus que le deep learning n’est qu’un phénomène temporaire et sont convaincus qu’il existera à l'avenir de meilleures approches qui ne sont pas basées sur la structure du cerveau humain. La stratégie d'entreprise de Google montre qu'il ne faut pas négliger les voix critiques : l’apprentissage profond n’est qu’une partie de la stratégie de l’intelligence artificielle. Par ailleurs, d’autres méthodes d’apprentissage automatique, comme le développement des ordinateurs quantiques sont également à l’étude. L’avenir nous promet encore de belles surprises.