Le Machine Learning (aussi appelé « apprentissage automatique ») est un domaine de l’intelligence artificielle dans lequel des modèles informatiques apprennent à partir de données pour faire des prédictions ou prendre des décisions sans programmation explicite. Il n’intéresse pas seulement le monde scientifique et les entreprises technologiques comme Google ou Microsoft. Le monde du marketing peut également être transformé par les développements de l’intelligence artificielle.

Qu’est-ce que le Machine Learning ?

Par principe, les machines, les ordinateurs et les programmes ne fonctionnent que de la façon dont vous les avez préalablement configurés : « si le cas A survient, alors activer B ». Cependant, nos attentes à l’égard des systèmes informatiques modernes sont de plus en plus élevées et les programmes ne peuvent prévoir tous les cas imaginables ni imposer une solution à l’ordinateur. Il est donc nécessaire que le logiciel prenne des décisions de manière indépendante et réagisse de manière appropriée aux situations inconnues. Pour ce faire, des algorithmes doivent être disponibles pour permettre aux programmes d’apprendre. Cela signifie que, dans un premier temps, le système doit être alimenté en données et, dans un second temps, établir des associations : c’est là le principe du Machine Learning.

Dans ce contexte, des termes connexes apparaissent régulièrement, qu’il convient de définir afin de mieux comprendre le concept d’apprentissage automatique.

AI Model Hub
Votre plateforme d'IA multimodale sécurisée
  • Conforme au RGPD et hébergée en toute sécurité en Europe
  • Modèles d'IA les plus puissants
  • Open source, sans vendor lock-in

Intelligence artificielle

La recherche sur l’intelligence artificielle (IA) tente de créer des machines capables d’agir comme des êtres humains : en effet, les ordinateurs et les robots sont censés analyser leur environnement et ainsi prendre la meilleure décision possible. Les robots doivent donc se comporter de manière « intelligente ». Mais cela soulève une question : quels critères devons-nous utiliser pour juger de notre propre intelligence ? Aujourd’hui, l’IA ne peut pas simuler l’être humain dans son entier (notamment l’intelligence émotionnelle). Au lieu de cela, des aspects partiels sont isolés afin de faire face à des tâches spécifiques. C’est ce que l’on nomme communément l’intelligence artificielle faible.

Depuis 2022, les systèmes utilisant l’IA générative comme les assistants IA (ChatGPT par exemple) ont connu une forte croissance. Ils sont basés sur des modèles de type transformateur (Transformer) capables de générer du texte, des images ou du code à partir d’énormes quantités de données. Néanmoins, il s’agit toujours de systèmes spécialisés qui ne possèdent pas de véritable intelligence générale.

Réseau neuronal

Une branche de la recherche sur l’intelligence artificielle, la neuro-informatique, tente de concevoir des ordinateurs davantage inspirés du cerveau. Elle considère les systèmes nerveux comme abstraits, c’est-à-dire libérés de leurs propriétés biologiques et confinés à leurs modes de fonctionnement. Les réseaux de neurones artificiels sont principalement des méthodes mathématiques abstraites. Un réseau de neurones (fonctions mathématiques ou algorithmes) est organisé à l’image du cerveau humain et peut s’attaquer à des tâches complexes. Les liens entre les neurones varient en force et peuvent s’adapter aux problèmes.

Le développement des réseaux neuronaux a conduit à l’essor du Deep Learning. Il s’agit de réseaux neuronaux complexes comportant de nombreuses couches (layers), très répandus aujourd’hui.

Big Data

Le terme de Big Data décrit simplement un énorme ensemble de données qui est d’une telle ampleur qu’il dépasse les capacités humaines d’analyse. La médiatisation croissante du Big Data ces dernières années est due à l’origine de ces données : en effet, dans de nombreux cas, le flot d’informations est créé à partir de données utilisateurs (intérêts, profils, données personnelles) collectées par des sociétés comme Google, Amazon ou Meta afin d’adapter plus précisément l’offre aux clients.

De tels volumes de données ne peuvent plus être évalués de manière satisfaisante par les systèmes informatiques traditionnels : les logiciels conventionnels ne trouvent que ce que l’utilisateur recherche. C’est la raison pour laquelle il faut désormais des systèmes d’apprentissage automatique qui permettent de découvrir et de réaliser des connexions inconnues jusqu’alors.

Data Mining

Le Data Mining consiste à analyser les données du Big Data. En effet, la collecte seule n’est pas encore d’une grande valeur : il faut y extraire les caractéristiques pertinentes et les évaluer. Le Data Mining se distingue du Machine Learning par le fait qu’il se préoccupe principalement de l’application de modèles reconnus, tandis que le second recherche de nouveaux modèles. Les méthodes de Data Mining comprennent par exemple les analyses de clusters, les arbres de décision, les méthodes de régression et les analyses d’association. Aujourd’hui, le Data Mining fait souvent partie des systèmes de Business Intelligence ou sert à l’analyse prédictive pour prédire le comportement des clients ou les tendances du marché.

Comparaison des différentes méthodes de Machine Learning

Fondamentalement, les développeurs distinguent le Deep Learning de l’apprentissage supervisé (Supervised Learning) et de l’apprentissage non supervisé (Unsupervised Learning). Les algorithmes utilisés sont très différents.

Supervised Learning

L’apprentissage supervisé, ou Supervised Learning, apporte des exemples au système. Les développeurs spécifient la valeur des informations, par exemple, si elles appartiennent à la catégorie A ou B. Le système d’apprentissage automatique en tire des conclusions, reconnaît les modèles et peut mieux gérer des données inconnues. L’objectif est de réduire davantage le taux d’erreur.

Un exemple connu d’apprentissage supervisé est le filtre anti-spam : le système examine des caractéristiques (features) pour décider si le courrier est envoyé à la boîte de réception ou bien s’il est déposé dans le dossier spam (courrier indésirable). Si le système fait une erreur, vous pouvez le corriger manuellement et le filtre ajustera ainsi ses futurs calculs. Le logiciel obtient donc ainsi de meilleurs résultats.

Unsupervised Learning

Dans l’Unsupervised Learning, c’est-à-dire l’apprentissage non supervisé, le programme essaie de reconnaître les modèles par lui-même. Il peut utiliser le clustering (partitionnement des données), par exemple : un élément est sélectionné parmi la quantité de données, examiné pour ses caractéristiques et ensuite comparé à celles déjà examinées. S’il a déjà examiné des éléments équivalents, l’objet courant y sera ajouté. Si ce n’est pas le cas, il est alors stocké séparément.

Des systèmes basés sur l’apprentissage non supervisé sont mis en œuvre dans les réseaux neuronaux. Des exemples d’application se trouvent dans la sécurité réseau : un système d’apprentissage automatique détecte les comportements anormaux. Par exemple, si une cyberattaque ne peut pas être attribuée à un groupe connu, le programme peut alors détecter la menace et signaler un problème.

En plus de ces deux domaines principaux, il existe aussi l’apprentissage semi-supervisé (Semi-supervised Learning), l’apprentissage par renforcement (Reinforcement Learning), l’apprentissage actif (Active Learning) et l’apprentissage auto-supervisé (Self-supervised Learning) : ces quatre méthodes sont plus étroitement liées à l’apprentissage supervisé et diffèrent au niveau du type et de l’étendue de la participation des utilisateurs. L’apprentissage auto-supervisé, dans lequel les systèmes génèrent eux-mêmes les tâches d’apprentissage sans la participation des utilisateurs, est particulièrement pertinent aujourd’hui.

Deep Learning

Contrairement aux algorithmes classiques de Machine Learning comme les arbres de décision ou les machines à vecteurs de support, le Deep Learning utilise des réseaux neuronaux multicouches pour traiter des données complexes, souvent non structurées (images, audio, texte).

Ces dernières sont complexes, car il s’agit d’informations naturelles, par exemple celles qui se produisent dans la parole, l’écriture ou la reconnaissance faciale. Les données naturelles sont faciles à traiter pour les humains, mais pas pour une machine, car elles sont difficiles à appréhender mathématiquement.

Le Deep Learning et les réseaux de neurones artificiels sont étroitement liés. Ce terme désigne l’entraînement de réseaux neuronaux profonds ; on le nomme de cette manière parce que le réseau de neurones est organisé en plusieurs niveaux hiérarchiques. Le premier niveau commence par une couche de neurones d’entrée. Ils enregistrent les données, commencent leur analyse et envoient leurs résultats au nœud neuronal suivant. À la fin, l’information de plus en plus affinée atteint la couche de sortie et le réseau délivre une valeur. Les niveaux parfois très nombreux situés entre l’entrée et la sortie sont appelés couches cachées (hidden layers).

Comment fonctionne le Machine Learning pour le marketing ?

Le Machine Learning a déjà des fonctions importantes pour le marketing. Actuellement, ce sont surtout les grandes entreprises qui utilisent en interne ces technologies, notamment Google. Les grands acteurs du numérique développent leurs propres systèmes et jouent un rôle moteur dans ce domaine. Cependant, malgré l’intérêt commercial, certains optent pour une approche open source et travaillent de concert avec des scientifiques indépendants. Les avancées sur le terrain deviennent de plus en plus importantes et s’accélèrent.

Analyses de données et prévisions

Outre l’aspect créatif, le marketing a aussi un aspect analytique : les statistiques sur le comportement des clients jouent un rôle important dans le choix de mesures publicitaires spécifiques. Plus la quantité de données est importante, plus on peut généralement en tirer des règles, des conclusions. C’est ici que les systèmes d’apprentissage automatique entrent en jeu : les programmes informatiques intelligents reconnaissent les tendances et peuvent ainsi donner des prédictions, qui pourraient être biaisées si elles étaient réalisées par des humains.

En effet, un analyste aborde habituellement la masse de données avec une certaine attente. Ces idées préconçues sont bien difficilement évitables pour l’humain et provoquent souvent des distorsions au niveau des résultats. Plus la quantité de données traitées par les analystes est élevée, plus l’écart est susceptible d’être important. Même si les machines intelligentes peuvent aussi avoir des préjugés, parce que ces derniers ont été formés de manière involontaire par des humains, mais avec des faits concrets, elles procèdent de manière plus objective et fournissent donc généralement des analyses plus significatives et pertinentes.

Visualisation

Les systèmes d’apprentissage automatique améliorent et facilitent aussi la présentation des résultats d’analyse. La visualisation automatisée des données (Automated Data Visualization) est une technique dans laquelle l’ordinateur sélectionne automatiquement la bonne présentation des données et des informations. Cela est important pour que les personnes puissent bien comprendre les résultats de la machine. Dans le flot de données, il devient parfois difficile d’afficher et d’organiser les résultats. Ainsi, la visualisation doit également être automatisée et reposer sur des algorithmes.

Personnalisation et design génératif

Le Machine Learning peut aussi avoir une influence sur la création du contenu : c’est le design génératif. Au lieu de concevoir le même parcours client pour tous les utilisateurs, les systèmes dynamiques basés sur le Machine Learning peuvent créer des expériences individuelles. Le contenu du site Web affiché à l’utilisateur est toujours créé par des rédacteurs et des concepteurs, mais le système intègre les composants spécifiquement pour l’utilisateur. Les systèmes d’apprentissage automatique sont aussi utilisés pour concevoir des designs ou rédiger des contenus par eux-mêmes : avec le projet Dreamcatcher, il est par exemple possible de faire concevoir des composants par une machine. Les LLM (Large Language Model comme ChatGPT peuvent également créer des textes pour des sites Web adaptés à des groupes d’utilisateurs spécifiques.

Chatbots intelligents et traitement du langage

Le Machine Learning peut notamment être utilisé pour améliorer les chatbots. De nombreuses entreprises utilisent déjà des programmes qui gèrent une partie du support client via un chatbot. Mais dans de nombreux cas, les utilisateurs sont rapidement ennuyés par ces derniers. Un chatbot basé sur un système d’apprentissage automatique avec une bonne compréhension du langage (Natural Language Processing) peut donner aux clients le sentiment qu’ils communiquent avec une personne réelle, et ainsi réussir le test de Turing.

Recommandations personnalisées

Amazon ou Netflix montrent l’exemple d’un autre développement du Machine Learning pour les spécialistes du marketing : les recommandations. Un facteur important pour le succès de ces fournisseurs est de prédire le prochain souhait de l’utilisateur. En fonction des données collectées, les systèmes d’apprentissage automatique peuvent recommander d’autres produits. Ce qui n’était auparavant possible que sur une grande échelle (« Nos clients aiment le produit A, donc la plupart d’entre eux aimeront aussi le produit B. ») est maintenant également possible sur une petite échelle grâce à des programmes modernes (« Le client X a aimé les produits A, B et C, c’est pourquoi il aimera probablement aussi le produit D. »)

Ainsi, pour résumer, les systèmes de Machine Learning influenceront le marketing en ligne de quatre manières :

  • Quantité : les programmes qui fonctionnent avec le Machine Learning et qui ont été bien entraînés peuvent traiter d’énormes quantités de données et faire des prévisions pour l’avenir.
  • Rapidité : l’analyse prend du temps, si vous devez la faire manuellement. Les systèmes d’apprentissage automatique augmentent la vitesse de travail et vous permettent de réagir plus rapidement aux changements.
  • Automatisation : le Machine Learning facilite l’automatisation des opérations. Comme les systèmes modernes peuvent s’adapter de manière autonome aux nouvelles conditions grâce au Machine Learning, des processus d’automatisation complexes sont également possibles.
  • Individualité : les programmes informatiques peuvent servir d’innombrables clients. Comme les systèmes d’apprentissage automatique collectent et traitent les données des utilisateurs individuels, ils peuvent également leur apporter des conseils personnalisés.

Autres domaines d’application des systèmes d’apprentissage automatique

Le Machine Learning est de plus en plus utilisé dans le marketing, mais aussi dans de nombreux autres domaines. Dans certains cas, ces systèmes aident la science et la technologie à faire avancer les progrès. Ils sont également utilisés sous la forme de gadgets parfois plus grands, parfois plus petits, pour simplifier notre vie quotidienne. Les domaines d’application présentés ici ne sont que des exemples : on peut supposer que le Machine Learning affectera notre vie entière dans un avenir proche.

Science

Ce qui s’applique au marketing est encore plus important dans les sciences naturelles. Le traitement intelligent du Big Data est un énorme soulagement pour les scientifiques qui travaillent empiriquement. Les physiciens des particules, par exemple, peuvent utiliser les systèmes d’apprentissage automatique pour collecter et traiter bien plus de mesures, et détecter des écarts. Le Machine Learning aide aussi en médecine : déjà aujourd’hui, certains médecins utilisent l’intelligence artificielle pour le diagnostic et le traitement des patients. Il est aussi utilisé pour prédire le risque ou l’évolution du diabète ou des crises cardiaques, par exemple.

Robotique

Dans certains contextes, comme au sein des usines, les robots sont omniprésents. Ils aident notamment à automatiser les étapes de travail dans la production de masse. Cependant, ils n’ont souvent pas grand-chose à voir avec les systèmes intelligents, car ils ne sont programmés que pour l’étape de travail précise qu’ils effectuent. Si des systèmes d’apprentissage automatique sont utilisés en robotique, ces machines doivent également maîtriser de nouvelles tâches. Bien entendu, ces développements sont également très intéressants pour d’autres domaines : du voyage spatial à la maison, des robots dotés d’intelligence artificielle seront utilisés dans des domaines très variés.

Transport

L’un des produits phares du Machine Learning est la voiture autonome. Le fait que les véhicules peuvent manœuvrer de façon autonome en minimisant les accidents dans le trafic réel ne peut être réalisé que par le Machine Learning, puisqu’il est impossible de programmer toutes les situations. Pour cette raison, il est impératif que les voitures autonomes reposent sur cette technologie. Des algorithmes intelligents, sous la forme de réseaux neuronaux artificiels, peuvent analyser le trafic et développer des systèmes de gestion du trafic plus efficaces, par exemple grâce à des feux de signalisation intelligents.

Internet

Le Machine Learning joue déjà un rôle majeur sur Internet : les filtres anti-spam en font partie. Grâce à un apprentissage constant, les filtres pour les emails indésirables sont plus performants et éliminent les spams de manière plus fiable depuis la boîte de réception. Il en va de même pour la défense intelligente contre les virus et logiciels malveillants, qui protège mieux les ordinateurs contre les logiciels malveillants. Les algorithmes de classement des moteurs de recherche, en particulier RankBrain de Google, sont également des systèmes d’apprentissage automatique. Même si l’algorithme ne sait pas quoi faire de la saisie de l’utilisateur (parce que personne n’a effectué la même recherche auparavant), il peut deviner ce qui pourrait convenir à la requête.

Assistants personnels

Même dans notre quotidien à la maison, les systèmes informatiques apprenants gagnent en importance. De simples appartements deviennent dorénavant des smart homes, c’est-à-dire des maisons intelligentes. Moley Robotics développe ainsi une cuisine intelligente capable de préparer des repas. Des assistants personnels tels que Google Home et Amazon Echo, avec lesquels certaines parties de la maison peuvent être contrôlées, utilisent le Machine Learning pour comprendre au mieux les utilisateurs. Mais beaucoup de gens emportent leurs assistants avec eux à tout moment : avec Siri, Copilot, Gemini ou Google Assistant, les utilisateurs peuvent utiliser la commande vocale pour envoyer des commandes et poser des questions à leur smartphone.

Jeux

Depuis le début de la recherche sur l’intelligence artificielle, la capacité des consoles et logiciels de jeux a été une grande motivation pour les scientifiques. Aux échecs, aux dames ou au Go chinois (l’un des jeux de société les plus complexes), les systèmes d’apprentissage automatique se mesuraient contre des adversaires humains. Les développeurs de jeux informatiques utilisent également le Machine Learning pour rendre leurs jeux plus intéressants, comme pour créer un gameplay équilibré et s’assurer que les adversaires de l’ordinateur s’adaptent intelligemment aux comportements des joueurs.

L’histoire du Machine Learning

Les robots et automates sont une source d’intérêt depuis plusieurs siècles : la relation de l’être humain à la machine pensante a toujours oscillé entre crainte et fascination. Cependant, les réels progrès du Machine Learning ne commencèrent pas avant les années 50, à une époque où les ordinateurs n’en étaient encore qu’à leurs balbutiements et où l’intelligence artificielle ne pouvait que faire rêver. Au cours des deux siècles précédents, des théoriciens comme Thomas Bayes, Adrien Marie Legendre et Pierre-Simon Laplace avaient déjà jeté les bases de la recherche, mais il faut attendre les travaux d’Alan Turing pour parler concrètement d’apprentissage automatique des machines.

Citation

« Dans un tel cas, il faudrait admettre que les progrès de la machine n’avaient pas été prévus au moment où ses instructions initiales lui ont été données. Ce serait comparable à un élève qui aurait beaucoup appris de son maître, mais qui en aurait ajouté bien davantage par son propre travail. Lorsque cela se produit, j’estime qu’on est alors obligé de considérer que la machine fait preuve d’intelligence. » Alan Turing lors d’une conférence en 1947. (cité d’après B. E. Carpenter et R. W. Doran (eds.), A. M. Turing’s Ace Report of 1946 and Other Papers).

En 1950, Turing a développé une proposition de test d’intelligence artificielle : le test de Turing. Il s’agit d’une sorte de jeu dans lequel un ordinateur prétend être un être humain. Si la personne en face n’est pas capable d’identifier que son interlocuteur est en fait une machine, on considère alors que l’ordinateur a passé le test avec succès. Deux ans plus tard, Arthur Samuel a développé un ordinateur pouvant jouer aux dames tout en s’améliorant à chaque partie. Le programme avait donc la capacité d’apprendre. Enfin, en 1957, Frank Rosenblatt a développé le perceptron, un premier algorithme d’apprentissage ou réseau neuronal artificiel.

Plus récemment, IBM a développé Watson, un programme informatique qui possède un immense référentiel de connaissances et qui peut répondre aux questions posées en langage naturel. Google et Meta utilisent quant à elles le Machine Learning pour mieux comprendre les utilisateurs et offrir davantage de fonctionnalités.

Cet article vous a-t-il été utile ?
Aller au menu principal