Prédire l’avenir avec précision grâce à des formules ma­thé­ma­tiques ? Cette ambition au­da­cieuse semble être à la portée de l'analyse pré­dic­tive. Cette méthode d'analyse de données est un sous-ensemble du Big Data. Elle vise à prédire des tendances futures, notamment dans le secteur du marketing, des finances, des as­su­rances et même de la santé.

Au cœur de l’analyse pré­dic­tive, on trouve les modèles. Une personne ou une unité va être mesurée pour prédire un possible com­por­te­ment futur. Un exemple concret serait une police d'as­su­rance qui anticipe les facteurs de risque d’un con­duc­teur, en incluant dans son calcul des facteurs tels que son ex­pé­rience de conduite, son âge et son état de santé. À partir de la somme de tous ces facteurs, l'analyse pré­dic­tive peut calculer le risque potentiel d'ac­ci­dents, et donc le montant de la prime d’assurance.

Le data mining : la base de diverses analyses

Dans la pratique, le terme de data mining est souvent utilisé à la place de l'analyse pré­dic­tive. La plupart du temps, les méthodes de data mining jouent en effet un rôle essentiel dans le processus de recherche des approches d’analyses pré­dic­tives. L’analyse pré­dic­tive affine cependant le fonc­tion­ne­ment du data mining et comprend des tech­niques sup­plé­men­taires. Des éléments de la théorie des jeux et de l'ap­pren­tis­sage au­to­ma­tique sont notamment pris en compte. En outre, sont également utilisées dans l'ap­pli­ca­tion de l'analyse pré­dic­tive des méthodes d'analyse spé­ci­fiques, qui sont basées sur des al­go­rithmes complexes afin de dégager un modèle re­con­nais­sable à partir de toutes les con­tri­bu­tions en apparence sans lien des médias sociaux ou articles de blog.

Remarque

Le data mining (ou ex­plo­ra­tion de données) cherche à définir des modèles en données larges à l'aide d'al­go­rithmes et de méthodes ma­thé­ma­tiques et sto­chas­tiques. Idéa­le­ment, les con­nais­sances ainsi acquises peuvent être utilisées pour iden­ti­fier et anticiper les tendances et des dé­ve­lop­pe­ments po­ten­tiels.

Afin de mieux com­prendre les fonc­tion­na­li­tés de l'analyse pré­dic­tive, il est utile de disposer d'un aperçu des termes courants utilisés :

  • Analyse de ré­gres­sion : les in­te­rac­tions entre diverses variables dé­pen­dantes et in­dé­pen­dantes sont iden­ti­fiées. Par exemple, les ventes vont dépendre du prix du produit et de la sol­va­bi­lité des clients.
  • Clus­te­ring : en seg­men­tant les données, les clients po­ten­tiels peuvent être classés selon leurs revenus ou d’autres facteurs si­mi­laires. Il s’agit d’un re­grou­pe­ment.
  • Analyse d'as­so­cia­tion : l'ob­jec­tif est d'iden­ti­fier les struc­tures dont les variables con­dui­sent à des résultats iden­tiques. Cela permet de tirer des con­clu­sions sur le com­por­te­ment éventuel des clients et, idéa­le­ment, de faire des pro­nos­tics sur les futurs achats.

La par­ti­cu­la­rité de l'analyse pré­dic­tive

Le fait de re­con­naître des tendances dans des ensembles de données fait penser à la faculté du cerveau humain à in­ter­pré­ter, bien que les analyses de Big Data dépassent largement ses capacités en termes de com­plexité. En fait, il existe un parallèle entre les struc­tures ap­pli­quées du data mining et les réseaux de neurones du cerveau humain, puisque les réseaux ar­ti­fi­ciels sont également capables d'iden­ti­fier et de stocker des modèles à la suite de certaines séquences. Par con­sé­quent, le data mining est fon­da­men­ta­le­ment lié à l'in­tel­li­gence ar­ti­fi­cielle. Dans ce processus, les pro­grammes in­for­ma­tiques ap­pren­nent de manière presque autonome grâce à des bases in­tro­duites et ac­quiè­rent de nouvelles in­for­ma­tions en fonction des nouveaux modèles dé­ve­lop­pés.

C’est ici que l’on peut observer une grande dif­fé­rence entre data mining et analyse pré­dic­tive. L'ex­plo­ra­tion de données classique vise ha­bi­tuel­le­ment à montrer les schémas struc­tu­rels sur des in­for­ma­tions et groupes existants. Cependant, l'accent mis sur un dé­ve­lop­pe­ment quasi au­to­di­dacte des calculs qui s'étend pro­gres­si­ve­ment au-delà du groupe de données (et qui est donc une ca­rac­té­ris­tique de l’in­tel­li­gence ar­ti­fi­ciel) joue un rôle décisif dans la dé­fi­ni­tion de l'analyse pré­dic­tive. Les al­go­rithmes déjà existants doivent être combinés pour amener de nouvelles con­clu­sions et pouvoir prévoir par exemple des com­por­te­ments d’une cible d’acheteurs po­ten­tiels. Le « condensé » de ces enquêtes est appelé Smart Customer Data.

Ap­pli­ca­tions de l’analyse pré­dic­tive

L’in­tro­duc­tion de l’analyse pré­dic­tive a déjà fait ses preuves dans un large éventail de domaines et d’in­dus­tries. Outre les en­tre­prises de haute tech­no­lo­gie, le secteur de la santé, par exemple, utilise cette méthode pour anticiper les évo­lu­tions probables de certaines maladies. Le secteur de l'énergie est également un domaine d'ap­pli­ca­tion important, avec notamment le dé­ve­lop­pe­ment de réseaux élec­triques in­tel­li­gents, les « smart grids ». La con­som­ma­tion d'énergie peut en effet être estimée sur la base de schémas de com­por­te­ment des clients en­re­gis­trés (Smart Customer Data) afin de réguler avec précision l'apport né­ces­saire d'énergie éolienne et hy­droé­lec­trique.

La main­te­nance d’une machine est également prévue par les analyses pré­dic­tives. Ici, les données exis­tantes d'une machine en marche sont utilisées pour prédire sa charge future et son usure. Les points faibles de la chaîne de pro­duc­tion peuvent ainsi être ra­pi­de­ment iden­ti­fiés et réparés, afin d’éviter par exemple un arrêt total de cette pro­duc­tion.

Il est pré­fé­rable d'uti­li­ser l'analyse pré­dic­tive lorsque l'on dispose d’un bon nombre de paquets de données qui sont notamment très dif­fé­rents les uns des autres et les plus complets possibles. Tous les paquets de données sont ensuite intégrés dans l'analyse, et plus il y a de données provenant de domaines variés, plus les résultats seront précis. Voici quelques-uns des outils les plus po­pu­laires pour effectuer des analyses pré­dic­tives :

  • Alpine Data Labs
  • Alteryx
  • Angoss Know­led­geS­TU­DIO
  • BIRT Analytics
  • IBM SPSS Sta­tis­tics and IBM SPSS Modeler
  • KXEN Modeler
  • Ma­the­ma­tica
  • MATLAB

Pour aller un pas plus loin, on peut également effectuer des analyses pres­crip­tives (pres­crip­tive analytics). Cette méthode commence là où l'analyse pré­dic­tive atteint ses limites. Le but est de com­prendre des lignes di­rec­trices de com­por­te­ment pour tenter de les re­pro­duire de manière ciblée. Cette procédure est rendue possible grâce à des struc­tures ana­ly­tiques basées sur des modèles complexes et des si­mu­la­tions sto­chas­tiques de la méthode Monte-Carlo. Comme pour l'analyse pré­dic­tive, plus on utilise de variables connues et fiables dans ces modèles, plus les résultats seront per­ti­nents.

En résumé

Il existe d'in­nom­brables exemples de fonc­tion­ne­ment et d’ap­pli­ca­tions d’analyses pré­dic­tives. La méthode dépend de la quantité et de la qualité des données. Néanmoins, les al­go­rithmes utilisés sont de plus en plus finement maillés, ce qui signifie que les pré­dic­tions sont aussi de plus en plus précises. Ainsi, les analyses dites pres­crip­tives évoluent également dans ce sens, pour être également de plus en plus sûres.

Aller au menu principal