Le Big Data est depuis longtemps sur toutes les lèvres et fais l’objet d’un vif débat. Alors que ses partisans sou­lig­nent la grande utilité de ces mé­ga­don­nées apparues avec la di­gi­ta­li­sa­tion, les critiques portent quant à elles sur la con­fi­den­tia­lité des in­for­ma­tions. Cependant, depuis l’affaire con­cer­nant les pratiques d’es­pion­nage di­vul­guées par le lanceur d’alertes Edward Snowden, les uti­li­sa­teurs sont de de plus en plus soucieux pour leurs données per­son­nelles. Ce que le citoyen peut entendre et lire sur le phénomène du Big Data est souvent négatif. Pourtant, la notion est bien plus complexe qu’elle ne le parait et c’est pourquoi une dé­fi­ni­tion du Big Data s’impose.

Le big data, c’est quoi ?

Le Big Data, soit lit­té­ra­le­ment « grosses données » est aussi nommé ma­gé­don­nées voire données massives. Ces données sont tellement complexes qu’un logiciel ou un disque dur classique n’est pas à même de les traiter. De plus, la notion de Big Data est vague étant donné qu’elle peut également faire référence à des quantités de données plutôt anodines provenant de la recherche. Sachant que les données ras­sem­blées portent sur les com­por­te­ments de con­som­ma­tion ou de com­mu­ni­ca­tion des in­ter­nautes, la notion est mal perçue. Les critiques con­si­dè­rent cette collecte de données comme une atteinte à leur droit privé.

Quelle est la taille du Big Data ?

La notion de Big Data désigne des ensembles de données qui n’ont pas de taille pro­pre­ment définie. Dans la pratique, le Big Data est souvent synonyme d’un important volume de données car même l’unité de mesure gigabit ne suffit pas à le mesurer.

Comment le Big Data est-il apparu ?

Le volume des données nu­mé­riques a pris une pro­por­tion con­si­dé­rable. Dix minutes en 2014 ont suffi pour générer autant de données que celles créées par l’humanité depuis 2002. D’après les pro­nos­tics, cette montagne de données est en crois­sance continue et a doublé en l’espace de deux ans. Son flux est dû à la nu­mé­ri­sa­tion crois­sante dans tous les domaines du Web. Le Big Data est né au moyen de la fusion de diverses sources de données telles que :

  • L’uti­li­sa­tion d’Internet sur les mobiles
  • Les réseaux sociaux
  • La géo­lo­ca­li­sa­tion
  • Le cloud
  • La mesure des données vitales
  • Le streaming des médias

Le Big Data ne fait pas seulement référence à des données mais aussi à leur analyse et leur uti­li­sa­tion. On essaye de trouver des modèles ainsi que ce qui les relie pour les placer dans un contexte réel. Le défi n’est pas seulement re­pré­senté par le grand volume de données mais aussi par la rapidité des trai­te­ments et la diversité des in­for­ma­tions. Le flux est continu au sein de données non struc­tu­rées. Elles sont col­lec­tées, stockées et tra­vail­lées si possible en temps réel. Une in­fras­truc­ture im­por­tante de données est donc né­ces­saire pour pouvoir les lire et les mettre cor­rec­te­ment en rapport.

Comment utiliser le Big Data ?

D’après la dé­fi­ni­tion du Big Data, les volumes de ces données sont si im­por­tants qu’un logiciel classique ne peut les tra­vail­ler. En traitant ces données massives, le programme se voit imposer certaines exigences tech­niques. Seuls certains Fra­me­works ont la capacité de les analyser. Le logiciel doit tra­vail­ler plusieurs lignes de données en une seule fois et faire en sorte de pouvoir importer ce grand volume de données le plus ra­pi­de­ment possible. Par ailleurs, il faut que le logiciel mette les données à la dis­po­si­tion des uti­li­sa­teurs en temps réel et si possible qu’il réponde en même temps à plusieurs requêtes de bases de données.

Hadoop est une solution open source connue. Son im­plé­men­ta­tion est complexe et ne se fait pas sans l’aide d’experts, les fameux « data scien­tists ». D’autres solutions provenant du cloud sont possibles. Voici un article qui vous permettra d’y voir plus clair sur les outils de Big Data.

Exemples d’uti­li­sa­tion de Big Data

Le Big Data est appliqué dans tous les domaines ayant rapport au Web. Un exemple d’outil de Big Data dans le domaine de l’e-commerce est la fameuse phrase « ceux qui ont acheté le produit X ont aussi acheté… ». Ces re­com­man­da­tions naissent à partir de l’éva­lua­tion de millions de données d’achats d’autres clients.

Voici les autres domaines qui profitent du Big Data :

  • La recherche médicale : grâce à l’éva­lua­tion des données massives, les médecins peuvent trouver de meil­leures solutions de thérapie et de trai­te­ment pour leurs patients.
  • L’industrie : grâce à l’uti­li­sa­tion des données de machines, les en­tre­prises peuvent augmenter l’ef­fi­ca­cité de leur pro­duc­tion et tra­vail­ler de manière plus durable.
  • Économie : le Big Data permet aux en­tre­prises de mieux connaître leurs clients et de leur proposer des offres mieux adaptées à leurs besoins.
  • Énergie : les données sur la con­som­ma­tion d’énergie per­met­tent à long terme d’adapter l’offre aux besoins des uti­li­sa­teurs dans le but de rendre l’ap­pro­vi­sion­ne­ment éner­gé­tique plus durable.
  • Marketing : le Big Data est utilisé dans le domaine du marketing pour mieux cibler les clients. Le but est d’améliorer les relations avec les con­som­ma­teurs et d’augmenter le taux de con­ver­sion via diverses mesures de marketing.
  • Lutte contre la cri­mi­na­lité : le gou­ver­ne­ment et les services de sécurité ont également recours au Big Data, par exemple dans le cadre de la lutte an­ti­ter­ro­riste.

Ce que l’on reproche au Big Data

La plupart des critiques con­cer­nent la pro­tec­tion des données. Les grandes bases de données per­met­tent aux en­tre­prises et aux marques de mieux adapter leurs stra­té­gies marketing. Néanmoins, il est aussi possible d’établir des profils d’uti­li­sa­teurs précis grâce aux données utilisées pour le ciblage. Les personnes res­pon­sables de la pro­tec­tion des données voient cela comme une atteinte à la vie privée des in­ter­nautes. Celui qui travaille avec le Big Data doit ren­seig­ner les clients et les uti­li­sa­teurs de son site sur sa politique d’uti­li­sa­tion des données

Une autre critique est la « dictature des données ». En effet, le domaine des données massives fait face à ce qu’on appelle en anglais les « big players ». Il s’agit d’en­tre­prises qui tra­vail­lent depuis un certain nombre d’années avec des données et qui en font des bénéfices (comme Google et d’autres moteurs de recherche). Ainsi, ces sociétés ont un monopole en matière de données. Cette sou­ve­rai­neté est souvent critiquée et qualifiée d’atteinte à la vie privée à grande échelle. En effet, si aucune règle claire sur a pro­tec­tion des données per­son­nelles n’est établie et compte tenu de l’ano­ny­mi­sa­tion de ces in­for­ma­tions ré­cu­pé­rées, il n’est pas étonnant qu’une uti­li­sa­tion abusive des données des in­ter­nautes soit possible.

Pour une uti­li­sa­tion res­pon­sable du Big Data

En dépit de toutes les critiques sur le Big Data, son uti­li­sa­tion n’en demeure pas moins per­ti­nente mais à condition bien entendu que sa tech­no­lo­gie soit utilisée cor­rec­te­ment. Certains progrès scien­ti­fiques tels que la recherche sur le cancer n’auraient par exemple jamais étés possibles sans avoir recours au Big Data. Cela vaut également pour l’ap­pro­vi­sion­ne­ment en énergie mais aussi pour les pré­vi­sions de trafic qui sont ré­gu­liè­re­ment optimisés et qui nous per­met­tent une sécurité pri­mor­diale au quotidien. Cependant, malgré les op­por­tu­ni­tés dans ces domaines, beaucoup de questions d’éthique demeurent. En effet, il est par exemple possible de prévoir la con­trac­tion d’une maladie et cela génère des in­quié­tudes pour beaucoup. La po­pu­la­tion reste réservée et craint de plus en plus les sites que l’on nomme « pieuvres avides de données ».

Faces à ces questions so­cié­tales, les autorités publiques se préoc­cu­pent également du problème du Big Data. Elles con­si­dè­rent que la confiance et la trans­pa­rence des acteurs du Web est ac­tuel­le­ment centrale. Pourtant, la com­pré­hen­sion des codes in­for­ma­tiques est si complexe que la politique du « tout savoir » n’est pas per­ti­nente. La vraie question repose aujourd’hui sur l’éducation des citoyens, afin qu’ils puissent réagir de manière in­tel­li­gente face au Big Data.

Aller au menu principal