Chaque jour, les entreprises modernes doivent gérer d’énormes volumes de données. Grâce au traitement électronique de l’information (TEI), la collecte et l’organisation des informations ne sont plus un problème. Les données personnelles des clients peuvent être enregistrées dans des bases de données et la gestion du personnel peut être automatisée. Le seul besoin est de fournir une quantité suffisante de données à l’ordinateur. Des algorithmes élaborés s’occupent ensuite de les traiter.
Cependant, l’expansion des réseaux et l’augmentation du volume de données font apparaître de nouveaux défis. Plusieurs employés d’une même entreprise doivent pouvoir accéder, parfois simultanément, à la même base de données. Les données ne doivent pas être enregistrées plusieurs fois et doivent rester accessibles en permanence. Par ailleurs, elles doivent être protégées contre toute perte liée à des défauts matériels ou de mauvaises manipulations, ainsi que contre les cyberattaques menées par des hackers ou des voleurs de données. Des aspects juridiques doivent également être respectés, tels que les périodes de rétention, les déclarations de consentement à l’enregistrement des données personnelles et la nomination de délégués à la protection des données.
La complexité de ces questions a donné naissance à une nouvelle discipline informatique : le « data management », ou gestion des données en français. Ce domaine est également devenu un objet d’étude pour la recherche, baptisé la science des données (« data science » en anglais). Elle couvre, entre autres, le stockage et la mise en relation rationnels des données, ainsi que la recherche au sein de bases de données volumineuses.