En règle générale, le data mining est associé auBig Data. Le Big Data, c’est l’ensemble des données qui ne peuvent plus être gérées manuellement, à cause de leur ampleur. Le traitement et l’analyse des données doivent donc être effectués à l’aide de méthodes informatisées. Le data mining est considéré comme une sous-étape du processus nommé Knowledge Discovery in Databases (soit la découverte de connaissances à l’aide des bases de données, en français). On dénombre les processus suivants :
- Le choix de la base de données
- Le prétraitement, dans le but d’amorcer un nettoyage des données
- Leur transformation dans la forme adéquate à leur traitement
- Le processus d’analyse mathématique (data mining)
- L’interprétation des résultats de l’analyse
Les connaissances qui auront pu être acquises grâce aux KDD (Knowledge Discovery in Databases) font partie intégrante du positionnement stratégique de tout modèle de commerce en ligne, ainsi que des décisions marketing qui en découlent. Les domaines d’application sont caractérisés par leur multiplicité.