
EN SAVOIR PLUS
Fouille de données
Le DATA MINING (fouille de données), raccourci de "Extraction de Connaissances à partir de Données" ("Knowledge Discovery in Databases" en anglais - KDD), est un domaine très en vogue. En réalité, le data mining emmène plusieurs points nouveaux qui sont loin d'être négligeables : (1) des techniques d'analyse qui ne sont pas dans la culture des statisticiens, en provenance de l'apprentissage automatique (Intelligence artificielle), de la reconnaissance de formes (pattern recognition) et des bases de données; (2) l'extraction de connaissances est intégrée dans le schéma organisationnel de l'entreprise. Ainsi, les données ne sont plus issues d'enquêtes ou de sondages mais proviennent d'entrepôts construits pour une exploitation aux fins d'analyse, le DATAWAREHOUSE (entrepôts de données). D'une part, une réorganisation du flux de données au sein de l'entreprise devient nécessaire (l'enchaînement des bases de production, le Datawarehouse et les Datamarts); d'autre part, la capacité des méthodes statistiques à traiter de gros volumes devient un élément clé; (3) un autre dernier élément important, le traitement des données sort de plus en plus des fichiers plats "individus x variables", vers des données sous forme non structurée, le texte, les images et la vidéo. On parle de fouille de données complexes. Cette orientation attribue une place primordiale à la préparation des données.
Début: Jan 1, 2019
- COURSDM
- Début: