Les enjeux du Data Mining

Né de la recherche en intelligence artificielle au début des années 1990, le Data Mining (prospection ou fouille de données dans de très grandes bases de données) est un domaine des plus prometteurs (il est même parmi les 10 technologies clés du Massachusetts Institute of Technology, MIT, voire : http://www.fing.org/index.php?rubrique=article&num=873). Alors que les bases de données explosent en taille et en nombre, deux problèmes apparaissent : celui de la conservation des données et celui de leur exploitation. Le Data Mining répond à ce besoin. A l’heure actuelle, les applications du Data Mining sont surtout de nature commerciale. Nombre d’entreprises l’utilisent pour passer au crible les transactions et les dossiers de leurs clients. Grâce à de savantes combinaisons de diverses variables (démographiques, psychologiques, socioéconomiques, etc.), elles arrivent à extraire des informations inédites pour mieux gérer leurs stocks et cibler leurs efforts de marketing. Mais le Data Mining ne sert pas seulement à mieux connaître ses clients : les entreprises spécialisées dans la détection des fraudes utilisent aussi le Data Mining pour repérer, parmi les millions de transactions enregistrées chaque jour, les comportements inhabituels (changements de type d’achat, de lieux, etc.) qui peuvent suggérer, par exemple, qu’une carte de crédit n’est pas utilisée par son propriétaire légitime.
La prospection de données intéresse aussi les scientifiques : en astronomie, par exemple, elle permet d’analyser et de classifier les images de milliards d’objets célestes et d’attirer l’attention des astronomes sur ceux qui paraissent insolites ; en pharmacologie, Merck Frosst s’y intéresse pour tenter d’améliorer le processus d’identification des molécules thérapeutiques. La problématique du Data Mining repose sur "la malédiction de la dimensionalité", qui, quand il y a trop de données en jeux, ne permet pas de trouver une structure ou une régularité utile dans les données. Pour conjurer cette "malédiction", les mathématiciens travaillent à la mise au point d’outils de calcul qui doivent réduire le nombre de dimensions et ainsi permettre l’extraction de l’information cachée dans les myriades de combinaisons possibles. Mais, dans bien des cas, pour extraire de l’information à partir d’images, par exemple, les humains font encore beaucoup mieux que les machines. "Si nous pouvions comprendre comment les humains "fonctionnent", nous serions peut-être alors en mesure de construire des machines qui fassent aussi bien."
L’info : http://www.cybersciences.com/Cyber/4.0/2001/06/internet.asp
Data Mining Institute : http://www.cs.wisc.edu/dmi/

À lire aussi sur internetactu.net