L’extraction de données encore nommée exploration de données est un moyen d’extraction de savoir dans des données énormes de façon semi-automatique ou automatique. Elle utilise des algorithmes issus de l’informatique, de l’intelligence artificielle et des statistiques pour faire des modèles à partir des données et en extraire des connaissances. Ainsi, il existe plusieurs méthodes utilisées pour faire l’extraction de données dont les plus populaires sont les suivantes :
La méthode CRISP-DM (Cross Industry Standard Process for Data Mining)
La méthode CRISP-DM est une méthode basée sur l’extraction des connaissances métiers. Si elle est considérée comme un processus, elle procure un aperçu du cycle de vie du Data Mining et si elle est considérée comme une méthode, cette méthode partage la fouille de données en 6 phases :
En français cette méthode signifie : échantillonner, puis explorer, modifier, modéliser, évaluer. Elle est utilisée pour explorer des données de façon indépendante du logiciel utilisé. Elle est de SAS Institute et est destinée à la fouille de données.
La méthode Six Segma DMAIC (Define, Measure, Analyse, Improve, Control)
Cette méthode signifie définir, mesurer, analyser, améliorer et contrôler. Elle est très structurée et consiste à une orientation des données afin d’éliminer les défauts et redondances ainsi que les soucis de qualité dans les secteurs de la prestation de service, de la production, du management et de tant d’autres secteurs. Elle sert ainsi à faire une fouille de données.
Voici un script puppeteer pour capturer des emails qui sont présents dans youtube. Pour cela on fait une recherche une…
Automatisation des scripts avec le logiciel Automate Builder. Il est tout à fait possible de lancer un script Automate Builder…
L’aspiration des annuaires L’aspiration d’annuaires consiste à extraire ou capturer les données ou fichiers des entreprises enregistrées sur les annuaires…
Aspiration de données L’aspiration de données ou aspiration de sites web est une méthode qui permet la récupération totale ou…
Aspiration site petites annonces L’aspiration de site, comme son nom l’indique consiste à aspirer des sites, de les stocker dans…
Qu’est-ce que le Data Mining ? Le Data Mining englobe l’ensemble des outils qui facilitent l’extraction et l’analyse des données qui…