La fouille de données / Data mining

mercredi 23 juillet 2014
par  Romain DAVID

La fouille de donnée, aussi couramment appelée datamining, permet l’extraction d’un savoir ou d’une connaissance à partir de grandes quantités de données en utilisant des algorithmes supervisés ou totalement automatiques.

The data mining allows the extraction of knowledge or acquaintance from large amounts of data using supervised or fully automatic algorithms.

Le défi scientifique d’une meilleure compréhension globale des équilibres des Systèmes Socio-Ecologiques et de leur influence sur la biodiversité doit passer par la construction et le test de méthodes de co-interprétation de ces données hétérogènes. Les méthodes de fouille de données doivent pouvoir apporter de nouvelles perspectives aux recherches disciplinaires sur ces systèmes complexes qui étudient en fin de compte des objets intimement liés (chimie environnementale, génomique, transcriptomique, protéomique, métabolomique, écologie des peuplements, systèmes socio-écologiques, …, écologie du paysage sont quelques exemples).

The scientific challenge of better global understanding of the balance of Socio-Ecological Systems and their impact on biodiversity must go through the construction and testing of methods for joint interpretation of these heterogeneous data. Data mining methods must be able to bring new perspectives to the disciplinary research on these complex systems studying ultimately of interrelated objects (environmental chemistry, genomics, transcriptomics, proteomics, metabolomics, stands ecology, socio-ecological systems, ... landscape ecology are some examples).

Prérequis : Indexation des données, qualification de la donnée, traçabilité de la donnée
Prerequisites : indexing data, data qualification, data traceability

Outils : clustering supervisé ou non, algorithmes de graphes, écologie statistique, méthodes collaboratives
Tools : supervised clustering or not, graph algorithms, statistical ecology, collaborative methods

Résultat attendu : découverte de patterns (motifs) dans les conjonctions de valeurs de données ayant une signification scientifique
Expected Result : discovery of patterns (motifs) in the data values conjunctions with scientific significance

Perspectives : ce deuxième mode « non supervisé » laisse la possibilité de confronter les résultats de différents algorithmes pour obtenir un consensus, qui fait office de résultat / scenario le plus probable. La fouille de donnée permet de trouver des valeurs d’encadrement de scenarios par exemple, et fournit les descripteurs normés indispensables aux approches telles que le machine-learning
Perspectives : this second "unsupervised" mode leaves the possibility to compare the results of different algorithms to achieve consensus, which acts result / the most likely scenario. The data mining helps find managerial values such scenarios, and provides standardized descriptors essential for approaches such as machine learning


Agenda

<<

2017

 

<<

Octobre

 

Aujourd'hui

LuMaMeJeVeSaDi
2526272829301
2345678
9101112131415
16171819202122
23242526272829
303112345
Aucun évènement à venir les 6 prochains mois