Pierre Gançarski - Fouille de données hétérogènes en écologie : méthodes et challenges concernant les masses de Données

vendredi 16 octobre 2015
par  Romain DAVID

Abstract

Les grandes masses de données (Big Data) face auxquelles l’expert en écologie, qu’il soit chercheur, décideurs ou simplement utilisateur, nécessite de repenser les approches classiquement utilisées en fouille de données. Dans cet exposé, je présenterai les principales caractéristiques des masses de données et défis liés, communément connues sous le terme "les grands V du Big Data" : volume, variété, vélocité, véracité mais aussi variabilité et visualisation. Je présenterai ensuite les challenges qui en découle tels que l’analyse multi-échelle, multitemporelle et multistratégie. Les exemples porteront principalement sur l’analyse d’images de télédétection, de plus en plus utilisées en étude de la biodiversité et de la pollution, mais les concepts présentés ne sont bien évidemment pas limités à ce domaine

références :

Faire entrer la France dans la troisième révolution industrielle : le pari de l’innovation - Le big data. Observatoire de l’Innovation de l’Institut de l’entreprise
Mai 2014

“Analyse des big data. Quels usages, quels défis ?” Commissariat général à la stratégie et à la prospective
Novembre 2013

GDR MaDICS : Masses de Données, Informations et Connaissances en Sciences
http://www.madics.fr/

Collaborative clustering with background knowledge. G Forestier, P Gançarski, C Wemmert
Data & Knowledge Engineering 69 (2), 211-228


Agenda

<<

2017

 

<<

Octobre

 

Aujourd'hui

LuMaMeJeVeSaDi
2526272829301
2345678
9101112131415
16171819202122
23242526272829
303112345
Aucun évènement à venir les 6 prochains mois