Pierre Gançarski - Fouille de données hétérogènes en écologie : méthodes et challenges concernant les masses de Données

vendredi 16 octobre 2015
par  Romain DAVID

Abstract

Les grandes masses de données (Big Data) face auxquelles l’expert en écologie, qu’il soit chercheur, décideurs ou simplement utilisateur, nécessite de repenser les approches classiquement utilisées en fouille de données. Dans cet exposé, je présenterai les principales caractéristiques des masses de données et défis liés, communément connues sous le terme "les grands V du Big Data" : volume, variété, vélocité, véracité mais aussi variabilité et visualisation. Je présenterai ensuite les challenges qui en découle tels que l’analyse multi-échelle, multitemporelle et multistratégie. Les exemples porteront principalement sur l’analyse d’images de télédétection, de plus en plus utilisées en étude de la biodiversité et de la pollution, mais les concepts présentés ne sont bien évidemment pas limités à ce domaine

références :

Faire entrer la France dans la troisième révolution industrielle : le pari de l’innovation - Le big data. Observatoire de l’Innovation de l’Institut de l’entreprise
Mai 2014

“Analyse des big data. Quels usages, quels défis ?” Commissariat général à la stratégie et à la prospective
Novembre 2013

GDR MaDICS : Masses de Données, Informations et Connaissances en Sciences
http://www.madics.fr/

Collaborative clustering with background knowledge. G Forestier, P Gançarski, C Wemmert
Data & Knowledge Engineering 69 (2), 211-228


Agenda

<<

2017

 

<<

Décembre

 

Aujourd'hui

LuMaMeJeVeSaDi
27282930123
45678910
11121314151617
18192021222324
25262728293031
Aucun évènement à venir les 6 prochains mois