Relevé d’idées et conclusions, issus des présentations, du débat et des conversations en marge du séminaire

vendredi 25 juillet 2014
par  Jean-Pierre FERAL

Bilan et conclusions du séminaire || Points à améliorer || Définition et périmètre d’action || Adhérer au consortium IndexMed

- Les participants ont réaffirmé leur intérêt pour la co-construction d’un projet, d’un groupe de travail et d’un prototype permettant :

  • L’indexation des données sur la biodiversité méditerranéenne quel que soit leur format, leur origine et leur niveau de qualité, en adoptant les formats d’identifiants en cours de validation au niveau international (GBIF, EU BON, DataONE, …),
  • La possibilité de requalifier ou sur-qualifier les index mis en place, et de faire correspondre des index de formats et de normes différents,
  • Que cette plateforme d’indexation communique de manière automatisée avec les centres agrégateurs de donnée,
  • Qu’un service d’hébergement à plus long terme et des solutions de gestion de données open sources soient proposé aux partenaires choisissant le format « open data »,
  • Que ce projet intègre des objectifs « opérationnels » concernant le développement de la « culture de la donnée » : méthode, outils pour former les doctorants, capacité d’assistance technique (administration) ET soutien aux moyens humains, systèmes et réseaux liés à l’observation (peuplement des bases de données), et enfin, analyse des freins sociologiques à l’interopérabilité des données.

- Ces points nodaux d’indexation seront « clonables » à volonté avec des règles d’enrichissement et de partage correspondant aux licences « creative common » du type « Partage dans les mêmes conditions », autorisant les autres à reproduire, diffuser et modifier l’index, à condition qu’ils publient toute adaptation de l’index sous les mêmes conditions (open-source, open data). Toute personne qui souhaiterait publier une adaptation sous d’autres conditions doit obtenir une autorisation préalable.

- Ce projet, initié dans le cadre d’une réponse à l’appel d’offre du CNRS MASTODONS (Grandes masses de données scientifiques), amélioré et complété, sera proposé lors des appels d’offres H2020 en tant que « workpackage » d’un projet plus vaste sur la biodiversité.

- Une organisation « modulaire » (permettant l’administration d’un type d’objet ou de données de manière indépendante par l’acteur le plus compétant) doit être préférée aux systèmes centralisés (tout le monde ne peut pas regrouper les données de tout le monde).

- Différentes questions seront mises en avant pour élaborer un projet de recherche au périmètre plus large que les outils uniquement, et aborderont :

  • Concernant le modèle systémique de production de la donnée :
    • une évaluation des besoins antagonistes (1) de normalisation ou de suivi des normes existantes, (2) de diversification de la donnée sur la biodiversité, de ses méthodes d’acquisition et de ses formats et de leurs conséquences respectives sur l’efficacité des types de recherche associées,
    • le rapport entre données très homogènes, notamment les données « calculées » ou mesurées versus les données « d’interprétation », plus sujettes à variation liée à l’observateur, les méthodes de valorisation des producteurs de données et les moyens de pérenniser des systèmes d’observations de données « interprétées » (et donc couteuses en temps/homme),
    • les méthodes d’agrégation et de fouille de données pour des usages secondaires et les scenarii envisageables pour leur exploitation à différentes échelles en fonction du type de donnée,
  • Concernant les services et usages de la donnée :
    • la problématique de cycle de vie de la donnée concernant la « biodiversité »,
    • la valeur de la donnée et les indicateurs d’utilisation de cette donnée, comme un nouveau critère d’évaluation des chercheurs travaillant sur la biodiversité,
    • le contexte juridique de la donnée sur la biodiversité issue de la recherche, au sein des organismes de recherche mais aussi pour toute utilisation secondaire, externe au contexte « recherche »,
    • les outils nécessaires à une véritable traçabilité de la donnée sur la biodiversité, quelque-soient les transformations subies par les données brutes (agrégation, moyenne, division, requalification…)

- l’utilisation et l’indexation de formats de données « médias » (sons, images, films, 3D) et leur exploitation automatisée. Les fiches « bonnes pratiques sur les BDD » déjà en place dans d’autres instituts du CNRS doivent être prises en compte

- Le projet doit être développé avec le concours de mathématiciens, de physiciens, d’informaticiens, d’archivistes, d’astronomes, d’économistes et de sociologues afin d’adapter au mieux les outils dont ils se servent et de s’appuyer sur leur expérience/expertise (les compétences manquantes sont à solliciter au sein des différents instituts)

- L’objectif est de permettre des approches bi-, tri- ou transdisciplinaires s’appuyant sur des « modules de BDD interopérables ». Ce concept, s’inspirant de ce qu’utilisent les astronomes, impose aux participants non seulement de développer leurs métadonnées, mais aussi de favoriser un enrichissement des données via des « ontologies » communes. Une des tâches du futur programme sera donc de participer à la mise en place de cette ontologie sur la biodiversité méditerranéenne et de proposer des outils et méthodes en s’appuyant sur les savoirs faire existants (Aix-Marseille Université, Université de Montpellier, CESAB, …)

- Une fois un niveau d’interopérabilité minimal atteint, le projet expérimentera la formation de « cube de données » mettant en relation par exemple des aspects sociologiques, économiques et écologiques de la biodiversité méditerranéenne et s’appuiera sur les nouvelles disciplines de l’informatique et des mathématiques (algorithme des graphes, fouille de données) pour proposer des solutions aux problématiques transdisciplinaires qui concernent directement la biodiversité.

- In fine, les modèles et outils proposés permettront de croiser des données de disciplines différentes et de proposer des méthodes de création de scénarios par approche successive, en se basant sur les concepts actuellement décrits dans le domaine de l’écologie globale.

Bilan et conclusions du séminaire || Points à améliorer || Définition et périmètre d’action || Adhérer au consortium IndexMed


Commentaires  (fermé)

Agenda

<<

2017

 

<<

Octobre

 

Aujourd'hui

LuMaMeJeVeSaDi
2526272829301
2345678
9101112131415
16171819202122
23242526272829
303112345
Aucun évènement à venir les 6 prochains mois