L’indexation des données / Indexing data

mercredi 23 juillet 2014
par  Romain DAVID

Le service d’indexation de la donnée est la clef de voute de la mise en relation de bases de données de formats différents. Il permet d’identifier chaque enregistrement, chaque état des enregistrements (version), et de résoudre pour chacun de ces états toutes les données qui ont été utilisées, ainsi que leur état, pour arriver à un nouvel état transformé. Il permet donc de décrire tous les états antérieurs, et ainsi garantir la traçabilité et la propriété intellectuelle de cette donnée, si elle existe, d’identifier les qualificatifs dont cette nouvelle donnée peut ou ne peut pas hériter, et complète ainsi les critères qui peuvent servir de descripteur supplémentaire dans le cadre de la fouille de données. Le service Web de résolution de ces index s’appuie sur les identifiants uniques des bases de données, en crée lorsqu’ils n’existent pas, et créent des relations entre eux lorsqu’il en existe plusieurs.

The Indexing Service data is the keystone of the linkage of different databases formats. It identifies each record, recordings of each state (version), and solving for each of these states all the data that have been used and their condition, to reach a new transformed state. It allows to describe all the previous states, thus ensuring traceability and intellectual property of this data if it exists, to identify the adjectives that this new data can or cannot inherit, and thus it complements criteria that may serve as an additional descriptor for data mining. The resolution of these indexes Web service relies on the unique identifiers of databases, creates some where none exist, and also creates relationships between them where there is more than one.

Il permet l’agrégation de données en connaissance de cause sous forme de points nodaux car il ne contient aucune donnée considérée comme sensible par un producteur de données ; ces points nodaux d’indexation seront « clonables » à volonté avec des règles d’enrichissement et de partage correspondant aux licences « creative common » du type « partage dans les mêmes conditions », autorisant les autres à reproduire, diffuser et modifier l’index, à condition expresse qu’ils publient toute adaptation de l’index sous les mêmes conditions (open-source, open data). Ces règles devront favoriser l’émergence de standards pour améliorer l’interopérabilité des données et favorisera la participation de nouveaux laboratoires contributeurs en tenant compte de leurs possibilités techniques de contribution au fur et à mesure du développement du projet.

It allows to make an informed choice of data aggregation as nodes because it does not contain data considered as sensitive by a data producer. These indexing nodes will be "clonable" on a discretionary basis with enrichment rules and sharing licenses corresponding to "creative common" type "sharing the same conditions", allowing others to copy, distribute and modify the index, provided they publish express any adaptation of the index under the same conditions (open-source, open data). These rules will encourage the emergence of standards to improve the interoperability of data and promote the participation of new contributors laboratories taking into account their contribution to the technical possibilities as and when the project develops.

Prérequis : accessibilité, flux normés et qualifiés, open data sur les flux
Prerequisites : accessibility, normalized flow and qualified, open data on flux

Outils : service de résolution, identifiants uniques, équivalence entre identifiants, points nodaux d’indexation
Tools resolution service, unique identifiers, equivalence between identifiers, indexing nodes

Résultat attendu : traçabilité
Perspective : héritabilité des qualificatifs de données, historique de la donnée, vie de la donnée
Expected result : traceability
Perspective : heritability data qualifiers, storie of data, data life)
]


Agenda

<<

2017

 

<<

Décembre

 

Aujourd'hui

LuMaMeJeVeSaDi
27282930123
45678910
11121314151617
18192021222324
25262728293031
Aucun évènement à venir les 6 prochains mois