Quelles métadonnées pour décrire quelles données
Les entrepôts de données proposent en général une liste de métadonnées pour décrire les jeux de données qu'ils hébergent. Ils peuvent également requérir un minimum de métadonnées lors du dépôt des jeux de données. Si vous déposez vos données dans un tel entrepôt, il vous suffit de vous conformer aux exigences de l’entrepôt.
Si vous souhaitez attribuer un DOI à un jeu de données, vous serez amenés à fournir une liste de métadonnées définie par DataCite et conforme à son schéma de métadonnées. DataCite est l'organisme à but non lucratif qui délivre les DOI pour les jeux de données. Il n'est pas orienté vers un domaine thématique particulier.
Si vous construisez votre propre base de données ou entrepôt de données, il est recommandé de se baser sur les standards de métadonnées existants et pertinents pour votre discipline scientifique, afin de favoriser l’interopérabilité et la réutilisation de vos données. Des standards de métadonnées sont répertoriés sur différents sites web :
- Digital Curation Centre (DCC) directory : répertoire de standards par disciplines
- Research Data Alliance (RDA) directory : répertoire de standards par disciplines
- FAIRsharing : standards dans tous les domaines (a succédé à BioSharing en 2017, le domaine des sciences biologiques est plus développé).
Exemples de standards de métadonnées en sciences de la vie :
- ABCD - Access to Biological Collection Data
- Darwin Core
- EML - Ecological Metadata Language
- Genome Metadata
- ISA-Tab
- MIBBI - Minimum Information for Biological and Biomedical Investigations
- Observ-OM
- OME-XML - Open Microscopy Environment XML
- PDBx/mmCIF - Protein Data Bank Exchange Dictionary and the Macromolecular Crystallographic Information Framework
- Protocol Data Element Definitions
- Repository-Developed Metadata Schemas
Standards de métadonnées suivis par Datacite :
Des extensions de ces standards sont répertoriées sur le site du DCC et du RDA.
Références
1. Van den Eynden, V., Corti, L., Woollard, M., Bishop, L., Horton, & UK Data Archive. (2011). Managing and sharing data: best practice for researchers (Third edition.). Colchester: UK Data Archive. http://ukdataservice.ac.uk/manage-data/handbook/
2. Green, T. (2009). "We Need Publishing Standards for Datasets and Data Tables". OECD Publishing White Paper. OECD Publishing.
doi: 10.1787/603233448430
3. White, E., Baldridge, E., Brym, Z., Locey, K., McGlinn, D., & Supp, S. (2013). Nine simple ways to make it easier to (re)use your data. Ideas in Ecology and Evolution, 6(2). doi: 10.4033/iee.2013.6b.6.f