Recommandations et bonnes pratiques
Il est nécessaire d’identifier la nature des données et l’usage qui en sera fait pour effectuer un choix adapté d’espace de données cible. Le choix du stockage peut en effet varier en fonction de l’étape du cycle de vie du projet de recherche, des données et de nombreux autres critères.
Par exemple, le niveau de sécurisation, le protocole d’accès aux données, la performance, le lieu de stockage et la connectivité au réseau du site de production des données, la volumétrie, le niveau de sensibilité des données (cf. fiche données sensibles), la nature structurée ou non des données, les collaborations internes/externes souhaitées aux différentes étapes (collecte, traitement/analyse, publication), etc.
Pour bien aborder les questions de stockage nous recommandons avant tout d’anticiper cette question dès la phase de conception du projet en rédigeant un plan de gestion des données (PGD). Ceci facilitera les recommandations suivantes :
- Prévoir de quelle manière les données seront décrites (avec quelles métadonnées et quels vocabulaires : cf. fiche métadonnées), structurées, et enfin organisées (cf. fiche organisation et nommage des fichiers de données)
- Toujours stocker les données accompagnées des métadonnées. Permettant ainsi de les identifier, archiver, interpréter et réutiliser ultérieurement. Les métadonnées qui accompagnent les données doivent aussi permettre à tout moment d’en gérer la fin de vie.
- Recourir le plus tôt possible à un identifiant unique et pérenne qui renvoie vers l’ensemble métadonnées et données associées (notion de dataset par exemple dans Data INRAE).
- Prendre en compte les coûts de stockage des données dans le plan de financement de vos projets de recherche
- Identifier la/les personnes responsable(s) des données.