Enquête INRAE autour des pratiques de gestion des données dans un contexte de science ouverte

Fin 2021, une enquête a été menée auprès des personnels INRAE, sur leurs pratiques de gestion des données dans un contexte de science ouverte (SO). Les questions portaient sur les données utilisées et produites, leur stockage (sauvegarde, archivage...), leur degré d’ouverture et de réutilisation, les pratiques (plan de gestion de données...) et les ressources attendues de la part de l’établissement. Le rapport d’analyse finalisé début 2023 offre une photographie de la connaissance et de la pratique de la science ouverte au sein d’INRAE à un temps T. Cette enquête a également permis de recueillir les besoins et les freins associés aux changements de pratiques en matière de ressources informatiques, humaines, de formation...  L’analyse de ces réponses pourrait être approfondie. Cette enquête, correspondant à un « T zéro », mériterait surtout d’être répétée afin de voir l’évolution des connaissances et des pratiques.

Contexte et enjeux

D’août 2021 à décembre 2021, une enquête a été menée auprès des personnels INRAE, sur leurs pratiques de gestion des données de la recherche dans un contexte de science ouverte (SO). Cette enquête s’inscrit dans une démarche plus large, initiée par l’UMR BETA de Strasbourg (Université de Strasbourg, Université de Lorraine, CNRS, INRAE, AgroParisTech), portant sur un ensemble d’établissements (Universités de Nice, de Nantes, Synchrotron Soleil…). Un premier rapport de cette étude a été publié fin février 2023, pour les universités de Strasbourg et de Nice. 

L'enquête menée au sein d’INRAE se base sur le même schéma général de questions, avec une structure en cinq parties :

  1. Les caractéristiques du répondant.
  2. Les données utilisées, les données produites.
  3. Les besoins et les pratiques de sauvegarde, stockage, archivage.
  4. L’accès aux données (degrés d’ouverture), la réutilisation de données disponibles.
  5. Les pratiques de gestion des données (Plan de gestion de données…) et les ressources attendues de la part de l’établissement.

Résultats

L’enquête INRAE a été mis en place par Stéphanie Rennes (direction des Affaires juridiques, INRAE) dans le cadre de son projet de thèse en 2021. Elle a recueilli 467 réponses, sur environ 8 000 personnes positionnées dans les unités de recherche, soit un taux de réponse de l’ordre de 6 % (8 % pour les scientifiques). Un long travail de curation a été réalisé en 2022 par Olivier Philippe et Michaël Chelle. Les données sont majoritairement qualitatives et ont du subir encore des transformations, avant de pouvoir débuter les analyses fin 2022. Ces analyses ont été réalisées par Alban Thomas. Elles se présentent majoritairement sous forme de graphiques, d'abord question par question, puis en croisant des questions deux à deux.

Signalons que ces résultats reflètent la perception des répondants. Certains besoins exprimés peuvent parfois (au moins en partie) relever d’un manque d’informations. Nous rappelons de plus que l’enquête date de 2021, la situation et sa perception par les répondants a pu changer depuis... Quelques résultats extraits des réponses aux 60 questions de l'enquête :

  • Si on extrapolait les besoins de stockages (fourchette basse) à la population INRAE, le besoin annuel en stockage serait d’au moins 2Po (2 pétaoctets = 2 000 téraoctets). [figure 1]
  • Les répondants déclarent stocker le plus souvent leurs données chaudes (en cours de traitement) sur au moins deux supports, majoritairement fournis par INRAE (PC professionnel,  serveur INRAE, disque dur externe). [figure 2]
  • Plus de huit répondants sur dix souhaitent des outils ou espaces de travail collaboratifs pour leurs projets de recherche. [figure 3]
  • Les répondants attendent plus d'INRAE de proposer une solution d'archivage et un espace de stockage, que de fournir un plan de gestion de données (PGD) institutionnel ou des informations sur la science ouverte. [figure 7]
  • Près de trois répondants sur dix ne savent pas ce qu'est un plan de gestion des données. Deux tiers des répondants n'ont pas participé à l'élaboration d'un PGD. [figure 4]
  • Un peu plus de la moitié des répondants déclarent ajouter habituellement des informations décrivant leurs données (chaudes ou froides). Cette documentation reste surtout personnelle, au détriment de standards de métadonnées ou du PGD. [figure 5]
  • Neuf répondants sur dix sont d'accord pour partager leurs données froides selon les principes de la science ouverte (diffusables, et réutilisables librement et gratuitement). Six répondants sur dix déclarent ne jamais avoir diffusé leurs données froides sur le web. [figure 6]

Cette enquête a permis de faire le point sur la gestion des données dans un contexte de science ouverte à INRAE, de rendre compte de l’état d’avancement des pratiques et de mieux comprendre les besoins afin de pouvoir appuyer les dynamiques d’évolution. Ces résultats constituent un « T zéro » et ont vocation à être présentés et discutés dans les instances concernées, afin de préciser les priorités et les démarches d’action à mettre en œuvre.

Perspectives

Ces premiers résultats mériteraient d’être approfondis, notamment si l’objectif est d’identifier des communautés de pratique au sein des répondants. L‘exploitation des données de l’enquête a permis de relever ses limites, parmi lesquelles : un faible taux de répondants, une absence d’information sur le département de recherche des répondants et la prépondérance des questions à choix multiples (QCM). 

Une seconde enquête serait utile pour suivre l’évolution des connaissances et des pratiques en science ouverte, mais la structure du questionnaire devrait être revue au préalable (plus courte, avec moins de QCM...).

Références bibliographiques

Wolff, S., Gallezot,G., Jalabert, N. (2022). « Enquête sur les Données de la Recherche au sein de deux universités françaises ». Report. Université de Strasbourg ; Université Côte d’Azur ; Université Rennes 2 ; INRAE, décembre 2022. https://hal.science/hal-03997711.

Illustrations

Figure 1

Figure 2

Figure 3

Figure 4

Figure 5

Figure 6

 

Figure 7

Figure 8

 

Vous avez une question ?

Contactez-nous