Les Principes "FAIR" de gestion des données
biul |
En 2016, un article intitulé "The FAIR Guiding Principles for scientific data management and stewardship" publié dans Scientific Data, pose quatre grands principes en matière de gestion des données de la recherche : les données doivent être trouvables, accessibles, interopérables et réutilisables (findable, accessible, interoperable et reusable).
L'objectif est que ces principes puissent service de ligne directrice pour améliorer la découverte et la réutilisation des données de la recherche par les humains mais aussi par les "machines".
Depuis plusieurs années, les bailleurs de fonds de la recherche, tels que la Commission européenne, visent à améliorer l'accès aux résultats scientifiques, y compris aux données de la recherche. Les Principes FAIR sont ainsi au cœur des programmes Horizon 2020 et Horizon Europe de la Commission européenne.
Les détails de ces principes sont présentés ci-dessous, ainsi que des ressources connexes utiles :
Trouvables : les (méta)données doivent être facilement trouvables par les humains et les machines, ce qui signifie que :
- F1. les (méta)données sont dotées d'un identifiant unique et persistant à l'échelle mondiale
- F2. Les données sont décrites à l'aide de métadonnées riches
- F3. les métadonnées incluent clairement et explicitement l'identifiant des données qu'elles décrivent
- F4. les (méta)données sont enregistrées ou indexées dans une ressource consultable.
Accessible : L'accès aux données doit être facile (avec authentification ou restriction d'autorisation si nécessaire), ce qui signifie que :
- A1. Les (méta)données sont récupérables par leur identifiant au moyen d'un protocole de communication normalisé.
- A1.1 Le protocole est ouvert, gratuit et universellement implémentable
- A1.2 Le protocole prévoit une procédure d'authentification et d'autorisation, si nécessaire.
- A2. Les métadonnées sont accessibles, même lorsque les données ne sont plus disponibles
Interopérable : L'interopérabilité consiste à permettre l'échange et la réutilisation des données entre chercheurs, institutions, organisations, pays, etc.
A cette fin, les données doivent pouvoir être intégrées à d'autres données et être interopérables avec des applications ou des flux de travail pour l'analyse, le stockage et le traitement (càd : en adhérant autant que possible aux applications logicielles ouvertes, aux normes relatives aux formats, et en facilitant les recombinaisons avec différents ensembles de données d'origines diverses).
- I1. Les (méta)données utilisent un langage formel, accessible, partagé et largement applicable pour la représentation des connaissances.
- I2. Les (méta)données utilisent des vocabulaires qui respectent les principes FAIR.
- I3. Les (méta)données comprennent des références qualifiées à d'autres (méta)données.
Réutilisation : la réutilisation des données doit être possible. Pour ce faire, les données doivent être correctement décrites et documentées (afin de pouvoir être reproduites, combinées avec d'autres, etc.) . Une licence claire et accessible définit les conditions de réutilisation.
- R1. Les méta(données) sont richement décrites avec une pluralité d'attributs précis et pertinents.
- R1.1 Les (méta)données sont diffusées avec une licence d'utilisation des données claire et accessible.
- R1.2 Les (méta)données sont associées à une provenance détaillée
- R1.3. les (méta)données répondent à des normes communautaires pertinentes pour le domaine.
Wilkinson et al. (2016), « The FAIR Guiding Principles for scientific data management and stewardship », Scientific Data, 9p. DOI : 10.1038/sdata.2016.18 https://www.nature.com/articles/sdata201618