Aller au contenu principal

Open et FAIR Data

biul |

Qu'est-ce que l'Open Data ? Qu'est-ce qui différencie l'Open Data du FAIR Data ? Comment rendre mes données FAIR ? Suis-je obligé d'ouvrir mes données ? Quels sont les différents degrés de partage des données  ?  

Dans les différentes rubriques ci-dessous vous trouverez des réponses à ces questions.

 

Les données « ouvertes » (Open Data) sont des données qui peuvent être librement utilisées, réutilisées et redistribuées. Il ne suffit donc pas de mettre ses données à disposition sur un site internet pour s’inscrire dans une démarche d’Open Data. 

En effet, les données peuvent être mises à disposition du public sur un site sans qu’elles ne soient pour autant réutilisables. Par exemple, parce qu’une licence ne précise pas les conditions de réutilisation, parce qu’elles ne sont pas documentées ou ne sont pas conservées dans une infrastructure pérenne. 

Ainsi, la disponibilité des données, leur réutilisation et leur redistribution sont aux fondements de l’Open Data.

 

“Open data is data that can be freely used, re-used and redistributed by anyone – subject only, at most, to the requirement to attribute and share-alike”. 

Open Knowledge foundation, Open Data Handbook, https://opendatahandbook.org/guide/en/what-is-open-data/

La règle balisant l’ouverture des données de la recherche est la suivante : « Aussi ouvert que possible, aussi fermé que nécessaire ».

En effet, il existe différents degrés d'ouverture des données : de l'ouverture complète, à la fermeture complète, en passant par diverses formes d'accès restreint ou contrôlé.

 

Il peut y avoir fermeture ou accès restreint si vos jeux de données contiennent notamment : des données à caractère personnel – dont des données sensibles, des données confidentielles, des données protégées par le droit d'auteur, des données ayant un potentiel de valorisation commerciale ou encore des données qui enfreindraient un engagement préalable relatif au partage des données (par exemple, un accord de consortium, ...).

Ainsi, l'ouverture des données n'est pas obligatoire. En revanche, les données doivent être « FAIR ».

Données ouvertes

Données qui peuvent être librement utilisées, réutilisées et redistribuées par quiconque - sous réserve, tout au plus, de l'obligation de citer l'auteur.trice et de partager dans des conditions similaires.

Données fermées

Données qui sont temporairement sous embargo, ou qui ne peuvent pas être partagées du tout (RGPD, ...). Dans ce cas, il est souvent possible de partager les métadonnées des données (afin que les utilisateur.trices puissent avoir connaissance de l'existence du dataset).

Données en accès restreint

Données qui ne sont pas partagées de manière totalement ouverte mais qui sont mises à disposition dans des conditions d'accès et d'utilisation plus restreintes (par ex. via une procédure d'authentification).

 

Les principes FAIR constituent un ensemble de lignes directrices en matière de gestion des données, afin que celles-ci soient facilement trouvables, accessibles, interopérables et réutilisables (findable, accessible, interoperable et reusable).

Facilement trouvables : la première étape en vue de réutiliser des données est de les trouver ! Les données doivent être faciles à trouver, tant par les humains que par les ordinateurs. Elles se trouvent dans un dépôt de données, ont un identifiant pérenne et comportent des métadonnées.

Accessibles : les données et métadonnées sont disponibles de manière pérenne, même après la fin du projet. L’utilisateur.trice sait comment y accéder (par exemple, via une procédure d’identification si nécessaire).

Interopérables : les données doivent pouvoir être exploitées, échangées, comparées ou réutilisées dans divers contextes. Leur format permet de les combiner avec d’autres données et l’utilisateur.trice doit être en mesure de les interpréter correctement.

Réutilisables : la réutilisation des données est l’objectif de l’Open Data. Pour cela, les données doivent être bien décrites et documentées. Une licence claire et accessible définit les conditions de réutilisation (par exemple, une licence Creative Commons).

Rendre ses données « FAIR » n'est pas l'équivalent d’ouvrir ses données. 

En effet, les données peuvent être FAIR mais pas ouvertes (par exemple, les données à caractère personnel ; les données partagées seulement en accès restreint). 

Cependant, pour être utiles (c'est-à-dire réutilisables), les données ouvertes doivent être FAIR ! 

Les données ouvertes au public peuvent ne pas être suffisamment documentées pour répondre aux principes FAIR, tels que l'octroi de licences pour une réutilisation claire. Ainsi, la mise à disposition libre et gratuite de vos données ne signifie pas automatiquement qu'elles sont réutilisables.

Le principe général de l'Open Data est : « Aussi ouvert que possible, aussi fermé que nécessaire ». Cependant, les données doivent être "FAIR".