FAQ

Administration des dataverses

Peut-on changer les métadonnées facultatives pour les rendre obligatoires ? Que se passe-t-il alors pour les datasets déjà créés et dont les métadonnées facultatives n’étaient pas renseignées ?

Oui on peut rendre obligatoire une métadonnée qui était facultative. Il n’y a pas d’impact sur les datasets déjà publiés tant qu’ils ne sont pas modifiés. Lors d’une modification, la métadonnée obligatoire devra alors être renseignée.

Peut-on modifier à tout moment les paramètres d’un dataverse ?

Oui, par son(ses) administrateur(s). Attention cependant à la cohérence des modifications apportées si celles-ci impactent les datasets déjà présents :

  • Sélection des blocs de métadonnées.
  • Caractère obligatoire ou facultatif des métadonnées

Pour le cas des droits des utilisateurs, voir “Est-ce que les droits peuvent être modifiés par la suite ?”

Un admin peut-il créer une alerte pour être prévenu lorsqu’un dataset a dépassé les 6 mois de création ?

Il n’est pas possible pour le moment de faire une recherche sur la date de création ni d’enregistrer une alerte automatique dans Data INRAE.

Y a t-il une charte graphique à respecter pour les dataverses ?

Non, il n’y a pas de recommandation particulière. Les quelques contraintes sont indiquées dans le paramétrage du dataverse (menu Thème + widget).

Choix d'un entrepôt

Peut-on déposer les données dans un autre entrepôt si celui-ci attribue un DOI ?

Oui, si cet entrepôt est l’entrepôt de référence dans le domaine concerné. Dans ce cas, il ne faut pas re-déposer les données dans Data INRAE. Contacter le support datainrae@inrae.fr qui vérifiera la possibilité d’exposer le jeu de données dans Data INRAE.

Le schéma suivant schématise les critères de choix d’un entrepôt :

choix d'un entrepôt
choix d’un entrepôt
Pour un projet commun à plusieurs instituts, peut-on mettre nos données produites par INRAE dans Data INRAE et les autres ailleurs ?

Il est préconisé de mettre toutes les données dans un même entrepôt, sachant qu’il est possible d’exposer ou de moissonner des métadonnées entre différents entrepôts. Si le dépôt dans différents entrepôts s’impose, penser à utiliser les métadonnées ad-hoc (dans Data INRAE : related datasets) pour faire des liens entre les jeux de données du projet.

Conditions d'utilisation

Est-ce que Data INRAE continuera à rester gratuit ? 

Oui, la gratuité de Data INRAE est assurée dans le cadre de la politique Open Data d’INRAE.

Quelle est la durée de stockage des données ?

INRAE s’engage à conserver au moins 10 ans les données déposées dans Data INRAE.

Datapapers

Quel ordre de publication privilégier, entre la publication de l’article et celle du datapaper ?

Les deux ordres sont possibles et relèvent de la stratégie scientifique, sous la responsabilité des auteurs. S’il existe une inquiétude sur l’exploitation des données, il est possible de rédiger en premier le datapaper mais de le publier une fois l’article scientifique publié. En cas de doute, contacter l’éditeur.

Si on transmet une URL privée à un reviewer, aura-t-il un accès aux données avec restriction ?

On l’URL privée permet d’accéder aux fichiers d’un dataset non encore publié (statut draft), même si ces fichiers sont en accès restreint.

Datasets

Faut-il indiquer le DOI d’une ISC dans le dataset ?

Lorsqu’une Infrastructure Scientifique Collective (ISC) a contribué au dataset il possible de l’indiquer dans la métadonnée Contributor en précisant le Type, et en choisissant DOI dans Contributor Identifier Scheme et le DOI dans Contributor Identifier.

Peut-on déposer un dataset sans l’associer à un dataverse ?

Non, un dataset est toujours créé dans un dataverse : à la racine du portail (dataverse https://data.inrae.fr/dataverse/root) ou un sous-dataverse.

Peut-on limiter l’accès ou mettre un embargo à un dataset ou à un dataverse ?

On peut restreindre l’accès à un fichier d’un dataset. Data INRAE ne gère pas automatiquement la durée de cette restriction d’accès (embargo), il revient à l’administrateur du dataset d’enlever la restriction le moment venu. 

Pour limiter l’accès à un dataset dans son ensemble, il ne doit pas avoir été publié. L’accès à ce dataset ne sera alors possible qu’aux personnes autorisées ou via son URL privée.

On ne peut pas limiter l’accès à un dataverse publié.

Quel est le délai recommandé pour publier un dataset ?

Nous recommandons de publier un dataset dès que possible, la vocation de Data INRAE étant d’être un entrepôt d’accès aux données. 

Dans le cas de données non liées à une publication, un délai de 6 mois paraît raisonnable. Au-delà de ce délai vous pourrez être alerté par l’administrateur du dataverse de rattachement.
Dans le cas de données liées à une publication, la loi pour une république numérique recommande la publication des données sous-jacentes 6 mois après la publication pour les sciences techniques et médicales, 12 mois pour les sciences humaines et sociales. (voir Activist n°4)

Un dataset qui n’a pas été publié peut-il être supprimé ?

Oui, tant qu’il n’a pas été publié, un dataset peut être supprimé. Une fois publiée, seule la version brouillon peut être supprimée.

Dataverses

Peut-on limiter l’accès ou mettre un embargo à un dataset ou à un dataverse ?

On peut restreindre l’accès à un fichier d’un dataset. Data INRAE ne gère pas automatiquement la durée de cette restriction d’accès (embargo), il revient à l’administrateur du dataset d’enlever la restriction le moment venu. 

Pour limiter l’accès à un dataset dans son ensemble, il ne doit pas avoir été publié. L’accès à ce dataset ne sera alors possible qu’aux personnes autorisées ou via son URL privée.

On ne peut pas limiter l’accès à un dataverse publié.

Environnements de pré-production et de production

Peut-on importer sur l’environnement de production data.inrae.fr un dataset créé sur la préproduction ?

Non, ces deux environnements sont indépendants et il n’y a pas de possibilité d’exporter un dataset de l’un pour l’importer dans l’autre.

Fichiers

Comment peut-on mettre à jour un fichier sans le supprimer et sans refaire un versement ?

Il n’est pas possible de modifier le contenu d’un fichier dans l’interface utilisateur. Pour mettre à jour un fichier, il faut le remplacer.

Comment téléverser une grande quantité de fichiers d’un coup ?

L’interface de dépôt de Data INRAE limite le téléversement à 1000 fichiers en une fois. Au-delà il est possible d’utiliser l’outil DVUploader ou l’API native Dataverse.

Est-ce qu’il faut refaire une publication à chaque modification de fichier ?

Une modification de fichier crée un nouveau brouillon du dataset. Une nouvelle publication de celui-ci rend publique les modifications et met à jour la version.

Est-il possible de trier les fichiers d’un dataset par nombre de téléchargements ?

Non, il n’est pas possible de trier les fichiers par nombre de téléchargements. On peut trier les fichiers d’un dataset par nom, date de dépôt, taille et catégorie (type de fichier).

Les fichiers Excel peuvent-ils être ingérés avec plusieurs feuilles ?

Non, si le fichier contient plusieurs feuilles, il est déposé mais seule la 1ère feuille est ingérée et donc transformée en .tab. 

Pour pouvoir réaliser une bonne ingestion, il est donc conseillé de ne téléverser que des fichiers contenant un seul onglet avec les variables sur la première ligne (entêtes de colonne) et une observation par ligne (voir Fichiers de données tabulées)

Peut-on pointer directement sur un fichier (et non sur sa fiche descriptive) ?

Ce n’est pas possible depuis l’interface. Il faut utiliser l’API Dataverse (Data Access API) en indiquant le DOI du fichier avec la commande https://data.inrae.fr/api/access/datafile/:persistentId/?persistentId=doi:{DOI du fichier} 

Que faire si on s’aperçoit que son fichier a été mal ingéré ?

Si l’erreur d’ingestion est détectée alors que le dataset est encore en mode brouillon, il faut supprimer le fichier, chercher d’où provient l’erreur d’ingestion (voir : Fichiers de données tabulées), puis téléverser le fichier corrigé.

Si le dataset a été publié, il faudra remplacer le fichier par le fichier corrigé.

Quelle est la volumétrie de stockage possible ? 

La seule limite actuellement est de 5 Go par fichier.

Pour des fichiers supérieurs à 5 Go, une solution est de les déposer sur un autre dispositif (voir Stocker les données et Choisir un entrepôt) et d’indiquer l’URL de la localisation du fichier dans la métadonnée “Link to data”.

Y-a-t-il une convention de nommage des fichiers, datasets ou dataverses ?

Des recommandations pour nommer et organiser ses fichiers de données sont disponibles sur le site Gestion et partage des données scientifiques. Des recommandations spécifiques peuvent être proposées par l’administrateur d’un dataverse et intégrées dans le plan de gestion des données associé au dataverse.

Gestion des accès et des droits utilisateurs

Faut-il créer des droits à chaque création de dataverse ?

Par défaut, un nouveau dataverse hérite des droits du dataverse parent. Ces droits sont également modifiables via l’option “Modifier > Autorisations” ou “Edit > Permissions”.

Peut-on donner des droits à des personnes extérieures ?

Oui, il est possible de leur attribuer les mêmes droits qu’à des utilisateurs INRAE  mais il faut qu’ils aient déjà créé leur compte.

Se reporter au chapitre du guide de l’utilisateur “Gérer les droits”.

Peut-on modifier les droits d’un utilisateur ?

Les droits d’un utilisateur (ou d’un groupe d’utilisateurs) sont liés aux rôles qui lui ont été attribués sur un dataverse, un dataset ou  un fichier. Ils peuvent être modifiés.

Pour les datasets et fichiers, voir le guide Rôles et permissions associés à un dataset 

Pour un dataverse, voir : Attribuer un rôle à un utilisateur ou à groupe

Pour un dataverse d’unité, faut-il créer des droits pour tous les agents de l’unité ?

Oui si l’on souhaite attribuer les droits aux agents de l’unité. On pourra alors créer un groupe spécifique dans lequel seront intégrés les agents ayant un compte dans le portail. Ceci peut être réalisé via l’interface (voir Attribuer un rôle à un utilisateur ou à groupe). Il est également possible d’Importer une liste d’utilisateurs dans un groupe.

Si on transmet une URL privée à un reviewer, aura-t-il un accès aux données avec restriction ?

On l’URL privée permet d’accéder aux fichiers d’un dataset non encore publié (statut draft), même si ces fichiers sont en accès restreint.

Gestion des comptes

Comment savoir pour quel(s) dataverse(s) j’ai des droits d’administration ?

Au niveau du profil de l’utilisateur, en haut à droite de l’écran lorsqu’on est authentifié, cliquer sur “Mes données”. Dans les facettes, ne sélectionner que “Dataverses” et le rôle “Administrateur”.

Peut-on utiliser un alias mail pour un compte utilisateur ?

Oui, il est possible d’attribuer un alias mail à un compte utilisateur.

Métadonnées

Faut-il indiquer le DOI d’une ISC dans le dataset ?

Lorsqu’une Infrastructure Scientifique Collective (ISC) a contribué au dataset il possible de l’indiquer dans la métadonnée Contributor en précisant le Type, et en choisissant DOI dans Contributor Identifier Scheme et le DOI dans Contributor Identifier.

L’anglais est-il obligatoire pour toutes les métadonnées (ex. description) ?

Non, le choix de la langue dépend de la cible visée par votre publication. Certaines métadonnées peuvent être créées dans plusieurs langues (par exemple une description en anglais et une description en français).

Les métadonnées sont elles pérennes ?

Oui, y compris pour les jeux de données retirés de Data INRAE (deaccessioned / retirés de la diffusion). Par ailleurs, les métadonnées de Data INRAE sont également conservées dans d’autres systèmes, notamment dans DataCite.

Peut-on ajouter une liste d’auteurs ou de contributeurs via un fichier ?

Non, cette fonctionnalité n’existe pas. Si vous souhaitez utiliser plusieurs fois une même liste d’auteurs/contributeurs, vous pouvez les pré-saisir dans la métadonnée correspondante via un modèle de dataset (dataset template).

Si vous avez besoin d’automatiser des dépôts vous pouvez contacter le support (datainrae@inrae.fr) pour utiliser les APIs.

Peut-on compléter les métadonnées après dépôt et validation ?

Il est tout à fait possible de compléter les métadonnées d’un dataset après dépôt et validation. Une nouvelle version (mineure ou majeure) est alors créée.

Qu’est-ce que DDI ?

Data Documentation Initiative (DDI) est un standard de documentation des données, créé par DDI Alliance,  issues d’enquêtes et de méthodes d’observation en sciences sociales, comportementales, économiques et de la santé.

Modèles de métadonnées

Les modèles / templates concernent-ils les dataverses ou les datasets ?

Les modèles de datasets (ou dataset templates) sont créés dans un dataverse par l’administrateur et s’appliquent aux datasets créés dans ce dataverse.

Peut-on avoir plusieurs modèles pour un même dataverse ? et pour un même dataset ?

Dataverse : Oui, il est possible de proposer plusieurs modèles dans un dataverse, et notamment ceux du dataverse parent (par exemple le template INRAE).

Dataset : Non, il n’est pas possible de choisir plusieurs modèles pour un dataset.

 

S’il existe un template « INRAE », quel est l’intérêt d’en créer / utiliser d’autres ? 

Le modèle de dataset “INRAE template” ne pré-remplit que les informations liées à la Licence Ouverte/Etalab. Si vous souhaitez pré-remplir d’autres métadonnées, il vous faudra créer un autre modèle de saisie.  

Un modèle peut-il être appliqué à des datasets existants ?

Non, le modèle (template) de dataset ne s’applique qu’aux nouveaux datasets qui choisiront de l’utiliser et uniquement au moment de leur création.

 

Organisation des dataverses

Peut-on déplacer des dataverses ?

Un administrateur de dataverse ne peut pas le faire, seuls les administrateurs du portail (l’équipe support) le peuvent. Il faut donc bien réfléchir au positionnement d’un dataverse avant sa création.
Il est par contre possible de lier un dataverse à un autre, celui-ci affichera alors le contenu du dataverse lié.

Peut-on rattacher un dataverse à plusieurs dataverses parents ?

Un dataverse n’est rattaché qu’à un seul dataverse parent, celui dans lequel il a été créé. Mais il est possible de lier un dataverse à un autre, celui-ci affichera alors le contenu du dataverse lié.