Structuration de datasets et publication d’un datapaper

Nous souhaitons publier un datapaper (dans data in brief) présentant des données de spectrométrie IR dans le cadre d’un projet. Pour construire des modèles de prédiction il est nécessaire d’avoir des valeurs de référence pour les variables que l’on cherche à prédire : on utilise des analyses de laboratoire. Les données de référence utilisées sont celles contenues dans des dataverses déjà existants ou à créer.
Est-il possible à votre avis de citer les dataverses des différents sites pour les datasets d’analyses de référence ainsi que les dataverses qui concernent les données spectrales ?
Ou bien est-il préférable de faire un dataset analyses de référence dans le dataverse d’analyses spectrales en indiquant que c’est une extraction de données déjà existantes (en indiquant le DOI correspondant), ce qui aurait l’avantage de se limiter aux variables que l’on a choisies de prédire (1 à 3 variables quand il y en a 6 dans la table du dataverse par site) ?

INRA-QR-IST-LOGO-50

Il ne semble pas y avoir une solution meilleure que l’autre, les deux sont possibles :

  • Vous pouvez créer un ou plusieurs jeu(x) de données pour vos données de spectrométrie IR, et citer dans la publication les datasets utilisés (par ex. les données des analyses de référence). Si vous créez vos datasets dans le portail Data INRAE, vous pouvez utiliser la métadonnée « Related datasets » pour relier les différents datasets entre eux.  Par contre, pour l’instant, un dataverse n’est pas citable à partir d’un DOI (car il n’en a pas).
  • Vous pouvez aussi publier dans votre dataverse une extraction des données utilisées, si la licence liée à ces données l’autorise.

À noter qu’il est possible dans Data INRAE, à partir d’un jeu de données, de générer une ébauche de datapaper formatée selon le modèle Data In Brief. Cette fonctionnalité est disponible depuis la page d’accueil du portail Data INRAE, en haut à gauche via le bouton « Génération datapaper ». Indiquez le DOI du dataset présent dans Data INRAE et sélectionnez le modèle « Data In Brief ».

N’hésitez pas à prendre contact avec le support Data INRAE (datainrae[at]inrae.fr) si vos datasets sont créés dans le portail Data INRAE.

Ce contenu a été publié dans Données de la recherche. Vous pouvez le mettre en favoris avec ce permalien.