Afficher et utiliser des données

Affichage d’un dataverse

Pour afficher un dataverse cliquer sur son nom. La page d’affichage d’un dataverse affiche par défaut tous les dataverses et datasets qu’il contient. Pour afficher également les fichiers, cocher “Files” :

La nature du contenu est identifiée par une couleur de bordure et un icône spécifiques :

Par défaut l’affichage des contenus d’un dataverse se fait du plus récent au plus ancien :

 

La page d’un dataverse permet d’envoyer un message à la(les) personne(s) contact pour ce dataverse et de le partager sur Facebook, Twitter et Google+ :

Un dataverse ne peut pas être exporté dans son ensemble, ni les métadonnées qui le décrivent.

Affichage d’un dataset, citation, export des métadonnées

Pour afficher un dataset à partir d’une liste de datasets, cliquer sur son titre ou sur son DOI.

La page d’affichage d’un dataset joue le rôle de landing page (ou page d’atterrissage) associée au DOI (le DOI est déclaré auprès de DataCite).

 

Note : Sur Data INRAE, le nombre de téléchargements (Downloads) ne prend pas en compte les téléchargements réalisés par les administrateurs du dataverse parent, ainsi que ceux provenant de l’exploration des données via TwoRavens ou Data Explorer.

Elle permet :

  • d’afficher et d’exporter la citation du dataset

  • de contacter le déposant et de partager le dataset sur Facebook, Twitter et Google+ ;
  • d’afficher la liste des fichiers associés au dataset (filtres possibles sur le type de fichier, le type d’accès et le libellé) ;
  • selon les droits de l’utilisateur : de télécharger ou d’explorer un fichier, ou de demander l’accès à un fichier en accès restreint.
    • plusieurs formats proposés pour le téléchargement des fichiers tabulés :
  • de voir et d’exporter (en Dublin Core, DDI, Json et Schema.org JSON-LD) les métadonnées décrivant le dataset,

  • de voir et de comparer les différentes versions du dataset (créées par les modifications de métadonnées ou ajouts/suppressions de fichiers).

versions d'un dataset

Affichage d’un fichier, citation et export des métadonnées et des données

Pour afficher la page descriptive d’un fichier cliquer sur son titre.

Cette page permet :

  • d’afficher et d’exporter la citation du fichier. Celle-ci est basée sur la citation du dataset à laquelle s’ajoutent le nom du fichier, son DOI (différent de celui du dataset) et son empreinte numérique (selon le format du fichier UNF1 : universal numeric fingerprint ou MD52 : Message Digest 5). La version est celle du dataset.
  • de contacter le déposant et de partager le dataset sur Facebook, Twitter et Google+
  • d’explorer les données du fichier, selon l’autorisation accordée par le déposant. Les outils d’exploration proposés dépendent du format du fichier (voir Exploration des données d’un fichier)
    explorer
  • de télécharger le fichier selon l’autorisation accordée par le déposant (accès public ou restreint : voir restreindre l’accès aux données).
    Plusieurs formats d’export sont proposés pour les fichiers tabulés :

 

 

 

 

 

 

Pour des raisons de performance de l’application, le téléchargement des fichiers zip est actuellement limité à 10Mbits. Un fichier « Manifest.txt » est généré lors du téléchargement et indique quels fichiers ont été téléchargés, et la raison pour laquelle les autres n’ont pu l’être.

  • d’afficher et d’exporter les métadonnées décrivant le fichier. Les métadonnées varient selon le type de fichier.
    Exemple d’un fichier tabulé : le nombre de variables et d’observations est indiqué.
    fichier tabule variables et observations
  • Exemple d’un fichier shapefile zippé :
    fichier zip

Prévisualiser les données d’un fichier

Il est possible de prévisualiser certains fichiers directement dans l’interface de Data INRAE, sans avoir à les télécharger. Cette fonction de prévisualisation est basée sur le type MIME du fichier, qui identifie le format des données. Sont actuellement pris en compte les types :

text image audio video application
  • fasta
  • fastq
  • html
  • tab
  • tsv
  • txt
  • gif
  • jpeg
  • png
  • ogg
  • mp3
  • mpeg
  • wav

 

  • mp4
  • ogg
  • quicktime

Note : pour prévisualiser un fichier .ogg dans le lecteur vidéo, il faut modifier son extension en .ogv

  • pdf

La prévisualisation d’un fichier est proposée sur la page du dataset correspondant ou sur la page du fichier. Un bouton Explorer permet d’afficher, après avoir éventuellement accepté les conditions d’utilisation, une page intitulée « Aperçu [type MIME] ».
Exemple pour un fichier .pdf :

explorer-pdf
Aperçu d’un fichier pdf via la fonction Explorer

S’il n’y pas de conditions d’utilisation associées au dataset, la prévisualisation d’un fichier est possible directement sur la page du fichier, dans l’onglet Prévisualisation. Cet onglet est absent si des conditions d’utilisation sont associées au dataset.

pdf previsualisation
Prévisualisation d’un fichier pdf

Exploration des données d’un fichier

Dataverse peut être couplé à des applications externes pour visualiser les données des fichiers déposés.

Explorer les données tabulées

Lorsque des données tabulées sont présentes dans un fichier, un bouton Explorer (Explore) est proposé. Il permet d’accéder aux outils de prévisualisation, à TwoRavens et à Data Explorer.

TwoRavens

TwoRavens permet l’analyse statistique de données quantitatives et l’utilisation de graphiques interactifs pour filtrer et afficher les résultats.

Ex : https://data-preproduction.inrae.fr/file.xhtml?persistentId=doi:10.5072/MSWKRW/F42FI7&version=15.1 (enquête sur les élections américaines 2000).

Data Explorer

Data Explorer liste les variables d’un fichier tabulé, permet de les requêter, de les visualiser sous forme de graphiques et de faire des analyses croisées.

Exemple de représentation à partir des données du dataset https://data-preproduction.inrae.fr/file.xhtml?persistentId=doi:10.5072/MSWKRW/F42FI7&version=15.1 (enquête sur les élections américaines 2000).

  • Représentation graphique des données

  • Vue en tableau

Explorer les données géospatiales avec WorldMap via Geoconnect

Les données géospatiales peuvent être explorées sur WordMap si le fichier qui les contient a été configuré pour cela (voir Fichiers de données géospatiales).
Le bouton  Explorer (Explore) est alors proposé.

Exemple : https://data.inrae.fr/dataset.xhtml?persistentId=doi:10.15454/VC9UR5&version=4.1

https://data.inrae.fr/dataset.xhtml?persistentId=doi:10.15454/VC9UR5&version=4.1
Prévisualisation d’un fichier shapefile

S’il n’y pas de conditions d’utilisation associées au dataset, la prévisualisation du fichier est possible directement sur la page du fichier, dans l’onglet Prévisualisation. Cet onglet est absent si des conditions d’utilisation sont associées au dataset.

Prévisualisation d'un fichier shapefile

 

Geoconnect est capable également de traiter des données géoréférencées contenues dans les fichiers tabulés. Voir http://guides.dataverse.org/en/latest/user/data-exploration/worldmap.html

Génération d’un template de data paper

Cette fonction, développée spécifiquement par INRAE, permet de générer une ébauche de data paper à partir d’un DOI existant sur le portail.

Sur la page d’accueil, cliquer sur Génération datapaper, sélectionner un modèle (modèle générique ou modèle adapté à la revue Data In Brief), saisir un numéro de DOI puis cliquer sur Genérer : un document contenant toutes les métadonnées associées à ce DOI est généré au format Open Office.

Notes

[1]. L’UNF: universal numeric fingerprint, est une petite chaîne de caractères alphanumériques de longueur fixe résumant le contenu de l’ensemble de données. Toute modification des données, aussi minime soit-elle, entraîne une nouvelle signature électronique universelle. L’UNF assure la non corruption du fichier.
[2]. L’algorithme MD5, pour Message Digest 5, est une fonction de hachage qui permet d’obtenir l’empreinte numérique d’un fichier pour vérifier l’intégrité d’un fichier téléchargé.