Open Refine est un outil open source, multiplateformes, qui s’installe sur son ordinateur et qui permet le traitement et le nettoyage des données. La version 2.7 de Open Refine est sortie le 17 juin 2017. Les principales nouveautés (voir realeases) sont :
- La reconciliation des données avec Wikidata, maintenu par la Wikimedia Foundation qui remplace l’ancien service de reconciliation avec Freebase.
- un bouton d’export de clusters dans les fonctionnalités de clustering
- La traduction en japonais
- Des opérations logiques multiples
- une fonction “Transform All” qui permet d’appliquer les opérations sur les autres colonnes
- La résolution de bug
Un manuel d’utilisation collaboratif, en français, est disponible sur le wiki de l’IST INRA “Traitements documentaires – Outils et savoir-faire” . Détaillé et illustré de nombreux exemples, il s’étoffera et évoluera avec les astuces et cas d’usages que nous partagerons.
Sources
- Le site : http://openrefine.org/
- Traitements documentaires – Outils et savoir-faire” .Wki de l’IST INRA