Checklist pour utiliser des données

Suivez-nous  Twitter Facebook Google+ LinkedIn

Checklist pour utiliser des données

Étapes importantes à suivre avant d’utiliser les données.

L’accès aux données est une première étape. En effet, les données ne sont pas une fin en soi. Elles peuvent être utilisées de différentes façons et à différentes fins. Leurs licences, leurs formats et leur qualité peuvent également varier. 

 

Votre objectif

Définissez votre objectif: L’utilisation des données ouvertes peut ajouter de la valeur à vos activités de différentes manières. Elles peuvent permettre de fournir des informations sur un sujet spécifique que vous aimeriez approfondir ou sur lequel vous souhaitez écrire (journalisme de données). Les données ouvertes peuvent également permettre d’ajouter des informations qui sont nécessaires pour une application ou un service, par exemple des détails sur les établissements scolaires si vous développez une application qui vise à aider les parents à trouver le meilleur établissement pour leurs enfants. Les entreprises peuvent également utiliser des données ouvertes pour améliorer leur connaissance du profil de leurs clients et, ainsi, mieux répondre à leurs besoins. Que ce soit pour un usage privé ou commercial, les données ouvertes offrent de nombreuses possibilités.

Identifier les données: Si vous savez dans quel but vous avez besoin de données, il est important d’examiner si les données correspondent à vos besoins en consultant les métadonnées (les données relatives aux données). Par exemple, si vous souhaitez créer une application qui fournit des conseils sur les meilleurs établissements d’enseignement primaire du quartier, vous devez vérifier si les données que vous souhaitez utiliser intègrent les écoles primaires, si elles couvrent la région que vous voulez inclure et si des indicateurs de performances sont disponibles.

 

Licence ouverte

Vérifiez le degré d’ouverture des données: Pensez à consulter les informations fournies dans la licence des données. Assurez-vous de disposer d’une licence qui vous permet d’utiliser les données comme vous avez l’intention de le faire (vérifiez par exemple que la réutilisation commerciale est autorisée si vous développez une application commerciale). 

Vérifiez les conditions d’attribution: La licence peut stipuler que les personnes qui utilisent les données doivent citer leur éditeur. Cela signifie que vous devez mentionner le nom du propriétaire des données lorsque vous mettez votre produit ou service à disposition. C’est ce que l’on appelle l’attribution. 

Vérifiez les conditions de partage à l’identique: Si la licence indique que les personnes qui associent les données à d’autres données doivent proposer ce nouveau contenu sous forme de données ouvertes, vous devez publier vos propres données sous une licence similaire après avoir ajouté les données aux données d’origine. C’est ce que l’on appelle le partage de conditions initiales à l’identique. Assurez-vous que la licence correspond à l’utilisation que vous souhaitez faire des données. 

En l’absence de licence, il n’y a aucune information sur les conditions d’utilisation qui s’appliquent! Vous pouvez prendre contact avec le propriétaire des données afin de vérifier quelles sont les utilisations autorisées.

 

Format des fichiers

Lorsque des données spécifiques correspondent exactement aux critères que vous recherchez, vous pouvez sûrement les télécharger dans différents formats de fichiers. Vous pouvez choisir le type de fichier qui correspond le mieux à vos compétences en informatique. Le format de fichier le plus commun pour les données tabulaires est «.csv». Il vous permet d’ajouter d’autres informations au fichier ou d’utiliser les données pour effectuer des calculs. Les données qui peuvent être modifiées sont publiées dans un format de fichier ouvert. La plupart des données sont disponibles dans un format ouvert, mais n’oubliez pas que certains formats (par exemple, «.pdf») ne sont pas modifiables. 

 

Qualité des données

Sur la page de téléchargement des données, vous devez trouver des informations sur la date de la dernière modification du fichier. Si vous avez besoin des données couvrant une période particulière, vous devez vérifier si des informations sur la période sont disponibles ou si elles ont été mises à jour récemment. Vous devez vérifier que les informations que vous vous attendiez à trouver dans le fichier y figurent effectivement et que vous comprenez les différents libellés. 

 

Voici une brève checklist mise au point par l’Open Data Institute:

Format

  • Comment les données ont-elles été transformées?
  • Sont-elles à l’état brut ou ont-elles été transformées?
  • En quoi ce format aura-t-il des répercussions sur votre analyse, votre produit ou votre application?
  • Quelles transformations syntaxiques (langue) et sémantiques (sens) devrez-vous effectuer?
  • Les données sont-elles compatibles avec les autres données dont vous disposez?

Qualité

  • Les données sont-elles à jour?
  • À quelle fréquence sont-elles mises à jour?
  • Comprenez-vous tous les champs et leur contexte?
  • Pendant combien de temps seront-elles publiées? Quel est l’engagement de l’éditeur?
  • Que savez-vous quant à l’exactitude des données?
  • Comment les données manquantes sont-elles traitées?

Consultez le portail européen de données et découvrez dans quelle mesure il répond à vos besoins en matière de données.

Vos suggestions nous aident à amélorer le site de façon continue. Des suggestions?
Version 1.3 / Dernière mise à jour: 23/02/2017 Haut