Europees Data Portaal

Data-checklist

Data-checklist

Belangrijke stappen die u moet doorlopen voor de data te gebruiken.

Toegang verkrijgen tot data is de eerste stap. Data zijn geen doel op zich. Data kunnen op verschillende manieren en voor verschillende doeleinden worden gebruikt. Data kan verkrijgbaar zijn onder verschillende licenties, in verschillende formaten en kwaliteit.


Uw doeleinde

Bepaal uw doeleinde: Er zijn verschillende doeleinden waarvoor het gebruik van Open Data waarde kan toevoegen aan uw activiteiten. Open Data kunnen inzicht geven in een specifiek onderwerp waarover u meer informatie wilt of waarover u wilt schrijven (bijv. datajournalistiek). Open Data kunnen ook informatie toevoegen aan een toepassing of dienst. Bijvoorbeeld details over scholen als u een toepassing aan het ontwikkelen bent om ouders te helpen de beste school voor hun kinderen te vinden. Bedrijven kunnen Open Data ook gebruiken om hun klantprofielen te verbeteren en zich zo beter aan de behoeften van hun klanten aanpassen. Of het nu voor particulier of commercieel gebruik is, Open Data bieden veel mogelijkheden.

Datalabels identificeren: Als u weet waarvoor u de data nodig heeft, is het belangrijk om te kijken of de welke data bij uw behoefte passen door te kijken naar de metadata (data over de data). Als u bijvoorbeeld een toepassing wilt bouwen die advies geeft over het beste basisonderwijs in de buurt, moet u controleren of de dataset die u wilt gebruiken, scholen omvat die lager onderwijs bieden, het specifieke gebied dat u wilt omvatten en of er prestatie-indicatoren beschikbaar zijn.

 

Open licentie

Openheid controleren: Bekijk de licentie-informatie die is verstrekt over de dataset. Zorg dat er een licentie beschikbaar is waarmee u gebruik kunt maken van de data op de manier waarop u van plan bent (bijv. dat commercieel hergebruik wordt toegestaan wanneer u een commerciële toepassing ontwikkelt).

Toeschrijving-eisen controleren: Het is mogelijk dat er in de licentie staat dat mensen die de data gebruiken, moeten vermelden wie deze data publiceren, hetgeen betekent dat u de eigenaar vermeldt wanneer u uw product of dienst beschikbaar stelt. Dit heet toeschrijving.

Deel-soortgelijk-eisen controleren: Als wordt aangegeven dat mensen die de Open Data met andere data mengen ook de resultaten hiervan als Open Data moeten vrijgeven, bent u verplicht om ook uw eigen data te onder een soortgelijke licentie publiceren wanneer deze data is toegevoegd aan de originele bron. Dit wordt deel-soortgelijk genoemd. Zorg dat de licentie overeenkomt met uw doeleinde voor het gebruik van de data.

Als er geen licentie is, is er geen informatie over de voorwaarden en bepalingen van toepassing! U kunt contact opnemen met de eigenaar van de data om te controleren welk gebruik niet is toegestaan.

 

Bestandsindeling

Nadat u hebt besloten dat een specifieke dataset precies is wat u zoekt, kunt u er waarschijnlijk voor kiezen om de datasets in verschillende bestandsindelingen te downloaden. Afhankelijk van uw computervaardigheden, kunt u het bestandstype kiezen dat het meest geschikt is. De meest gebruikte bestandsindeling voor data in tabelvorm is '.csv'. Hiermee kunt u informatie toevoegen aan het bestand of berekeningen maken met de data. Datasets die kunnen worden aangepast, worden gepubliceerd gebruikmakend van een open bestandsindeling. De meeste datasets zijn verkrijgbaar in een open bestandsindeling, maar houd er rekening mee dat sommige indelingen (bijv.'pdf') niet kunnen worden gewijzigd.

 

Datakwaliteit

Op de pagina waar u de dataset wilt downloaden, kunt u informatie opzoeken over de laatste datum waarop het bestand is gewijzigd. Als u data voor een bepaalde periode nodig heeft, kunt u zo controleren of de data informatie over de tijdsperiode omvat of onlangs is bijgewerkt. U zal moeten controleren of de informatie die u verwacht te vinden in het bestand, daadwerkelijk is opgenomen en dat u de diverse labels begrijpt.

 

Hier volgt een korte checklist, ontwikkeld door het Open Data Institute:

Vorm

  • hoe worden de data verwerkt?
  • is het in ruwe of bewerkte vorm?
  • hoe zal de vorm ervan van invloed zijn op uw analyse/product/toepassing?
  • welke syntactische (taal) en semantische (betekenis) transformaties moet u maken?
  • is dit compatibel met andere datasets waarover u beschikt?

Kwaliteit

  • hoe actueel zijn de data?
  • hoe regelmatig worden de data bijgewerkt?
  • begrijpt u alle velden en hun context?
  • voor hoe lang zullen ze worden gepubliceerd? wat weet u over de verbintenis van de uitgever?
  • Wat weet u over de juistheid van de data?
  • hoe wordt er met ontbrekende data omgegaan?

Kijk eens rond op het Europees dataportaal en kom te weten welke data past bij uw behoefte.