Europäisches Datenportal

Checkliste zur Verwendung von Daten

Checkliste zur Verwendung von Daten

Wichtige Schritte, die vor der Datenverwendung zu befolgen sind.

Ein erster Schritt ist, Zugang zu Daten zu haben. Die Daten sind kein Selbstzweck. Daten können auf unterschiedliche Weise und für unterschiedliche Zwecke verwendet werden. Daten können auch mit verschiedenen Lizenzen, in verschiedenen Formaten und unterschiedlicher Qualität verfügbar sein.

 

Ihr Zweck

Definieren Sie ihren Zweck: Es gibt verschiedene Zwecke, für die die Verwendung von Offenen Daten Ihren Aktivitäten einen Mehrwert verleihen kann. Offene Daten können einen Einblick in ein spezifisches Thema bieten, über welches Sie mehr Informationen benötigen oder schreiben wollen (d.h. Datenjournalismus). Offene Daten können zu einer Anwendung oder einem Dienst auch benötigte Informationen hinzufügen, wie etwa Informationen über Schulen, wenn sie gerade eine Anwendung entwickeln, mit der sie Eltern helfen wollen, die beste Schule für ihre Kinder zu finden. Unternehmen können Offene Daten auch verwenden, um ihre Kundenprofile zu verbessern und eher in der Lage zu sein, auf die Bedürfnisse ihrer Kunden einzugehen. Ob für private oder kommerzielle Verwendung - Offene Daten bieten viele Möglichkeiten.

Datenlabels erkennen: Wenn Sie wissen, für welchen Zweck Sie die Daten benötigen, müssen Sie prüfen, ob die Daten für ihren Zweck passen, indem sie sich die Metadaten (Daten über die Daten) anschauen. Wenn Sie etwa eine Anwendung entwickeln wollen, die Informationen über die beste Grundschule in der Nachbarschaft liefert, sollten Sie folgendes prüfen: Enthält der zu verwendende Datensatz Schulen, die eine Grundschulbildung anbieten? Umfasst dieser eine bestimmte Region, die Sie mit einschließen wollen? Sind Leistungsindikatoren verfügbar?

 

Offene Lizenz

Offenheit überprüfen: Schauen Sie sich die Lizenzinformation zu dem Datensatz an. Stellen Sie sicher, dass eine Lizenz verfügbar ist, die es ihnen erlaubt, die Daten so zu verwenden, wie Sie es vorhaben (z.B. dass eine kommerzielle Verwendung erlaubt ist, wenn eine kommerzielle Anwendung entwickelt werden soll).

Namensnennung kontrollieren: Es ist möglich, dass die Lizenz die Vorschrift enthält, dass Personen, die die Daten verwenden, angeben müssen, wer diese veröffentlicht. Dies bedeutet, dass man den Dateneigner nennen muss, wenn man das Produkt oder den Dienst verfügbar macht. Dies wird Namensnennung (Attribution) genannt.

Weitergabe unter gleichen Bedingungen überprüfen: Wenn angegeben wird, dass Personen, die Daten mit anderen Daten vermischen, die Ergebnisse ebenfalls als Offene Daten veröffentlichen müssen, sind Sie verpflichtet, Ihre eigenen Daten unter einer ähnlichen Lizenz zu veröffentlichen, nachdem Sie andere Daten der Originalquelle hinzugefügt haben. Dies wird Weitergabe unter gleichen Bedingungen (Share-Alike) genannt. Stellen Sie sicher, dass die Lizenz dem Verwendungszweck ihrer Daten entspricht.

Falls keine Lizenzen vorliegen sollten, gibt es keine Informationen über die anwendbaren Bedingungen! Sie sollten den Eigentümer der Daten kontaktieren, um zu überprüfen welche Verwendungszwecke erlaubt sind.

 

Dateiformat

Nachdem Sie sich für einen bestimmten Datensatz entschieden haben, der genau Ihren Vorstellungen entspricht, können Sie diesen wahrscheinlich in verschiedenen Formaten herunterladen. Je nach Ihren Computerkenntnissen, können Sie den Dateityp herunterladen, der am besten passt. Das am meisten verbreitete Dateiformat für Tabellen ist „.csv“. Es erlaubt Ihnen, der Datei weitere Daten hinzuzufügen oder mit den Daten Berechnungen anzustellen. Datensätze, die angepasst werden können, werden in einem offenen Dateiformat veröffentlicht. Die meisten Datensätze sind in einem offenen Dateiformat erhältlich, doch denken Sie daran, dass einige Formate (z.B. „.pdf“) nicht verändert werden können.

 

Datenqualität

Auf der Seite, von der Sie den Datensatz herunterladen möchten, sollte eine Information zum letzten Änderungsdatum der Datei stehen. Wenn Sie Daten für einen bestimmten Zeitraum benötigen, müssen Sie überprüfen, ob die Information über den Zeitraum verfügbar ist oder vor kurzem aktualisiert wurde. Sie sollten überprüfen, ob die Informationen, die Sie in der Datei erwarten, auch tatsächlich darin enthalten sind und dass Sie die verschiedenen Kennzeichnungen verstehen.

 

Hier ist eine kurze, vom Open Data Institute entwickelte Checkliste:

Form

  • Wie wurden die Daten verarbeitet?
  • Liegen sie in roher oder verarbeiteter Form vor?
  • Inwiefern wird die Form Ihre Analyse/Ihr Produkt/Ihre Anwendung beeinflussen?
  • Welche syntaktischen (Sprache) und semantischen (Bedeutung) Veränderungen werden Sie machen müssen?
  • Ist der Datensatz mit Ihren anderen Datensätzen kompatibel?

Qualität

  • Wie aktuell sind die Daten?
  • Wie regelmäßig werden diese aktualisiert?
  • Verstehen Sie alle Felder und ihren Kontext?
  • Wie lange werden sie veröffentlicht? Welche Verpflichtung geht der Herausgeber ein?
  • Was wissen Sie über die Genauigkeit der Daten?
  • Wie werden fehlende Daten gehandhabt?

Schauen Sie sich auf dem Europäischen Datenportal um und entdecken Sie, wie dieses Portal Ihren Datenbedarf abdeckt.