Europejski Portal Danych

Lista kontrolna

Lista kontrolna

Ważne czynności, jakie należy wykonać przed wykorzystaniem danych.

Pierwszym krokiem jest uzyskanie dostępu do danych. Dane nie są celem samym w sobie. Dane mogą być wykorzystywane na różne sposoby i w różnych celach. Dane mogą też być udostępniane na różnych licencjach, w różnych formatach i w różnej jakości.

Twój cel

Określ swój cel: Wiele jest celów, w przypadku których użycie otwartych danych może podnieść wartość naszych działań. Otwarte dane pozwalają wejrzeć głębiej w określony temat, o którym chcemy wiedzieć więcej albo nawet napisać (tzw. dziennikarstwo danych). Otwarte dane mogą także uzupełniać aplikacje bądź usługi o wymagane informacje, jak np. informacje o szkołach, jeżeli zamierzamy stworzyć aplikację, która będzie pomagać rodzicom w wyborze jak najodpowiedniejszej szkoły dla swojego dziecka. Podmioty gospodarcze także mogą wykorzystywać otwarte dane do doskonalenia profili swoich klientów oraz lepszego dostosowywania się do ich potrzeb. Niezależnie od tego, czy są wykorzystywane do użytku prywatnego czy komercyjnego, otwarte dane oferują wiele możliwości.

Określ etykiety danych: Kiedy znamy już cel, do którego potrzebne są dane, należy koniecznie sprawdzić, czy dane odpowiadają na nasze potrzeby, zapoznając się z metadanymi (czyli danymi o danych). Na przykład, jeżeli zamierzamy stworzyć aplikację, która będzie doradzać w wyborze jak najlepszej szkoły podstawowej w naszej okolicy, trzeba sprawdzić, czy zbiór danych, który ma być wykorzystany, obejmuje szkoły podstawowe, określony rejon i stosowne wskaźniki.

Licencja otwarta

Sprawdź otwartość: Zapoznaj się z informacją o licencji, którą objęty jest zbiór danych. Należy sprawdzić, czy licencja pozwala na wykorzystywanie danych w interesujący nas sposób (np. jeżeli tworzymy aplikację komercyjną, czy dopuszczalne jest ponowne wykorzystywanie danych w sposób komercyjny).

Sprawdź wymagania atrybucji: Licencja może zawierać wymóg podawania wydawcy danych w przypadku ich użycia, tzn. że musimy podać właściciela danych, kiedy udostępniamy produkt lub usługę. Taki wymóg nazywamy atrybucją.

Sprawdź wymóg udostępniania na tych samych warunkach: Jeżeli zaznaczono, że dodając jedne dane do drugich należy opublikować uzyskane w ten sposób dane wynikowe jako dane otwarte, mamy obowiązek opublikować swoje dane na podobnej licencji, jeżeli dodamy inne dane do pierwotnego źródła. To oznacza wymóg udostępniania na tych samych warunkach. Sprawdź, czy licencja jest zgodna z celem, do którego dane mają zostać wykorzystane.

Brak licencji oznacza brak informacji o obowiązujących warunkach wykorzystania. W takim przypadku warto skontaktować się z właścicielem danych w celu sprawdzenia dopuszczalnych sposobów ich wykorzystania.

 

Format pliku

Kiedy już stwierdzimy, że określony zbiór danych zawiera dokładnie to, co jest nam potrzebne, możemy przejść do pobrania go w jednym z dostępnych formatów. Na podstawie posiadanej wiedzy informatycznej wybieramy najodpowiedniejszy rodzaj pliku. Najpopularniejszym formatem dla danych tabelarycznych jest „.csv”. Pozwala on na dodawanie informacji do pliku oraz wykonywanie obliczeń z użyciem zawartych w nim danych. Zbiory danych, które można zmieniać publikowane są w formacie otwartym. Większość zbiorów danych dostępnych jest w formacie otwartym, ale należy pamiętać, że niektóre formaty (np. „.pdf”) nie dają możliwości wprowadzania zmian.

 

Jakość danych

Na stronie, z której chcemy pobrać zbiór danych, powinna znajdować się data ostatniej modyfikacji pliku. Jeżeli potrzebne są nam dane z konkretnego okresu, trzeba sprawdzić, czy podana jest informacja o przedziale czasu albo czy plik był ostatnio aktualizowany. Należy też upewnić się, czy informacje, które spodziewamy się znaleźć w pliku rzeczywiście są w nim zamieszczone i czy rozpoznajemy poszczególne etykiety.

 

Oto krótka lista kontrolna opracowana przez Open Data Institute

Forma

  • w jaki sposób dane są przetworzone?
  • czy są w postaci przetworzonej czy nieprzetworzonej?
  • jak forma wpłynie na analizę/produkt/aplikację?
  • jakie przekształcenia syntaktyczne (język) i semantyczne (znaczenie) będą wymagane?
  • czy są kompatybilne z innymi, posiadanymi już zbiorami danych?

Jakość

  • na ile aktualne są dane?
  • z jaką regularnością są aktualizowane?
  • czy wszystkie pola i kontekst danych są zrozumiałe?
  • jak długo będą publikowane? jakie jest zobowiązanie wydawcy?
  • co wiemy o dokładności danych?
  • w jaki sposób rozwiązywany jest problem brakujących danych?

 

Rozejrzyj się po Europejskim Portalu Danych i sprawdź, jak może zaspokoić twoje zapotrzebowanie na dane.