Европейски Портал за данни

Контролен списък

Контролен списък

Важни стъпки, които трябва за изпълните, преди да използвате данните.

Първата стъпка е получаването на достъп до данните. Данните сами по себе си не може да бъдат цел. Данните могат да се използват по различни начини и за различни цели. Данните могат да се предлагат с различни лицензи, формати и качество.


Вашата цел

Определете целта си: Има различни цели, за които използването на свободно достъпните данни може да добави стойност към вашите дейности. Свободно достъпните данни могат да предоставят информация по конкретна тема, за която искате да получите повече информация или дори да пишете (т.е. журналистически данни). Свободно достъпните данни също така могат да добавят нужната информация за приложение или услуга, като например детайли за училищата, ако разработвате приложение, което да помага на родителите да намерят най-доброто училище за децата си. Предприятията също така могат да използват свободно достъпни данни, за да подобрят профилите на своите клиенти и да са в състояние да отговарят по-добре на нуждите на своите клиенти. Независимо от това дали ще се използват за лични или за комерсиални нужди, свободно достъпните данни предлагат много възможности.

Идентифицирайте данните: Ако знаете за каква цел ще са ви необходими данни е важно да проверите дали данните отговарят на вашите нужди, като прегледате метаданните (данни за данните). Например, ако искате да създадете приложение, което да дава съвети за най-доброто основно образование в квартала, трябва да проверите дали наборът от данни, който искате да използвате, включва училища, които предлагат основно образование, обхваща специфичната област, която искате да включите, и дали са налични показатели за изпълнение.

 

Открит лиценз

Проверете за свободен достъп: Обърнете внимание на информацията за лиценза, предоставен за набора от данни. Уверете се, че предлаганият лиценз ви позволява да използвате данните по начина, по който възнамерявате да направите това (например, че допуска повторна търговска употреба, ако разработите търговско приложение).

Проверете условията за приписване: Възможно е в лиценза да се посочва, че хората, които използват данните, трябва да посочат кой ги е публикувал, което означава, че трябва да посочите собственика на данните, когато предлагате вашия продукт или услуга. Това се нарича приписване.

Проверете условията за равно споделяне: Ако в лицензът се казва, че хора, които смесват данните с други данни, трябва да публикуват резултатите като свободно достъпни данни, вие сте задължени да публикувате своите собствени данни с подобен лиценз, след като сте добавили други данни в оригиналния източник. Това се нарича равно споделяне. Уверете се, че лицензът отговаря на целта за използване на данните.

Open Licence Assistant

При липса на лиценз няма налична информация за приложимите условия! Можете да поискате да се свържете със собственика на данните, за да проверите за какво е позволено да се използват.

 

Файлов формат

След като сте решили, че даден набор от данни отговаря на това, което търсите, най-вероятно ще изберете да изтеглите наборите от данни в различни файлови формати. В зависимост от вашите компютърни умения можете да изберете типа на файла, който е най-подходящ. Най-често използваният файлов формат за таблични данни е „.csv“. Той ви позволява да добавяте друга информация към файла или да правите изчисления с данните. Наборите от данни, които могат да се променят, са публикувани в отворен файлов формат. Повечето набори от данни са налични в отворен файлов формат, но имайте предвид, че някои формати (например „.pdf“) не може да се променят.

 

Качество на данните

На страницата, където можете да свалите набора от данни, трябва да намерите информация за последната дата на промяна на файла. Ако се нуждаете от информация за определен период от време, трябва да проверите дали информацията е за този периода от време или наскоро е била актуализирана. Трябва да проверите дали информацията, която сте очаквали да намерите във файла всъщност се съдържа във файла и че разбирате отделните етикети.

 

Предлагаме ви кратък контролен списък, разработен от Института за отворени данни(Open Data Institute):

Формат

  • Как се обработват данните?
  • В какъв вид са — необработен или обработен?
  • Как видът им ще се отрази на вашия анализ/продукт/приложение?
  • Какви синтактични (езикови) и семантични (смислови) трансформации трябва да направите?
  • Съвместим ли е този набор с останалите набори от данни, които имате?

Качество

  • Актуални ли са данните?
  • Колко често се обновяват?
  • Разбирате ли всички полета и техния контекст?
  • За колко време ще бъдат публикувани данните? Какъв е ангажиментът на издателя?
  • Какво знаете за точността на данните?
  • Как процедирате с липсващите данни?

Разгледайте Европейския портал за данни и разберете до каква степен отговаря на нуждите ви от данни.