Hyppää pääsisältöön

Mitä avoin data on?

Euroopan dataportaali haravoi metadataa julkisen sektorin informaatiosta, joka on saatavilla julkisissa dataportaaleissa Euroopan eri maissa. Tarjoamme myös datan toimittamista ja datan uudelleenkäytön hyötyjä koskevaa tietoa.

Avoin (valtion) data viittaa julkisten elinten keräämään, tuottamaan tai maksamaan tietoon (toinen nimitys on julkisen sektorin tieto), joka on annettu vapaasti uudelleenkäytettäväksi mihin tahansa tarkoitukseen. Lisenssi määrittelee käyttöehdot. Nämä avoimen datan periaatteet on kuvattu tarkemmin avoimen tiedon määrittelyssä.

Julkisen sektorin tiedot ovat julkisen sektorin hallinnoimaa tietoa. Julkisen sektorin tietojen uudelleenkäyttöä koskeva direktiivi tarjoaa yleiset oikeudelliset puitteet Euroopan markkinoille valtion hallinnoimaa dataa koskien. Se rakentuu sisämarkkinoiden pääpilareille: datan vapaa liikkuvuus, läpinäkyvyys ja reilu kilpailu. On tärkeää huomata, että kaikki julkisen sektorin tiedot eivät ole avointa dataa.

Lue lisää PSI-direktiivistä ja DG CONNECTin muista kuin lainsäädäntöasioita koskevista aktiviteeteista täällä.

Datan käyttämisen hyödyt

Avoimen datan hyödyt ovat monenlaisia, julkishallinnon parantuneesta tehokkuudesta ja yksityissektorin taloudellisesta kasvusta laajempaan yhteiskunnalliseen hyvinvointiin.

Suorituskykyä voidaan parantaa avoimella datalla ja auttaa tehostamaan julkisia palveluja. Parempi prosessien tehokkuus ja julkisten palvelujen toimitus saavutetaan jakamalla dataa yli sektorien, mikä voi esimerkiksi tarjota näkymän tarpeettomiin kuluihin.

Talous voi hyötyä tietojen, sisällön ja tietämyksen helpommasta saatavuudesta, mikä puolestaan auttaa innovatiivisten palvelujen kehittämistä ja uusien liiketoimintamallien luomista.

Yhteiskunnallista hyvinvointia voidaan parantaa, kun yhteiskunta hyötyy läpinäkyvämmästä ja paremmin käytettävissä olevasta tiedosta. Avoin data parantaa yhteistyötä, osallistumista ja sosiaalista innovaatiota.

Kuva
Benefits of Using Data

 

Talous voi hyötyä tietojen, sisällön ja tietämyksen helpommasta saatavuudesta, mikä puolestaan auttaa innovatiivisten palvelujen kehittämistä ja uusien liiketoimintamallien luomista.

Vuonna 2016 avoimen datan suoran markkinakoon odotetaan olevan 55,3 miljardia euroa EU 28+:lle. Vuosien 2016 ja 2020 välillä markkinakoko kasvaa 36,9 %:lla, arvoon 75,7 miljardia euroa vuonna 2020 mukaan lukien inflaatiokorjaukset. Jaksolla 2016–2020 kumulatiivisen suoramarkkinakoon arvioidaan olevan 325 miljardia euroa.

Kuva
Direct market size

 

Kuva
Jobs created

 

Uusia työpaikkoja syntyy talouden virkistymisen takia ja datatyöskentelytaitoisen henkilöstön suuremman kysynnän ansiosta. Vuonna 2016 avoimen datan työpaikkoja tulee olemaan 75 000 EU:n 28+ yksityissektorilla. Vuoteen 2020 mennessä tämä määrä kasvaa vähän alle 100 000 avoimen datan työpaikaksi. Vuoteen 2020 mennessä luodaan liki 25 000 uutta suoraa avoimen datan työpaikkaa.

Julkisen sektorin suorituskykyä voidaan tehostaa avoimella datalla. Parempi prosessien tehokkuus ja julkisten palvelujen toimitus saavutetaan jakamalla dataa yli sektorien, mikä tarjoaa nopeamman pääsyn tietoon. Vuonna 2020 EU28+:lle kertyneiden kustannussäästöjen arvioidaan olevan 1,7 miljardia euroa.

Kuva
Saved in costs

 

Avoin data johtaa parempaan tehokkuuteen, kun käytetään reaaliaikaista dataa. Tämä mahdollistaa tiedon helpon saatavuuden, mikä puolestaan parantaa yksilöllistä päätöksentekoa. Kolmea tapaustutkimusta on arvioitu tarkemmin: miten avoin data voi pelastaa henkiä, miten sitä voidaan käyttää säästämään aikaa ja miten avoin data auttaa saavuttamaan ympäristöhyötyjä. Avoimella datalla on esimerkiksi potentiaalia 7 000 hengen pelastamiseen vuodessa tarjoamalla elvytystä aikaisemmin.  Lisäksi avoimen datan soveltaminen liikenteeseen voi säästää 629 miljoonaa tuntia tarpeetonta odotusaikaa EU:n teillä. 

Kuva
Better Decisions

Yhteenveto avoimen datan hyötyjä koskevan taloudellisen tutkimuksen löydöksistä on saatavana täällä:

Read more

Datan käytön tarkistusluettelo

Tärkeät läpikäytävät vaiheet ennen datan käyttöä.

Pääsy dataan käsiksi on ensimmäinen vaihe. Data ei ole itsetarkoitus. Dataa voidaan käyttää eri tavoin ja eri tarkoituksiin. Dataa voi myös olla saatavana erilaisilla lisensseillä, eri muodoissa ja eri laatuisena. 

Tarkoitus

Määrittele tarkoituksesi. On erilaisia tarkoituksia, joissa avoimen datan käyttö voi lisätä arvoa aktiviteetteihisi. Avoin data voi antaa näkemystä tiettyyn asiaan, josta haluat lisätietoa tai josta haluat vaikka kirjoittaa (datajournalismi). Avoin data voi myös lisätä tarvittuja tietoja sovellukseen tai palveluun, kuten tiedot kouluista, jos kehitetään sovellusta, joka auttaa vanhempia löytämään parhaan koulun lapsilleen. Yritykset voivat myös käyttää avointa dataa parantamaan asiakasprofiileja, jolloin ne pystyvät paremmin vastaamaan asiakkaidensa tarpeisiin. Käytettiinpä avointa dataa yksityisiin tai kaupallisiin tarkoituksiin, se tarjoaa paljon mahdollisuuksia.

Tunnista tietomerkinnät: Jos tiedät, mihin tarkoitukseen tarvitset dataa, on tärkeää tarkistaa metadataa (tietoa tiedosta) tarkastelemalla, sopiiko data tarpeisiisi. Jos esimerkiksi haluat rakentaa sovelluksen, joka neuvoo lähiseudun parhaan perusasteen koulutuksen, sinun tulee tarkistaa, sisältääkö tietoaineisto, jota haluat käyttää, perusasteen opetusta tarjoavat koulut, kattaako se haluamasi alueen ja ovatko suorituskykyindikaattorit käytettävissä.

Avoin lisenssi

Tarkista avoimuus: Katso tietoaineistolle annettu lisenssitieto. Varmista, että saatavilla on lisenssi, joka antaa sinun hyödyntää dataa aikomallasi tavalla (esim. kaupallinen uudelleenkäyttö on sallittu, jos kehität kaupallista sovellusta).

Tarkista nimeämisvaatimukset On mahdollista, että lisenssi määrää, että dataa käyttävien on nimettävä taho, joka julkaisee sitä. Tämä tarkoittaa, että sinun on mainittava omistaja, kun tarjoat tuotettasi tai palveluasi käytettäväksi. Tätä sanotaan nimeämiseksi.

Tarkista Share-Alike-vaatimukset: Jos se merkitsee, että dataa muuhun dataan yhdistävien on myös julkaistava tulokset avoimena datana, sinun on pakko julkaista oma datasi samanlaisella lisenssillä, kun olet lisännyt muuta dataa alkuperäiseen lähteeseen. Tätä kutsutaan Share-Alike-lisenssiksi Varmista, että lisenssi on linjassa datan käyttötarkoituksesi kanssa.

Open Licence Assistant

Lisenssin puuttuessa ei ole tietoa soveltuvista ehdoista! Sinun kannattaa ottaa yhteyttä datan omistajaan tarkistaaksesi millainen käyttö on sallittua.

Tiedostomuoto

Kun olet päättänyt, että tietty tietoaineisto on juuri sitä mitä etsit, pystyt todennäköisesti lataamaan tietoaineistot erilaisissa tiedostomuodoissa. Tietokonetaidoistasi riippuen voit valita sopivimman tiedostotyypin. Tavallisin tiedostomuoto taulukkodatalle on ".csv". Se sallii muun tiedon lisäämisen tiedostoon tai laskelmien tekemisen datalla. Muokattavat tietoaineistot on julkaistu avoimessa tiedostomuodossa. Useimmat tietoaineistot ovat saatavana avoimessa tiedostomuodossa, mutta muista, että jotkut muodot (esim. ".pdf") eivät ole muokattavissa. 

Datan laatu

Sivulta, johon haluat ladata tietoaineiston, tulisi löytyä tieto tiedoston viimeisestä muokkauspäivästä. Jos tarvitset dataa tietylle ajanjaksolle, sinun tulee tarkistaa, onko tietoja kyseisestä ajankohdasta annettu tai onko se äskettäin päivitetty. Sinun tulee tarkistaa, onko tieto, jota odotat löytäväsi tiedostosta, oikeasti mukana, ja että ymmärrät erilaiset merkinnät. 

Tässä on Open Data Institute kehittämä tarkistusluettelo:

Muoto

  • miten data on käsitelty?
  • onko se raakadataa vai käsitellyssä muodossa?
  • miten sen muoto vaikuttaa analyysiisi/tuotteeseesi/sovellukseesi?
  • mitä syntaktisia (kieli) ja semanttisia (tarkoitus) muunnoksia sinun tarvitsee tehdä?
  • onko se yhteensopivaa muiden tietoaineistojesi kanssa?

Laatu

  • miten ajankohtaista data on?
  • miten säännöllisesti sitä on päivitetty?
  • ymmärrätkö kaikki kentät ja niiden kontekstin?
  • miten kauan sitä julkaistaan? mikä on julkaisijan sitoutuminen?
  • mitä tiedät datan tarkkuudesta?
  • miten puuttuvaa dataa käsitellään?

Tutustu Euroopan dataportaaliin ja katso miten se sopii datatarpeisiisi.