Kāpēc datu publicēšana nav to atvēršana?
Līdzās Atvērto datu dienas 3. martā svinībām un laimīgo nākotni paredzošajam vēstījumam, ka ejam datu atvērtības virzienā, radās arī jautājums – kāpēc šie centieni strādāt ar atvērtajiem datiem sabiedrības labā ir tik mokpilni visām iesaistītajām pusēm?
Vispirms – kas ir atvērtie dati?
“Atvērtie dati ir brīvi pieejama bezmaksas informācija bez atkalizmantošanas ierobežojumiem, kuru var rediģēt un automatizēti apstrādāt ar brīvi pieejamām lietojumprogrammām (Informācijas atklātības likums)” – tā par to tiek ziņots VARAM mājaslapā, kurā ir uzsākts darbs pie Latvijas Atvērto datu portāla jeb vienotas platformas datu publicētājiem un lietotājiem. Publiskās pārvaldes datu pieejamība atvērtā veidā ir arī viens no pamatprincipiem 2014. – 2020. gada attīstības plānošanas periodā e-pārvaldes politikā. Tātad datu atvērtības aktualitāte nav tikai dažu entuziastu aicinājums.
Lai datus varētu uzskatīt par atvērtiem, tiem jābūt bez maksas, pieejamiem tiešsaistē bez piekļuves ierobežojumiem un mašīnlasāmā formātā, ko var automatizēti apstrādāt ar brīvi pieejamām lietojumprogrammām.
Bet vai tad mēs jau to nedarām?
Lūk, šeit atšķirība starp publiskajiem un atvērtajiem datiem. Publiski pieejami dati ir arī Baznīcu grāmatu ieraksti rokrakstā ieskenēti PDF formātā, jo vienkārši nāk no laikmeta, kad ne datori, ne datu koplietošanas un dalīšanās ideja šādā formātā neeksistēja. Bet šodien, kad dati tiek radīti viegli pavairojamos formātos, aktuāls kļūst jautājums par atvērtiem datiem, lai tie būtu viegli lietojami ikvienam datu patērētājam.
Ja pētnieks vai žurnālists vēlas uzzināt valsts amatpersonu algu sarakstu, pašreiz dati starp institūcijām nav salīdzināmi, pat ja tie ir publiski pieejami. Šie dati tiek publicēti, ne tikai Excel formātā, kas datu lietotājam varētu būt viegli analizējams formāts, bet pat Flippingbook formātā, kas ir nerediģējams un nepārkopējams formāts. Tādējādi dati (iespējams, bez ļauna nolūka) kļūst neizmantojami analīzei.
Šādu pašu lieku darbu var novērot arī Valsts Robežsardzes mājaslapā, kur ir pieejama aktuālākā informācija par notikumiem. Dati ir publiskoti un padarīti lasītājam šķietami saistoši, bet tālākai izmantošanai ir bezjēdzīgi.
No vienas puses ir slavējami, ka pārskati tiek izveidoti par katru dienu, tomēr esošais formāts ļauj nolasīt tikai faktu, ka ir bijuši 37 likumpārkāpēji. Turklāt trīsdimensionālā grafikā ir grūti lēst pat aptuvenu sadalījumu piedāvātajās kategorijās. Savukārt pievienotajā aprakstā skaitļi ir joprojām manuāli jāpārkopē, lai izveidotu salīdzināmus rādītājus par ilgāku periodu.
Nedrīkst aizmirst arī vēl vienu aktuālu problēmu – PDF dokumentus. Ar tabulām. Kuras ir skenētas. Sliktā kvalitātē. No vienas puses datu pētnieks ir priecīgs uzzināt faktu, ka šis materiāls tiešām ir atbildīgo pušu parakstīts un apstiprināts, tomēr tiem noteikti ir (vai vismaz ir bijusi) oriģinālā versija datorrakstā, kas varētu tikt pievienota klāt šim dokumentam.
Saprast, kāpēc mums to vajag
Publiskojot datus nelietojamā formātā, kā tas redzams ir PDF, Flippingbook vai neparocīgas vizualizācijas izskatā, interesents viegli var atmest ar roku savai idejai šos datus izpētīt. Pat pats centīgākais, kas ir bijis gatavs šos datus izpētīt līdz galam, tos manuāli pārrakstot, pieļauj augstu risku kļūdīties, lai iegūtu droši ticamu rezultātu. Tādējādi ne tikai datu lietotājs zaudē interesi par šiem datiem, bet arī no datu devēju puses zūd interese Tas neiegūst atgriezenisku reakciju par datu noderīgumu, un tā arī nemēģina uzlabot esošās prakses, iespējams, pat darot lieku darbu ar dokumentu skenēšanu vai neērtu vizualizāciju veidošanu.
Atvērto datu mērķis ir palīdzēt veidot datu apmaiņu. Iegūtie rezultāti no šādas datu apmaiņas var būt iespēja izsekot valsts budžeta izlietojumam, laicīgi pamanīt viena uzņēmuma monopolu kādā reģionā, izveidot viegli izmantojamas aplikācijas ikdienišķām vajadzībām, vai pat meklēt dārgumus.
Lai idejas un piemēri kļūtu vairāk, aicinām ikvienu datu devēju novērtēt, kas ir rezultāts, kā no datu atvēršanas arī pats datu devējs varētu iegūt, kā arī veicināt sarunu ar datu lietotāju. Kas zina, varbūt no tā dzimst lielisks pētījums vai biznesa ideja?
Paldies Latvijas Radio žurnālistei Rudītei Spakovskai par ideju un reālās prakses piemēriem Latvijā, strādājot ar iestāžu datiem.