Колко полезни са #OpenData за теб, за мен, за всички. Боян Юруков

0766086001439535334_489955_600x458

Нали познавате Боян Юруков (http://yurukov.net/blog/)? Вероятно като блогър, граждански активист, любител на фактите. Много, много неща може да се кажат за Боян (ама наистина е от тези доста действащи и вдъхновяващи личности)! Тук, в продължение на темата за отворените данни, защото я намирам за изключително важна в етапа на развитие на демокрацията в България, продължавам серията интервюта и след Теодора Гандова и Божидар Божанов е ред на Боян.

От къде възникна големия ти интерес към отворените данни?
Трудно ми е да посоча в каква връзка точно съм осъзнал ползата от тях. Навярно покрай регистъра за безследно изчезнали Lipsva, когато осъзнах, че няма място, където да се получи надеждна и навременна информация за случаите на изчезнали. По същото време се рових доста и в статистиката на НСИ и различни отчети на институциите. Видях колко нюанси имат данните и колко е важно да се знае методологията на събирането им и условностите свързани с нея. Най-важното обаче е да са въобще достъпни, тогава, преди 7 години, това въобще беше така. Докато при случаите на изчезнали и издирвани напредък изцяло липсва, виждаме все повече отворени данни в много други институции. Особено в последните две години.

Най-търсените при теб (в блога ти) статии и визуализации с отворени данни по коя тема са?
По брой общо посещения – навярно статиите за родените българчета в чужбина, за секциите в чужбина и последно – за жертвите от ЖП катастрофите. Сериозен интерес имаше към анализа на данните от Фонда за лечение на деца. Щеше ми се да има доста повече да има внимание и към графиките за замърсяването на въздуха и демографията. Има обаче теми, за които пиша, където и 500 посещения са много, тъй като сферата на хората, които се интересуват от това е доста малка. Пример за това са географските данни на страната, визуализацията на регистрираните кучета в Пловдив и други.

Какво още може да се направи, за да се отворят повече данни на повече институции у нас?
Няколко неща са. На първо място трябва да се започне със солиден пакет от данни, които да се отворят и смеят да твърдя, че това вече е направено. Второ, трябва да има ясни изисквания и стандарти за софтуерните системи и процеси. По тази точка е поставено добро начало. Не на последно място обаче, трябва да се покаже както на обществото, така и на служителите, че отворените данни са полезни в ежедневието и работата им. Това е работа на неправителствените организации и журналистите, но държавата може да има значителна роля чрез хакатони, състезания и грандове. Поне това показва опита на държави като Великобритания, Германия и САЩ. Видимостта на нуждата и ползите от тази прозрачност и свързаност ще накарат самите служители да гледат на отворените данни не като на поредното хрумване и ПР акция на политическото ръководство, което временно се е намърдало на трона, а на неизменна стъпка от работата им която всъщност улеснява всичко останало. Някои вече виждат това, тъй като работата им куца от липсата на достъпни данни между частите на самата администрация. Други ще се опитат да блокират отварянето на данни, защото ги смятат са своя собственост или просто защото ще станат излишни като се автоматизират справките, които те досега са правили на ръка. Разпознаването на едните от другите и давайки добри инструменти в ръцете на първите ще е ключът към въвеждането на отворените данни в администрацията. Това не само ще ускори работата им и ще спести пари от бюджета, но и ще направи отварянето на данни в обществения сектор устойчив процес. Данните, които получаваме от администрацията трябва да са страничен ефект от подобрената работа, а не просто допълнителна услуга.

Липса на желание, липса на грамотност или укриване на факти, според теб, е основния мотив да не се случва лесно този процес?
От всичко по малко. Има наистина хора в администрацията, които умишлено искат да блокират прозрачността, но в по-голямата си част говорим за липса на ресурс или желание да се свърши поредното задължение, с което са натоварени служителите. В не по-малка степен процесът боксува заради смесените сигнали от ръководството и непостоянните усилия в посока отворени данни. Освен, ако отворените данни и информационната свързаност не се превърнат в норма, качеството и достъпността на публичната информация ще си останат просто прищявка на конкретния чиновник или политика на ръководен пост. Такива са, например, общо взето всички регистри в Министерството на здравеопазването.

Какви ползи може да има бизнеса от отварянето на данните и можеш ли да илюстрираш с реални примери от чужбина?
Отворените данни идват с големи обещания, което прави неизбежно разочарованието. Несъмнено има доста преки ползи от тях, като нишови приложения и информационни услуги. В по-голямата си част обаче те служат за основа на много други дейности. Пример за това са анализите не PWC и The Guardian базирани на отворени данни. Все повече компании за сравнение на имоти, коли, образование, застраховки и услуги използват публични отворени данни, за да подобрят точността си. Дори компании като Monsanto и Dupont разчитат на отворени данни, за да анализират по-добре реколтите. Компании в различни сектори използват публичната информация в управлението на риска. Много от приложенията, които използваме на телефоните си използват в една или друга степен отворени данни за времето, трафика, географски данни, замърсяването, статистика и прочие. Отворените данни все повече се превръщат във информационна инфраструктура, която подпомага частния сектор по аналогичен начин както магистралите и оптиката. Макар шепа компании да печелят пряко от отворените данни на администрацията, те ще помогнат на много други да подобрят услугите си.

Какво пожелаваш на България за 2017-та?
Повече решения базирани данни, по-малко сензации от екрана без връзка с реалността. Повече журналисти и чиновници с базово ниво на грамотност в обработката на данните, по-малко хартия и печати. Най-вече, да ускорим напредъка, който видяхме през 2016-та, а не да се връщаме назад.

Ако не сте чели при Боян последните му неща – доооста любопитни (както всеки негов пост):
Няколко интересни числа за българите в Германия

Колко опасен е ЖП транспортът в България

Равенството между половете по заетост и заплати

Колко полезни са #OpenData за теб, за мен, за всички. Божидар Божанов

0226140336-bozhidarbozhanov

Божидар Божанов – вероятно го познавате като блогър (https://blog.bozho.net/) и като един от най-големите защитници на отворените данни у нас, както и експерт по отворени данни, електронно управление и лични данни, електронна идентификация.

С това интервю с Божо продължавам изключително важната за цялото ни общество тема за отворените данни и институциите. Защото именно прозрачността може да върне доверието в тях.

Какво са отворените данни?
Държавната администрация събира всевъзможни данни във връзка с дейностите, които извършва – събира данните за проведените обществени поръчки, за качеството на въздуха, за регистрираните автогари, за външното оценяване в средното образование и т.н. Тези данни логично принадлежат на обществото, което ги е платило с данъците си, затова държавата трябва да ги “отваря”. Но за да могат да бъдат използвани от компютърни програми, които могат да анализират големи масиви от данни, те трябва да са във формат, който компютърът може да прочете лесно. Една таблица в сканиран PDF, например, представлява трудност за компютъра. CSV (ред/колона, като данните на всеки ред са разделени със запетаи) е правилнен формат за отварянето.

Защо всеки гражданин има полза от това да знае какво са и да иска да има
повече отворени данни от институциите у нас?
Защото това открива възможности. Възможности за откриване на корупционни схеми, възможности за оптимизиране на работата и разходите на държавата, възможности дори за бизнеса. Няколко примера: във Великобритания “здравната каса” плаща лекарствата на пациентите. След като отваря данните за това, едно НПО прави анализ и става ясно, че ако се покриват само генеричните лекарства, ще бъдат спестеми милиони. Друг пример: до момента всички компании, правещи софтуер, който издава фактури, трябваше да прекупуват данни за регистрираните фирми, което им струва пари. С отварянето на данните на Търговския регистър, този разход за бизнеса отпада. А с отворените за обществени поръчки можем да видим кои фирми (и “чии” фирми) печелят най-много поръчки в дадени сфери или на дадени възложители, и да фокусираме вниманието върху това.

Кои данни не бива да се отварят, според теб?
Данни, свързани с националната сигурност, както и данни, които съдържат чувствителни данни – например история на заболяванията на гражданите, или пък данъчно-осигурителната им история.

Кои са основните препъни камъни в този процес, от твоя опит?
Основните проблеми са няколко – липсата на автоматизирани информационни системи, в които се събират данните, или когато има има – тяхната остарялост и невъзможност да извадят данни. Лошото качество на събраните данни – администрацията събира само данни, които нормативно трябва да събира, което не винаги е достатъчно. Например когато в списъка на училищата няма идентификационен номер (Булстат) на училището, при смяна на името губим връзката между резултатите на това училище през годините. Третият проблем е липсата на разбиране какво са отворените данни и ниският капацитет за работа с тях – както в администрацията, така или извън нея. За голяма част от администрацията “качихме PDF на сайта си” са отворени данни (макар те да не са машинно-четими), а много рядко медиите и НПО-сектора имат капацитета да използват отворените данни.

Може ли бизнеса да има полза от отворените данни?
Горният пример с Търговският регистър е един начин, по който бизнесът вече използва отворените данни. Но има много други – ако например данните за сделките за имоти бяха публични (без да се разкрива самоличността на страните), можеше брокерите да правят анализи и прогнози на движението на пазара. Данните за регистрираните МПС-та по марка и модел могат пък да помогнат на автосервизите с планираните доставки на авточасти. И още много други.

Ти самия кой тип информация би искал да видиш вече отворен и достъпен?
Всяка. С отворените данни човек никога не знае откъде ще изскочи нещо полезно. Привидно незначителни масиви от данни могат да бъдат ключови за даден анализ, прогноза, софтуер или цял бизнес. По-скоро бих искал качеството на данните да се повиши – както при тяхното събиране, така и при предоставянето им. Затова сме заложили изисквания към всички информационни системи, които администрацията ще си поръчва оттук нататък, за да имаме “отворени данни по подразбиране”.

Какво пожелаваш на България за 2017-та?
Повече решения, взети на база на данни, и по-малко такива, взети само на база на “вътрешно усещане” (или пък на “външни мотиватори”). Както на ниво държавно управление, така и в други сфери на обществения живот. Защото ако вземаме грешни решения, въпреки, че имаме данните, на база на които да вземем правилните решения, то пропускаме огромни ползи – ползи, които други държави и други бизнеси може и да не пропуснат.

Ако сте пропуснали интервюто по същата тема с Теодора Гандова – тук е.

приемам предложения за Специалните награди в БГ Сайт

в БГ Сайт за трета година ще номинираме и наградим хора, уеб проекти, фирми, отличили се с цялостния си принос по един или друг начин

в Експертния съвет съм и трябва да предложа достойни хора или проекти за награда. ако знаеш за нещо добро в уеб, което трябва да бъде насърчено, наградено, отличено, показано и наистина си струва – моля, пиши ми. гласуването е утре. благодаря!

в Експертния съвет имам честа да съм още с Веско (Dzver), Джако (Иван Иванов), Коцето (Комитата), Заро (JobTiger), Бого (Богомил), Венци (HTTPool)

иначе публиката и журито продължават да гласуват на www.bgsite.org и кой печели ще разберем на гала-церемонията идния петък – 12-ти ноември