Как обработва данните Столична община?

Изследване в направление Управление на Стъпка 3 от работата по общинската стратегия Визия за София разглежда данните по различни ресори, които събира и обработва Столична община. Данните са в основата на всички процеси, протичащи в общината и са свързаните както с директно обслужване на граждани и различни видове организации, така и с процесите, подпомагащи общината в основните ѝ дейности. Цели на изследването са каталогизиране на данните и оценка на тяхното състояние – сигурност, състояние, форми на употреба и възможности за машинна обработка. Последното е от изключителна важност за възможностите на Столична община да оптимизира процеси и извършва бъдещи анализи, да взима информирани решения и предприема мерки, базирани на реални данни.


Методологията
на изследването включва интервюта с представители на всички звена на Столична община за идентифициране на наборите от данни, които съответното звено събира, обработва и поддържа. Като набори от данни са определени както регистрите, вменени на звеното по силата на закон или наредба, така и данните, които се използват с цел по-добра оперативност и удобство. Интервюираните служители попълват отделен въпросник за всеки набор от данни, съставен от 62 въпроса, отнасящи се към източниците на данни, техните потребители, начините на съхранение и обработка. Въпросникът отделя особено внимание на сигурността на данните, съхранението им и достъпът до тях. Изследването се реализира от експертен екип Управление в Стъпка 3 и 4 на Визия за София – НПО Линкс.

В хода на изследването са идентифицирани 248 набора данни, от които 106 са подробно описани. Резултатите показват, че Столична община обработва огромен поток от данни, като най-много от тях идват от общински административни структури, юридически лица и  държавната администрация. Най-често данните се предоставят в структуриран формат (попълнен стандартен формуляр), но в 75% от случаите това е в неподходящ за надеждна машинна обработка вид – например сканирани документи. В 30,7% от случаите данните са с право на пълен публичен достъп. Препоръки в анализа са ефективното дигитализиране на данните и процесите, което може да улесни работата на общинската администрация, да даде възможност за обработването на данните с аналитична цел и да улесни публикуването им в машинно-четими формати и повторната им употреба.

Разглеждайки събраната информация за източниците на данни, става ясно, че потокът от данни е изключително голям. Столична община ежедневно приема за обработване огромно количество данни от разнообразни източници. Най-големият източник и най-големият потребител на тези данни е самата Столична община. В значителна степен източниците подават данните в структуриран вид, като най-голям е делът на хартиения носител. По отношение на съхраняването на данните в 32% от случаите също се използва хартиен носител. Според интервюираните служители най-големият обем данни идва от общинските структури и след това от физическите и частните юридически лица във вид на сигнали, заявления и искания за услуги.

Данните се предоставят най-често в структуриран формат – обикновено това са образци на документите, необходими за предоставяне на услуги от общината, сигнали и заявления. Контактният център на Столична община приема информацията от гражданите и я въвежда, доколкото е възможно, в структуриран вид. На подсайт на Столична община (https://usl.sofia.bg) са публикувани образци на заявления за услуги. От 95 услуги, заявления за 45 от тях могат да бъдат подадени онлайн в структуриран формат в цифров вид. Останалите 50 услуги изискват попълнените бланки да бъдат отпечатани, подписани и физически представени на гише в Столична община. Хартиеният носител е посочен от интервюираните като най-често използван носител на данни, включително и за обслужване на процеси между отделни звена на Столична община.

Данните се проверяват за автентичност на източника им при постъпването им за обработка в даденото звено в 54,5% от случаите. В 11,9% служителите считат, че автентичността на източника е гарантирана от определени атрибути на данните. В останалите 33,7% не се прави проверка за автентичност. Вероятно най-често това са случаи, в които информацията е подадена от гражданите в неструктуриран вид.
Коректността на данните е от изключителна важност за ефикасното функциониране на общината. Проверки за коректност на данните се извършват в 69,3% от процесите, обработващи данни, в 5,9% данните се считат за коректни поради вида на източника или определени атрибути в тях, а в 20,8% коректността на данните не се проверява систематично.

Анализът показва, че съхранението и обработката на данни в Столична община се извършва чрез използването на 18 специализирани системи, автоматизираната информационна система на Столична община „Акстър офис“, файлове, съхранявани на сървър на общината или на потребителски компютър и на хартиен носител.

В повечето случаи дейностите, извършвани от звената по конкретни преписки са придружени от документация в деловодната система „Акстър офис“. Файловете, прикачени към всяка преписка най-често са сканирани документи, придружени от кратка информация в свободен текст.

Файловите сървъри са собственост на Столична община и са разположени в специализирания ѝ център. Повечето информационните системи са разположени на сървъри – собственост на общината, а останалите са в процес на преместване или планирани за преместване. Всички системи, разположени върху хардуер на Столична община са обект на регулярно архивиране, като готовите архиви се съхраняват физически на различно място. На автоматизирано архивиране не подлежат потребителските компютри, както и данните на хартиен носител, т.е. около 23% от наличната информация. Достъпът до данните във файловите сървъри и специализираните системи се осъществява след проверка за автентичност на потребителите. За всеки потребител се създава достъп в специализираните системи и файловите сървъри в съответствие с длъжността му и по надлежния ред. Повечето от тези системи, както и файловите сървъри имат възможност да предоставят информация за дейностите извършвани от потребителите.

В рамките на изследването е извършен и анализ на възможностите за повторно използване и разширена обработка на данните, за да се изследва възможността им да бъдат употребявани повторно за различни цели. За да е възможно това, е необходимо данните да бъдат представени и поддържани подходящо, което включва минимум поддръжка на първични ключове, подходящи формати и достъп през програмен интерфейс (API).

Все още има набори от данни, които не поддържат кодиране чрез първичен ключ: 35.6% според данните от интервютата, направени със служители на администрацията. Това са основно тези набори, които се поддържат във вид на потребителски файлове и не са обект на специализирана система. На тези места служителите емпирично различават отделните записи в набора по комбинация от полета, но този подход не е приложим за машинна обработка и връзка между системи. Наборите от данни, които се поддържат на хартиен носител, най-често се отнасят за данни, подадени от граждани или други звена на администрацията на Столична община чрез деловодната система „Акстър офис“ и използват входящия номер, генериран от тази система за първичен ключ и рефериране на конкретен запис.

Достъпът до данните чрез програмен интерфейс не е особено популярен при наборите от данни, обработвани от Столична община – едва 13,9% от наборите поддържат такъв. Липсата на такива интерфейси и като следствие от това невъзможността за системите да обменят информация, води до дублиране на едни и същи данни в различни системи. Всяка система ги поддържа по различен начин и с различни характеристики. Пример за това са договорите, които Столична община сключва с изпълнители на различни дейности – присъстват сканирани в деловодната система „Акстър офис“ и с различни мета данни в системите на звената, контактуващи с изпълнителите. Отделно данни за договорите се съдържат и в счетоводната система „Комси 54“, където описанието им е едно от най-пълните според служителите от направление „Финанси“.

Всеки изведен от Столична община документ съдържа поне един подпис. Немалка част от дейността на общината се състои в издаване на различни документи, голяма част от които трябва да бъдат съгласувани между две или повече звена. Физическото полагане на подписи, когато става дума за две или повече звена е процес, който може да отнеме повече време и човешки ресурс, отколкото изготвянето на съответния документ по същество. Затова и аналитичната част в изследването препоръчва въвеждането на вътрешна система за достъп и цифрово подписване.

По отношение на публичния достъп според интервюираните служители 40,6% от наборите данни, обработвани от Столична община не са публично достъпни, а 28,7% са частично достъпни поради наличие в тях на лични данни – 15,2%, професионална тайна – 1,7% и други видове тайна. В около 2,8% от наборите става дума за предварителна, в процес на подготовка информация. В 30,7% от случаите данните са с право на пълен публичен достъп.

От публикуваната публично достъпна информация най-често или 75% е във вид неподходящ за надеждна машинна обработка – сканирани документи, .pdf файлове, таблици на уебсайт, документи в свободен текст. 25% от публикуваните набори или 7,6% от всички идентифицирани набори са в машинно-четим вид и подходящ за повторна обработка.

Като най-проблемна област по отношение на данните в администрацията се очертава голямото количество сканирани документи, които не дават възможност за търсене и автоматизирано обработване. Поради по-големия си обем спрямо файловете с данни, сканираните документи водят и до необходимостта от многократно по-големи масиви за поддържането им. Използването на подписи на хартиен носител, вместо цифрови такива върху съответен файл е сериозна пречка за поддържането на данните в изцяло цифров и удобен за обработка вид. В допълнение недостатъчното използването на цифрови подписи е част от причините за публикуването в неподходящи формати – напр. всеки график за различните видове дейности трябва да бъде одобрен, респ. подписан и се публикува като сканиран документ.

Най-общо препоръките към Столична община за подобряване на работата с данни, а оттам и ефективността на общината са в две основни направления:

Пълна дигитализация на данните

Поддържането на данните изцяло в цифров и максимално структуриран вид, без сканирани документи е ключово за подобряване на работата на общината. Препоръчва се данните и документите да са така маркирани, че чувствителните данни да могат автоматично да бъдат заличени/анонимизирани при обмена на данни с други системи, в това число и при публикуване. Поддържането в цифров вид ще позволи драстично намаляване на съхраняваните обеми, необходимия ресурс за архивиране и възстановяване от аварии. В допълнение ще се даде възможност за пълнотекстово търсене, различни видове справки, автоматично изчисляване на индикатори и анализи включително и такива, използващи machine learning. Задължително е да се въведе единен подход за генериране на уникални идентификатори за всеки набор от данни.

Необходимо е да се доизградят и подобрят дигиталните канали за получаване на данни, в това число и в комуникацията с районните администрации, физически лица и фирми. Подаването на данни към Столична община в цифров вид ще минимизира ресурса, необходим за дигитализацията им и ще ускори процеса на работа.

Изграждането на програмни интерфейси към съществуващите системи ще даде възможност за по-добра координация на отделните звена, ще намали дублирането на данни и ще даде възможност за автоматизирано публикуване на данните в машинно- четими формати. Препоръчително е изграждането на единна база данни за проверка за идентичност и авторизация на служителите.

Дигитализация на процесите

Въведената във всички звена на Столична община автоматизирана система „Акстър офис“ е много важна част от дигиталното управление на процесите и конкретните задачи. Преминаването към цифрови подписи би ускорило обработката на отделните преписки, особено тези, които изискват съгласуване между двама или повече служители на Столична община. В допълнение ще премахне причината за поддържането на сканирани документи, което ще доведе до значително подобряване в състоянието на данните и необходимите ресурси.

Следващи стъпки

По време на неформалните интервюта със служителите на Столична община направи впечатление, че всички документи, които общината изготвя се подготвят в цифров вид (MS Office, MS Excell), но се съхраняват във вид на сканиран документ. Това е огромен проблем пред последващата им обработка за анализ и увеличава в пъти нуждата от пространство за съхранението им. Причината за този подход е, че документите трябва да бъдат подписани и вместо с цифрови подписи се извършва подписването им на хартиен носител. Столична община използва информационна система “Акстър” за управление на потока от документи, но когато е необходимо документите да се подпишат от повече от един служител на общината, а това се случва често, се налага те да бъдат физически пренасяни, което е крайно неефективно.

Първата стъпка към реалната дигитализация следва да е поддържане на документите, които общината издава в цифров и структуриран вид. Това може да стане с минимални разходи и за много кратко време като:

  • Изготвяне на шаблони за различните видове документи. Шаблоните изглеждат като формуляр и имат полета за попълване. Важно е да се стандартизират названията на едни и същи полета в различните видове документи, напр. име, фамилия и др. подобни. Това ще позволи разграничаването на отделните части на документа, което е ключово за последващите обработки – търсене, сортиране, агрегиране и т.н. Доброто маркиране ще позволи автоматично публикуване на данни в машинно-четим формат с възможности за премахване или анонимизиране на лични данни в публикуваните данни;
  • Използване на цифрови подписи за подписване на изготвените документи. По този начин всичко остава в цифров вид, не се губи ресурс за физически пренос на документи, съкращава се времето за обработване на документи от повече от едно звена;
  • Използване на софтуерни продукти, реализиращи функционалността “календар”, за дейности свързани с планиране на време, напр. графици за ремонти, график на културни и спортни събития и др. подобни. Изискване от експлоатационните дружества да поддържат и предоставят достъп до актуални календари, свързани с техните дейности на територията на Столична община.

Втората стъпка е интеграция на информационната система “Акстър” със система за пълнотекство търсене, като целта е всеки завършен документ да бъде автоматично индексиран. Освен възможностите за анализ, системата реализира “виртуални регистри” на всички видове документи, които издава общината – всеки “виртуален регистър” е резултат от търсене на определна ключова дума в полето за тип на документ.

Третата стъпка е изготвянето на софтуерен компонент – регистър с общо предназначение. Освен документите, общината трябва да поддържа информация за различни типове обекти – собствени сгради, паркове, училища, детски градини и др. подобни. Описанието на повечето типове обекти може да се реализира в плоска структура – ред от таблица. Необходимо е да създаде софтуерен инструмент, който за всеки тип обект се конфигурира отделно, реализира делегиран достъп до отделните ресурси до ниво ред, предоставя API за достъп до данните.

Пълният текст на доклада от изследването можете да намерите тук.

Related Posts