В последние годы складывается следующая общемировая практика: делать государственные данные открытыми. В США в мае 2015 года был принят Data Act, который подразумевает раскрытие информации o расходах федерального бюджета для граждан, в том числе, о грантах, полученных бюджетами штатов и местными бюджетами. В России этой теме также уделяется большое внимание: есть Открытое правительство, есть инициатива по открытым данным, и Минфин России в ее рамках популяризует использование открытых государственных финансовых данных министерства, а также Казначейства РФ, ФНС РФ и в целом данных финансового блока, в том числе открытых данных по госзакупкам. При этом ставились задачи повышения не только финансовой грамотности, но в первую очередь прозрачности и понятности этой информации для граждан.

Чтобы справиться с громадными объемами исходных данных, на помощь приходят современные технологии визуализации, которые позволяют получить совершенно новые представления. Они более богаты, красочны, интуитивно понятны, информативны и интерактивны.

Компания Teradata решила принять участие в ежегодном конкурсе по открытым государственным данным Минфина России BudgetApps 2016 и получила приз зрительских симпатий в номинации «Разработчики». Основой для анализа стали данные реестра соглашений о предоставлении федеральным бюджетом субсидий, бюджетных инвестиций и межбюджетных трансфертов за период с 2013 по 2016 год, а также данные по государственным закупкам за 2015 год одного из субъектов Российской Федерации.

Финансовые потоки

Визуализация «Финансовые потоки» показывает направления и объемы предоставления бюджетных средств на основе данных из реестра соглашений.

Визуализация позволяет определить главных распорядителей бюджетных средств и финансовые потоки в миллионах рублей — субсидии, инвестиции и трансферты, поступающие по государственным программам в субъекты Российской Федерации. Это лишь некоторая часть федерального бюджета, которой уделяется особое внимание с точки зрения контроля целевого назначения средств. Таким образом, сразу видна общая картина расходования средств, и можно посмотреть интересующие аналитические разрезы.

Совмещение субсидий, инвестиций и трансфертов позволяет построить показательную картину, чтобы в последующем использовать эти данные для текстовой аналитики.

ОБЛАКО WIKI (облако тегов)

Визуализация «Облако Wiki» основана на анализе тех же данных. Каждый случай выделения бюджетных средств сопровождается соглашением. В реестре соглашений есть название темы, на которую выделяются средства, — обычно это абзац текста, где, например, может быть написано «разработка медицинского аппарата для определенных медицинских исследований». В компании научились, используя онтологию понятий Википедии, автоматически привязывать каждую субсидию и трансферт к наиболее релевантной и наиболее детальной ветке Википедии. В результате получается облако тегов — интеллектуальная обработка этих названий выдает не просто ключевые слова, выбранные из этих текстов, но привязанные к темам Википедии понятия, привычные для людей. Этот инструмент позволяет, не просматривая сотни соглашений из реестра, понять, куда идут деньги, поскольку к размеру слов привязаны выделяемые объемы средств. Это сразу делает информацию более доступной и понятной для граждан, причём фокус делается именно на понимании. Раскрывать информацию можно и в виде pdf-файлов или таблиц, но массивы этой информации будут огромными, а граждане все равно окажутся неосведомленными — вроде информация есть, но она непонятна.

Важно, что это не просто традиционное облако тегов. За ключевыми темами, которые выводятся для каждого главного распорядителя бюджетных средств, стоят алгоритмы машинного обучения и интеллектуальный механизм текстовой классификации на базе онтологии Википедии. От частных понятий аналитический инструмент переходит к более общим понятиям и терминам, опираясь на иерархию понятий Википедии.

В результате получаетcя осмысленный результат в виде категорий и понятий, привычных и понятных каждому человеку, на основе которого можно судить о целевом характере субсидий, инвестиций и трансфертов. Пример — Министерство культуры Российской Федерации.

Созвездия госконтрактов

Визуализация «Созвездия государственных контрактов» показывает участников процесса государственных закупок: поставщиков с признаками аффилированности, а также государственных заказчиков. Именно такие организации могут быть предметом детального анализа.

Для формирования графа были использованы данные государственных контрактов за 2015 год одного из субъектов Российской Федерации. Вершина созвездия — это поставщик, вокруг которого сформировался кластер государственных заказчиков. Каждая взаимосвязь — отдельный контракт.

Консультант по работе с государственными организациями Teradata Александр Чулапов рассказывает: «Мы взяли информацию о госзакупках одного из российских регионов за 2015 год. Для нас не составило бы труда создать более сложную модель, с помощью которой можно легко выявить нарушения. Тогда бы мы взяли не только информацию о контрактах, но и о заявках, конкурсных процедурах и так далее. Но мы решили пойти другим путем, мы предположили, что есть информация только о контрактах, а другие слои отсутствуют, и задались вопросом, а что можно сделать, имея лишь это.

На первом этапе был проведен анализ потенциальной аффилированности поставщиков, т. е. когда компании зарегистрированы по одному адресу либо руководители имеют схожие фамилии, имена, отчества. После фильтрации этих поставщиков была сформирована кластерная картина, на которой видно поставщиков и заказчиков и кто с кем работает. На основании этого был сформирован перечень потенциально подозрительных объектов. На данном графе выбор конкретных вершин позволяет увидеть взаимосвязи поставщиков и заказчиков. Настоящие взаимосвязи являются предметом дальнейшего исследования, результатом которого может быть заключение об аффилированности. Даная визуализация вызвала интерес в ряде госструктур».

Все рассмотренные визуализации созданы в рамках проекта «Искусство аналитики» компании Teradata, реализованного на платформе Teradata Aster — уникальном аналитическом комплексе, сочетающем в себе возможности глубокого математического анализа и создания интуитивно понятных образов.

С его помощью открытые данные теперь можно анализировать по-новому, внутри современных средств аналитики, применяя анализ текстов, анализ графов и анализ цепочек. Если раньше для этого были нужны суперкомпьютеры и сложные вычислительные алгоритмы, то сейчас это можно делать внутри средств аналитики, делать быстро, доступно, удобно и более понятно для людей. Математика, совмещенная с визуализацией, делает очевидными вещи, ранее казавшиеся слишком сложными.

Открытые финансовые данные — это лишь часть огромного массива данных, которыми располагают государственные органы. Новые методы анализа и представления информации могут существенно помочь и оживить работу государственных служащих, одновременно вооружив их мощными инструментами обнаружения новых закономерностей, детального прогнозирования и внимательного планирования, борьбы с комплексными нарушениями и предотвращения нежелательных событий на ранних стадиях их возникновения.

Набор представлений не исчерпывается тремя вышеописанными, он намного более разнообразен. В иных областях имеются другие удобные представления. Более того, если не удается найти подходящего представления среди существующих, можно разработать собственное с помощью инструментов, доступных на сайте Teradata. Если же это окажется слишком сложной задачей, то можно воспользоваться консультационными услугам и услугами по обучению, предоставляемыми компанией.

Интеллектуальное управление с использованием инструментов комплексного анализа может стать новым этапом развития государственного сектора и изменить организационную культуру в сторону большей открытости, прозрачности и глубокого понимания потребностей граждан, общества, финансов и экономики в целом.

Андрей Алексеенко, генеральный директор Teradata Россия:

— Сегодня, когда открыт широкий доступ к государственным финансовым данным, очень важно иметь инструмент для простого восприятия и анализа стремительного потока большого объема информации. Решение Aster Budget, обладающее мощнейшей визуализацией, дает возможность увидеть все взаимосвязи и единую картину сложнейших финансовых государственных потоков. Применение этого инструмента в работе дает пользователю контроль, скорость, простоту, наглядность и интерактивность для анализа информации, относящейся к сферам государственного управления.

Проект Aster Budget показал, что с помощью новых инструментов визуализации можно сделать информацию о расходовании бюджетных средств более прозрачной и понятной для рядовых граждан. Эти же инструменты не менее важны для внутриведомственной аналитики в части повышения эффективности деятельности государственных институтов. Кроме того, комплексная аналитика с использованием решения Teradata Aster существенно повышает точность анализа, детальность и глубину понимания ситуации и состояния экономики в целом.


СПЕЦПРОЕКТ КОМПАНИИ TERADATA