Имея дело с новыми типами данных специалисты испытывают трудности с обменом информацией, которую они получают в ходе своей работы, с другими командами организации. Менеджер по продуктам Snowflake в области визуальных данных Адриен Треуиль рассказывает на портале The New Stack о роли инструментов визуализации данных, которые позволят МО-инженерам напрямую делиться визуальными представлениями своей работы.
С внедрением облачных вычислений можно собирать и обрабатывать любые объемы данных. Что же можно узнать из всех этих данных и как извлечь выгоду?
До сих пор традиционный SQL-подход помогал принимать решения путем применения методов визуализации данных к структурированной, табличной информации, хранящейся в базах данных. Однако прогностические модели МО, в первою очередь это касается нейронных сетей, и полуструктурированные или неструктурированные типы данных, такие как изображения, видео и данные о настроении, не слишком хорошо вписываются в старую SQL-парадигму. Специалистам по данным и МО-инженерам трудно делиться информацией, которую они получают в ходе своей работы, имея дело с новыми типами данных и новыми способами обработки информации.
Эволюция науки о данных находится на решающем этапе развития. И приложения, управляемые данными, — это новый язык, который объединяет организации и позволяет специалистам по исследованию данных и инженерам машинного обучения напрямую сообщать о своих результатах коллегам.
Бесконечный спектр возможностей
Специалисты по данным и МО-инженеры хотят создавать и экспериментировать с произвольными комбинациями различных данных. Например, твиты с данными о настроении, добавленные искусственным интеллектом, или видео с аннотациями, сделанными людьми, которые говорят об эмоциональном накале сюжета, предоставляют дополнительный способ измерения возврата инвестиций в маркетинг.
Этот новый стек основан на языке Python, а также на новых, присущих ему способах обработки, преобразования и визуализации данных. Результатом такой визуализации являются приложения, управляемые данными. Они предоставляют бизнес-пользователям бесконечный набор новых возможностей — от прогнозирования свободных парковочных мест до оценки потребностей розничной торговли в закупках и определения оптимального расположения солнечных электростанций.
Специалисты по данным и МО-инженеры могут взять данные колл-центра организации и создать визуальный продукт, объединив аудиоданные, модели МО и анализ настроения. Различные аудитории могут получить доступ к версиям этого управляемого данными приложения с учетом их конкретных потребностей. На основе этих данных менеджеры и руководители могут изучать опыт работы различных колл-центров, находить отличия и принимать решения по улучшению обслуживания клиентов.
Устранение узких мест в коммуникациях
Приспосабливаясь к новым требованиям обработки данных и работая в мире Python, специалисты по данным и МО-инженеры часто испытывают трудности с обменом данными за пределами своих команд. Они могут тратить большую часть своего времени на ответы на бесконечные ежедневные сообщения по э-почте об отдельных элементах результатов их моделей или наблюдать со стороны, как их организация нанимает новую команду для создания одноразового приложения для работы с данными.
Узкие места в коммуникациях препятствуют быстрому и простому обмену данными между специалистами по данным и бизнес-пользователями. Участие других команд, находящихся между этими двумя группами, еще больше усложняет ситуацию. Существует острая необходимость в визуализации данных на основе Python в качестве общего языка для нового стека данных, чтобы специалисты по анализу данных и МО-инженеры могли выражать свои идеи в приложениях, ориентированных на бизнес-пользователей. В то же время они должны иметь возможность быстро создавать и итеративно дорабатывать эти артефакты данных, чтобы не отставать от самих данных, которые постоянно меняются.
Простота создания приложений для работы с данными произведет революцию и определит фундаментальные изменения в роли специалистов по данным и МО-инженеров. Они займут центральное место в своих организациях и получат возможность влиять на процесс принятия бизнес-решений и способствовать его улучшению благодаря своему искусству, открытиям и действенным инсайтам.
Будущее: цикл сотрудничества с визуализацией данных
Появляющиеся инструменты визуализации данных уже позволяют специалистам по данным и МО-инженерам напрямую делиться визуальными представлениями своей работы через код с другими командами в своих организациях. Однако мы еще не достигли истинного двустороннего общения и сотрудничества с помощью артефактов данных.
Далее мы увидим внедрение технологий, которые позволят создать эффективные циклы сотрудничества между создателем продукта данных и потребителем этого артефакта. Потребитель сможет делиться своим вкладом в визуализацию данных, созданную специалистами по данным и МО-инженерами. Вместе команды смогут прийти к оптимальному представлению данных, которые будут легко понятны любому человеку и согласно которым можно будет быстро принимать меры.