Данные и аналитика пронизывают все составляющие цифрового предприятия. Аналитик и вице-президент Gartner Рита Салам обозначила на Gartner IT Symposium в Орландо тенденции их развития на ближайшие годы, сообщает портал InformationWeek.
В последнее время в организациях наблюдается ощутимый рост интереса к данным и аналитике, что обуславливается ростом популярности технологий больших данных, а также машинного обучения и других технологий искусственного интеллекта, которые отвечают за их обработку. Несмотря на то, что многим предприятиям пока что не удается получить коммерческую отдачу от ИИ-программ, они продолжают эксперименты, понимая, что в предстоящие годы внедрение ИИ будет иметь решающее значение для их коммерческой деятельности. Это связано с тем, что данные и аналитика значительно расширяют рамки цифрового бизнеса. Фактически они стали ключевыми компонентами обслуживания клиентов, найма специалистов, оптимизации цепочки поставок, помогают сбалансировать финансы и решить множество других важных задач предприятия.
ИИ и ряд смежных технологий задают тенденции и являются базисом для развертывания в ближайшие годы, обеспечивая более быструю и стабильную работу предприятий. «Сегодняшние темпы изменений в бизнесе и технологические циклы меняются быстрее, чем когда-либо прежде, — сказала Салам. — Чтобы поспевать за ними, вам нужна гибкая архитектура данных и аналитики».
По ее словам, тенденции в области данных и аналитики охватывают три ключевых момента. Первый — это интеллект. Методы машинного обучения и ИИ все теснее переплетаются с рабочими процессами путем расширения функциональных обязанностей сотрудников, сокращения объема необходимых навыков и автоматизации задач, чтобы они могли работать с «чистыми» и реально важными для бизнеса данными.
Второй — новые форматы данных. Сегодня ИИ и машинное обучение поддерживают более гибкие и новые форматы данных.
Третий момент — масштабирование. На то, чтобы воплотиться в реальность, у этих тенденций уйдет от трех до пяти лет.
В представленном ниже списке перспективных технологий отсутствуют системы самообслуживания и облачные сервисы — они уже повсюду, нет также и квантовых вычислений — перспектива их коммерциализация далека от реальности.
1. Расширенная аналитика
Это связующая технология, которая охватывает бизнес-аналитику, науку о данных и машинное обучение. Она будет применяться, чтобы получать ценную информацию из данных могло как можно большее число людей без навыков аналитической работы. В течение следующих нескольких лет расширенная аналитика займет одну из доминирующих позиций на предприятии, и пригодится, в частности, при проведении оценки для выбора поставщиков. Кроме того, чтобы сделать работу пользователей более комфортной, поставщики других технологий включают ее в свои продукты и услуги. Предназначение расширенной аналитики — демократизация аналитических инструментов. Она позволяет сократить время извлечения и понимания информации на единицу времени, обладая меньшим объемом навыков, чего не скажешь о сегодняшних инструментах.
2. Расширенное управление данными
Спустя несколько лет данные будут поступать на предприятие в значительно более динамическом режиме, чем сейчас. К тому времени организации научатся анализировать их на более высоких уровнях автоматизации практически в режиме реального времени. На управление данными возлагается множество задач, таких как распознавание шаблонов, слежение за производительностью работы БД (capacity management database, CDB), контроль за применением данных, регуляторными требованиями/комплаенсом, моделями затрат и др. Многие из этих задач будут переложены на расширенное управление данными. К 2022 г. объем ручных задач по управлению данными сократится на 45% — это связано с активным внедрением машинного обучения и автоматического управления уровнями обслуживания.
3. Обработка естественного языка и разговорная аналитика
NLP и разговорная аналитика в значительной степени дополняют расширенную аналитику. Они предоставляют экспертам, не связанным с данными, новый вид интерфейса для запросов и анализа. «Большинство людей ничего не смыслят в SQL и не могут создавать собственные запросы, что и возьмут на себя NLP и инструменты диалоговой аналитики. Они до минимума упростят взаимодействие между пользователем и аналитикой», — утверждает Салам. В следующем году около 50% аналитических запросов будут генерироваться с помощью поиска, технологии NLP или будут автоматически. Здесь есть много возможностей для улучшения.
Большинство современных аналитических и BI-платформ реализовали базовый поиск по ключевым словам. Они выдают ответы на простые вопросы («Каковы были мои продажи по продуктам?»), но более сложные вопросы («Какие по сравнению с прошлым годом были мои лучшие 10 продуктов или клиентов в радиусе 50 миль от Нью-Йорка?») ставят их в тупик. Машине сложно ответить на подобные вопросы, для этого она должна поддерживать опции ранжирования, синонимы и другие функции, которые сегодня поставляются далеко не каждым поставщиком. Еще одна новая функция в этой области — разговорная аналитика, которая позволит задавать более конкретные вопросы. «До недавнего времени аналитика была тесно связана с визуализацией, но разговорная аналитика добавит еще один уровень к пониманию данных», — сказал Салам.
4. Графы
Графовые обработка и базы данных позволяют исследовать данные так, как думает большинство людей, выявляя взаимодействие между логическими концепциями и объектами/субъектами, такими как организации, люди и транзакции. Согласно прогнозам Gartner, применение графовой обработки и графовых баз данных будет ежегодно расти на 100% вплоть до 2022 г. Эта технология предназначена для того, чтобы в постоянном режиме ускорять подготовку данных, делая инструменты более адаптивными и сообразительными. Графы позволяют создавать новые семантические сети и сети знаний, устанавливать возникающие связи между различными данными, поступающими из таких источников, как, например, приложения для занятий спортом или для соблюдения диеты с медицинскими советами и новостными лентами о здоровом образе жизни.
5. Коммерческие продукты ИИ и машинного обучения будут доминировать над Open Source-проектами
Как ничто другое, Open Source подстегнул развитие таких технологий, как большие данные, ИИ и машинное обучение, особенного успеха на этом поприще добились цифровые техногиганты типа Google или Amazon. Но большинство организаций не входят в категорию цифровых гигантов, они изо всех сил пытаются подстроить пилотные проекты ИИ и машинного обучения таким образом, чтобы их можно было запустить в производство. Эксперты считают, что рано или поздно многие компании перейдут для управления своими ИИ-программами на коммерческие платформы. Gartner прогнозирует, что к 2022 г. 75% новых решений для конечных пользователей, использующих технологии ИИ и машинного обучения, будут создаваться с использованием коммерческих, а не открытых платформ.
6. Фабрика данных
Эта тенденция тесно связана с расширенным управлением данными и позволяет поддерживать гибкие данные в масштабе. Раньше предприятия стремились хранить свои данные в одном хранилище, но теперь они стали более распределенными. Фабрика данных предназначена для данных, которые находятся в изолированных средах (бункерах данных), и реализует архитектуру логического хранилища, которая обеспечивает беспрепятственный доступ и интеграцию данных в гетерогенном хранилище. Gartner прогнозирует, что к 2022 г. проекты фабрик данных будут создаваться под заказ и разворачиваться в виде статической инфраструктуры. Все это приведет к новой волне расходов — предприятиям придется изменить архитектуру данных, чтобы сделать ее более динамичной.
7. Объяснимый ИИ
«Мы полагаем, что рано или поздно массовое распространение ИИ приведет к тому, что предприятиям будет все сложнее управлять им», — сказала Салам. Это связано с тем, что модели становятся все более сложными и непрозрачными, тогда как организации нуждаются в том, чтобы соблюдать регуляторные требования, понимать результаты внутреннего мониторинга, знать о рисках нарушения конфиденциальности и предвзятости мнений, которые могут быть заложены в модели ИИ. В настоящее время поставщики работают над ИИ-решениями, которые помогут сгладить эти проблемы. Gartner прогнозирует, что к 2023 г. более 75% крупных организаций будут нанимать специалистов по анализу поведения ИИ, конфиденциальности и доверия клиентов, что позволит снизить репутационные риски.
8. Блокчейн
Помимо данных и аналитики блокчейн проник во многие технологические области, однако его значение в области доверительности отношений и достоверности информации о проведении транзакций сложно переоценить. «Речь действительно идет о криптографической поддержке неизменяемости в сети доверенных участников», — говорит эксперт. При помощи блокчейна можно отслеживать очень многие изменения, но в сфере данных его можно применять для проверки достоверности источников информации (фейковые новости) или поддельных видео (дипфейки). Gartner прогнозирует, что к 2021 г. большинство частных и эксклюзивных блокчейнов будут заменены реестровыми СУБД.
9. Непрерывный интеллект
Непрерывный интеллект — это возможность принятия более эффективных решений с помощью аналитики данных в реальном времени и расширенной аналитики. Он включает в себя понимание ситуации и предписывает действия, которые необходимо предпринять. Это интеллектуальная, автоматизированная и ориентированная на результат технология. Gartner прогнозирует, что к 2022 г. более 50% крупных новых бизнес-систем будут включать в себя непрерывный интеллект, который для улучшения решений будет использовать контекстные данные в режиме реального времени.
10. Серверы с энергонезависимой памятью
Спустя несколько лет рынок наполнят серверы с энергонезависимой памятью, которые по сравнению с типичными серверами предоставят больший объем памяти, более доступную производительность и легкость подключения. Некоторые поставщики СУБД переписывают свои системы, чтобы поддерживать серверы с энергонезависимой памятью, которые позволяют анализировать большие массивы данных в памяти в режиме реального времени. К 2021 г. энергонезависимая память будет составлять более 10% от общего объема памяти серверов, используемых для вычислений in-memory.