Старший директор компании Pure Storage по технической стратегии Брайан Карпентер рассказал на конференции Big Data LDN, почему предприятиям необходимо модернизировать инфраструктуру ИТ с расчетом на масштабирование, если они хотят преуспеть в использовании ИИ, и как встроить ИИ в аналитику, сообщает портал InformationAge.
Искусственный интеллект представляет собой новый подход к превращению неструктурированных данных в знания. Он открывает широчайшие перспективы перед предприятиями, стремящимися быстрее реализовывать нововведения и увеличивать свое конкурентное преимущество. Поэтому инвестиции в ИИ стремительно растут. Согласно отчету фирмы McKinsey, только в 2016 г. они составили от 26 до 39 млрд. долл.
Между тем, ИИ требует совершено иного подхода к расширению инфраструктуры, а сложности его реализации удерживают предприятия от построения мира, в котором ИИ правит бал. Действительно, глубокие нейронные сети имеют миллионы обучаемых параметров, соединенных конфигурируемой многоуровневой сетью. Кроме того, каждая сеть обладает бессчетным количеством вариантов топологии, стратегий подключения, скоростей обучения и т. д. Все вместе это именуется гиперпараметрами.
«ПО ИИ хорошо лишь настолько, насколько хороша используемая им инфраструктура, — сказал Карпентер. — Хотя специалисты по данным не обязаны быть экспертами по инфраструктуре, последняя определяет их успех».
Почему необходима модернизация
Карпентер указывает, что ИИ требует таких современных технологий, как GPU, масштабируемая флэш-память и RDMA, чтобы перемещать огромные объемы данных. Поэтому инициативы в области ИИ слишком часто тормозятся из-за стремления все делать самостоятельно с использованием унаследованных технологий. Это приводит к переносам сроков и простоям на протяжении многих месяцев.
Действительно, с точки зрения инфраструктуры совершенно ясно одно: как только проекты в области ИИ выходят из экспериментальной стадии и начинается их распространение, неизбежно растет потребность в компьютерных ресурсах.
Последние исследования показывают, что помимо высоких требований к вычислительной мощи с ростом объема используемых для тренинга данных в логарифмической прогрессии растет точность тренинга. Поэтому небольшое повышение точности может потребовать увеличения набора данных в 10 и более раз. Наряду с большой вычислительной мощью создание современных моделей требует более разнообразных наборов данных большего размера и высокопроизводительного доступа к ним.
Как выглядит инфраструктура ИИ
По словам Карпентера, инфраструктура ИИ должна обладать следующими качествами:
- масштабируемость: нельзя остановить другие вычисления, когда одному приложению потребуется больше вычислительной мощности;
- гибкость: инструменты меняются каждый день. Предприятиям необходимо избегать жесткой привязки к конкретным инструментам, чтобы идти в ногу с быстро развивающимися экосистемами и быстро меняющимися потребностями специалистов по данным по мере развития проектов;
- портируемость: вы захотите что-то перенести в облако, что-то извлечь из него. Задумайтесь о различиях между экспериментальной и производственной средами.
Карпентер добавил: «Если ваш план совершенствования инфраструктуры рассчитан на 18 месяцев, вы двигаетесь недостаточно быстро. Коль скоро инструменты меняются каждые полгода, нужно быть сумасшедшим, чтобы строить планы более чем на 12 месяцев».
Пусть вы не хотите определять конечные цели, сказал он, но вы должны иметь общее представление о том, к чему вы движетесь.