Искусственный интеллект и машинное обучение оперируют настолько большими объемами данных, что, как утверждает на портале InformationWeek известный консультант и футурист Том Кулопулос, современные облачные архитектуры просто не смогут справиться с их обработкой.
Компании должны неустанно развивать стратегии хранения данных, что наделит их гибкостью и возможностью своевременно реагировать на меняющиеся потребности при работе с данными. Большинство современных предприятий отдают предпочтение гибридной облачной архитектуре, однако многие из них будут удивлены, обнаружив в ходе переноса в облако данных и рабочих нагрузок, что готовые к промышленной эксплуатации программы на базе ИИ и машинного обучения предъявляют к хранению данных особые требования. Учитывая, что они работают с большими массивами информации, предприятиям нужно быть готовыми к тому, что их хранение в облаке может обойтись дороже, чем они рассчитывали.
ИИ и машинное обучение приведут к революционным изменениям в области хранения данных. Ненасытный аппетит к данным — Ахиллесова пята ИИ и машинного обучения. Проблема в том, что их обучение связано с определенными затратами, которые включают расходы на сбор, передачу и хранение.
Например, поставщик ПО для файловых систем и систем хранения данных Tuxera рассчитала, что один автономный автомобиль за день генерирует от 11 до 192 Тб данных. По информации Google, за день Waymo генерирует 2 Тб данных, однако когда автомобиль станет полностью автономным, этот объем легко вырастет до 20 Тб и больше. Даже исходя из того, что он составляет 2 Тб в день, за год затраты на хранение в Amazon, Google или Microsoft Cloud превысят 3 млн. долл. Согласитесь, платить 3 млн. долл. за хранение данных автомобиля Tesla стоимостью 30 тыс. долл. не имеет практического смысла.
Стартапы подогреют гонку в области технологий хранения данных
Катализатором новой волны инноваций в области хранения станут не сегодняшние рыночные лидеры, а стартапы. Например, облачный стартап Wasabi обещает 80%-ное снижение затрат на хранение, в шесть раз выше скорость передачи, чем у Amazon S3, беспрепятственный вывод данных и гарантию долговечности на уровне 99,99%. В Google, AWS и Microsoft Azure прекрасно осведомлены о том, что с учетом роста популярности ИИ и машинного обучения им придется приспособить имеющиеся или разработать новые архитектуры хранения данных. Они также знают, что появляются стартапы, которые конкурируют с ними в области хранения данных.
Если мы не разберемся с проблемой хранения данных, то ИИ будет выглядеть как ходячий мертвец. Вы можете демонстрировать беспилотные автомобили, у вас может быть парк из нескольких сотен таких машин, но не так уж много компаний смогут содержать его, как это делает Google с ее возможностями хранения, не обращая внимания на стоимость поддержки ради демонстрации жизнеспособности технологии. Однако масштаб облачных СХД не готов для работы с ИИ — им недостает надежности. Для подтверждения жизнеспособности ИИ нужно иное — мы должны изменить экономическую модель хранения. При этом Amazon, Google и Microsoft не выпадут из экосистемы хранения данных, однако им следует иметь в виду, что инновации ведут к новым экономическим моделям, а бизнес, как правило, выбирает более экономически выгодный вариант.
В ближайшие пять-десять лет базовая бизнес-модель облачного хранения данных будет пересмотрена. Wasabi делает это уже сейчас. Как и Amazon, Google и Microsoft, стартап занимается хранением данных, но стоимость его услуг составляет 10% от цены облачных гигантов. Почему он работает не в ущерб себе? Потому что это не хранилище данных в чистом виде, а бизнес-модель.
В краткосрочной перспективе существующие технологии будут оптимизированы, а также появятся принципиально иные технологии хранения данных. И те, и другие — в совокупности или во взаимодействии — позволят быстрее добиться лучших результатов и с меньшими затратами. Экосистема развивается, прирастая множеством мелких игроков, что вызовет сдвиг на рынке хранения. В конечном итоге Google, Amazon и Microsoft в какой-то степени последуют их примеру. Им придется изменить свои модели, причем не по своей воле, а потому что такова воля рынка.
Важность экспериментов
Лучший путь понять, куда двигается индустрия — встать на путь экспериментов с новыми технологиями и их сравнение с имеющимися. Внедрением ИИ занимаются многие компании, но пока что это эксперименты. Метод проб и ошибок — единственно верный путь: пройдя его, вы поймете важность хранения данных и начнете создавать приложения, которые работают не на базе облака Amazon S3, а на одной из моделей других игроков экосистемы. Эксперименты, тестирование и сравнение технологий — ключ к выбору технологии.
Увеличение объема хранения при меньших затратах создает предпосылки для операций, выполнение которых раньше было экономически нецелесообразным, таких как создание резервных копий бэкапов или возможность обучения ИИ и машинного обучения на еще больших массивах данных. Любая качественная бизнес-модель, начиная с здравоохранения, образования и заканчивая розничной торговлей, — это на самом деле бизнес-модель данных, а данные — безграничны. Познания в экономике хранения данных приведут к бесконечным инновациям и бизнес-моделям, что позволит в будущем решить ряд проблем, к которым мы раньше даже не могли подступиться.