От предиктивных операций до периферийных развертываний — инновации в области генеративного искусственного интеллекта требуют переосмысления современных центров обработки данных, пишет на портале InformationWeek Деррек ван Гелдерен, руководитель отдела ИИ-стратегии компании PA Consulting.
Дата-центры, которые когда-то считались статической основой корпоративных ИТ, в настоящее время претерпевают значительные изменения. Развитие генеративного ИИ меняет не только то, что поддерживают центры обработки данных, но и то, как они функционируют на всех уровнях, от операционной эффективности до физической инфраструктуры.
ИИ становится «мозгом» современного дата-центра. Он может действовать как автопилот, динамически управляя всем: от охлаждения и питания до балансировки рабочей нагрузки и предиктивного технического обслуживания. Он превращает дата-центр в самооптимизирующуюся систему, подобную человеческому организму, регулирующему свои собственные функции. Таким образом, ИИ больше не является просто рабочей нагрузкой, выполняемой в дата-центре, а представляет собой интеллект дата-центра, который оркестрирует ресурсы в режиме реального времени, чтобы обеспечить их максимально эффективную работу.
Следовательно, дата-центры должны быть перестроены для обслуживания ИИ. Развитие больших языковых моделей, таких как GPT, означает, что дата-центры становятся ИИ-фабриками, предназначенными для высокоплотных вычислений. Это требует фундаментального переосмысления дизайна, распределения энергии и масштабируемости. Например, для обеспечения огромных объемов энергии и охлаждения, необходимых для работы, операторы перепроектируют все, от тепловых систем до расположения стоек.
В то же время ИИ является партнером дата-центра, постоянно сканируя датчики, регулируя воздушный поток и перенаправляя рабочие нагрузки, что позволяет операторам предсказывать потребности и предотвращать проблемы. Это не только оптимизирует инфраструктуру, но и превращает ее в мыслящую, саморегулируемую сеть, которая может работать с минимальным участием человека. В результате ранее ручной, реактивный процесс становится проактивным и самокорректирующимся, что обеспечивает повышенный уровень эффективности и продолжительности безотказной работы.
ИИ сможет сократить расходы во всех нужных аспектах: энергия, простои и недоиспользованные мощности. Предиктивное обслуживание означает, что оборудование служит дольше, а интеллектуальное охлаждение снижает счета за электроэнергию. ИИ также предотвращает избыточное предоставление ресурсов, так что если никто не использует сервер, он переходит в режим простоя, как если бы выключить свет, когда в комнате никого нет.
Итак, существует ли риск, что старые дата-центры окажутся устаревшими из-за появления ИИ? Не совсем, но они будут вынуждены адаптироваться. Наиболее эффективный подход — это не снос, а интеллектуальная модернизация. Уже сейчас многие старые объекты успешно модернизируются и превращаются в объекты, готовые к ИИ. Некоторые организации начали создавать «ИИ-узлы» в рамках устаревших дата-центров, которые представляют собой автономные стойки высокой плотности с выделенным охлаждением, что позволяет им поддерживать сложные рабочие нагрузки без полной перестройки. Благодаря модульным обновлениям — таким как жидкостное охлаждение для управления теплоотводом от плотных рабочих ИИ-нагрузок, интеллектуальные блоки распределения питания для оптимизации энергопотребления и системы баз данных, готовые к ИИ, которые могут поддерживать векторный поиск и извлечение — старые дата-центры могут быть приведены в соответствие с современными стандартами. Фактически, объекты с прочной физической инфраструктурой и доступом к надежному энергоснабжению и связи — то, что мы называем «хорошей основой и хорошим расположением» — часто более рентабельны для модернизации, чем для замены.
В дискуссиях об инфраструктуре ИИ часто упускается из виду то, насколько радикально меняется способ доступа к данным. На протяжении десятилетий данные хранились в структурированных реляционных базах данных: идентификатор клиента, временная метка, тип транзакции — все тщательно определено в строках и столбцах. Но такая структура имела свою цену. Чтобы сделать что-то значимое с этими данными, организациям требовались инженеры по данным, конвейеры, задания ETL, панели мониторинга; и даже тогда взаимодействие в основном происходило через формы и фильтры, а не через интеллект.
Сейчас, с появлением больших языковых моделей и векторных баз данных, вся эта парадигма меняется. Впервые мы можем хранить и извлекать информацию на основе смысла, а не только схемы. Вместо того, чтобы создавать запрос или инструментальную панель, можно просто спросить: «Что произошло с нашей клиентской базой на северо-востоке в прошлом квартале?» и получить реальный ответ. Это не только более мощно, но и более естественно для человека.
Это также означает сдвиг в том, кто получает доступ к инсайтам. Предприятиям больше не нужны навыки SQL или инструменты BI, достаточно естественного языка. Это изменение стимулирует появление новой категории инфраструктуры: систем, созданных для понимания, рассуждения и реагирования, а не только для хранения и обслуживания.
К тому же ИИ теперь может работать ближе к месту генерации данных. Вывод происходит на периферии, а обучение остается централизованным. Эта двойная структура определит следующее десятилетие — гибридная структура облака и периферии, работающих в тандеме.
Прорывы в области Open Source означают, что теперь любой человек в любом месте может развернуть и настроить мощный ИИ. Это приводит к новой волне внедрения ИИ в таких областях, как морские системы, оборонные заводы, подразделения экстренного реагирования и удаленные медицинские учреждения, где связь ограничена, безопасность имеет первостепенное значение, а решения не могут ждать, пока они пройдут через облако. Эти области становятся новым рубежом для инфраструктуры ИИ. Мы видим, как на местах внедряются механизмы вывода, векторные базы данных и агенты ИИ, что позволяет принимать решения на местном уровне практически в режиме реального времени.
Это гибридное будущее — централизованное обучение ИИ в облаке и распределенные выводы на периферии — знаменует собой фундаментальную эволюцию в том, как и где применяется ИИ. В основе этой ИИ-трансформации лежит способность сделать инфраструктуру более человекоориентированной. Не только в том, как она функционирует за кулисами, но и в том, как с ней взаимодействуют предприятия и отдельные лица.