Недавний анонс компанией CenturyLink нового облачного сервиса для больших данных на базе Cloudera свидетельствует о том, что в сегменте облачных Hadoop-сервисов существует богатый выбор, причем многие из них готовы превзойти стандартные возможности. Это еще один знак того, что компании ожидают от облачных провайдеров такого же разнообразия опций, как и от ключевых поставщиков ИТ-услуг.
Будущее больших данных туманно. По той простой причине, что слишком уж велика пропасть между интересом к большим данным наряду с подспудным желанием их понять и квалификацией, необходимой для того, чтобы извлечь из них пользу.
Именно этот факт вызвал интерес к управляемым облачным сервисам для больших данных, действующим в PaaS-формате. Главная идея здесь заключается в том, что если вам не хватает конкретно знаний и умений, а не средств или ресурсов, то банальная покупка времени внутри какого-нибудь кластера Amazon для работы собственного экземпляра Hadoop или другого аналитического хранилища больших данных большой пользы вам не принесет. Этим объясняется рост числа управляемых сервисов обработки данных всех калибров. Неудивительно, что компания Amazon в течение первого года работы своего нового сервиса миграции перенесла свыше 14 тыс. баз данных, при этом из всех сервисов AWS сначала Aurora, а потом и Redshift показали наибольший темп роста.
Компания CenturyLink недавно анонсировала новый облачный BDaaS-продукт (Big Data-as-a-Service, «большие данные как сервис») на базе аналитической платформы Cloudera, тем самым подчеркнув тот факт, что появилось не просто больше вариантов, в каком облаке запускать Hadoop, а что эти варианты к тому же еще и очень разноплановые.
В двух словах, продукт CenturyLink однозначно принадлежит к премиум-классу. Он основывается на собственной компоновке платформы Cloudera Enterprise (можно выбрать любую из пяти ее версий), которая затем устанавливается на физическую, аппаратную облачную инфраструктуру, что исключает необходимость в виртуализации, так часто применяющейся в большинстве облачных платформ. Достоинства такого решения состоят в том, что в отсутствие слоя виртуализации повысится производительность вычислений, к тому же в условиях хранения данных на местных носителях (а не в пулах) доступ к данным будет осуществляться намного быстрее. С другой стороны, виртуализация является ключевым условием гибкости и экономичности в тех масштабах, которые способны предложить такие провайдеры, как AWS или Azure. Вот почему виртуализация обычно считается нормой, а провайдеры, например Oracle, предлагают своим клиентам установку непосредственно на железо только как дополнительную опцию.
В коммерческое предложение CenturyLink также включена возможность воспользоваться тактическими и стратегическими сервисами: это в основном касается функционала, который перешел в собственность CenturyLink после покупки аналитической компании Cognilytics в 2014 г.
Вопрос дифференциации для облачных провайдеров стоит достаточно просто: им нужно что-то противопоставить принципу «покупай у Amazon (или Microsoft Azure) — и не прогадаешь». (Произошло от поговорки «Nobody gets fired for buying IBM», которая вкратце означает стремление выбрать самый дорогой и надежный вариант на рынке, чтобы не рисковать). Ведь в противном случае попытка предложить точную копию того, что более успешный сосед по улице уже и так продает, обречена на провал: можно попробовать конкурировать за счет цены, но этот вариант, по-хорошему, доступен только гигантам масштаба Google.
Примечательно, что когда компания Hortonworks анонсировала свой продукт на площадке AWS Marketplace, она не предприняла попыток просто портировать свой аналогичный продукт для сервиса HDInsight (в который входит полная версия Hortonworks Data Platform плюс Spark). Также они не пытались подражать похожей по богатству функционала платформе Amazon Elastic MapReduce (EMR). Вместо этого в Hortonworks создали принципиально новое, сборное решение Hortonworks Data Cloud, основанное на популярнейших средах для рабочих нагрузок Spark и Hive. Таким образом, компания Hortonworks предоставила клиентам AWS Marketplace повод не останавливаться по умолчанию на EMR.
У предприятий тоже есть веские причины стремиться к разнообразию. Некоторым просто нужно дешево работать с Hadoop, а премудростями управления (всеми этими скучными техническими проблемами развертывания, управления, исправления, обновления и пр.) пусть занимается облачный провайдер. Некоторых вполне устроит стандартный, лишенный прибамбасов пакет, а другим подавай больше разнообразия при выборе дополнительных опций. А кое-кто, возможно, захочет персонализированного подхода к обслуживанию на уровне, который можно ожидать от компаний Accenture, Deloitte или более специализированных региональных провайдеров.
С помощью своего нового облачного BDaaS-продукта провайдер телекоммуникационных услуг CenturyLink четко обозначил свои намерения предлагать люксовый, персонализированный сервис, представляющий собой альтернативу обычным предложениям облачного рынка. Это еще один знак преображения облака из просто варианта развертывания системы в целую корпоративную платформу, с разнообразным набором опций, которые компании вправе ожидать от своих ключевых поставщиков ИТ-услуг.