В эру облаков данные и аналитика могут отдать предпочтение более гибким платформам, чем Hadoop. Но это не означает, будто у технологии больших данных нет будущего, считают опрошенные порталом InformationWeek эксперты.
Следует ли Hadoop по пути исчезнувших магнитных лент 8 Track и видеокассет Betamax? Эта технология, породившая столько восторгов и оптимизма по поводу потенциала больших данных, столкнулась с трудностями, когда оставшиеся два независимых поставщика, Cloudera и MapR, вступили в полосу кризиса.
В случае с MapR речь идет о выживании. Недавно компания отсрочила неминуемую ликвидацию, подписав с потенциальным покупателем протокол о намерениях. Но если сделка не состоится до 3 июля, MapR предстоит ликвидация.
У Cloudera было несколько неудачных кварталов. Ее генеральный директор покинул свой пост, и эта новость была негативно воспринята инвесторами. Компания объясняет неудачи отсрочкой крупных сделок из-за подготовки к выпуску платформы данных, относящейся к новому поколению и вобравшей множество технологий помимо Hadoop.
Что произошло с Hadoop?
«Главная проблема Hadoop в том, что эта система задумывалась как единственный гигантский источник данных, — отметил учредитель и генеральный директор исследовательской фирмы Amalgam Insights Хайюн Парк. — Предполагается, что если у вас есть Hadoop, в ней хранится все, что у вас имеется. В сегодняшнем мире это создает проблемы, потому что у вас сотни приложений». Применять Hadoop в нескольких ЦОДах или облаках оказывается трудно.
Сейчас данные поступают из сотен источников, отметил Парк. На их обработку ориентируются такие компании, как Looker и Tableau. Недавно их купили, соответственно, Google и Salesforce.
Соучредитель и генеральный директор компании Databricks Али Годзи считает, что Hadoop не предназначается для облаков, поскольку не обладает такой же эластичностью, как облака. И будет превращаться в нишевое решение.
«Hadoop в облаках точно мертва», — заявил он. Подобно мейнфреймам эта платформа сохранится там, где это имеет смысл. «Спустя 50 лет все еще есть мейнфреймы IBM. Но это не то, что сегодня покупают и во что инвестируют».
Годзи говорит, что облака предоставляют более дешевые и надежные варианты хранения, чем файловая система Hadoop. Он считает, что старая бизнес-модель Red Hat, предусматривающая предоставление онпремисного открытого ПО и продажу его поддержки, обречена на отмирание.
«Современная модель — это управляемое открытое ПО в облаках», — утверждает Годзи. Такой сервис предполагает, что провайдер эксплуатирует ПО, обеспечивает его защиту и управляет им, а цена определяется соглашением о подписке.
Облачный Hadoop?
Сможет ли Hadoop работать в облаках? По мнению аналитика Gartner Адама Ронтала, несмотря на то, что в публичных облаках имеется несколько вариантов Hadoop, например у AWS, для многих приложений это не лучшие решения.
«Управление кластером Hadoop вызывет изрядные сложности», — говорит он. Организациям, изучающим облачные решения для аналитики и работы с данными, проще и легче использовать те, которые не связаны с Hadoop. Но это не означает, что для Hadoop нет места в будущем.
Ронтал считает, что Hadoop переживает «коррекцию рынка», а не экзистенциальный кризис. Имеются сценарии, в которых эта платформа действительно хороша. Но несколько лет назад Hadoop считалась рок-звездой в области технологии, способной решить любую проблему.
«Три, четыре или пять лет назад ожидалось, что Hadoop изменит мир и управление данными, — напоминает Ронтал. — Эти надежды не оправдались. Тем не менее, сейчас признается, что есть задачи, связанные с наукой о данных, с которыми Hadoop действительно хорошо справляется».