Сегодня на слуху такие новые технологии, как искусственный интеллект, большие данные, Интернет вещей, дополненная и виртуальная реальности и др., но не стоит забывать, что основой для их создания и применения в значительной степени послужил открытый код. Именно Open Source является той благодатной средой, которая без излишних проволочек позволяет генерировать и обмениваться кодом, ускоряя внедрение инноваций. Если ещё несколько лет назад сообщество Open Source было разрозненным, то теперь, работая под руководством Linux Foundation и поддерживаемое большими технологическими компаниями, оно заложило основу для обустройства открытых инфраструктур не только для СМБ, но и крупного бизнеса.
Старший аналитик консалтинговой компании Taneja Group Майкл Мэтчетт поделился на портале TechTarget размышлениями по поводу того, как выстроить стратегию применения Open Source на предприятии и каких ошибок при этом стоит избегать. Прежде чем добраться до сути вопроса, он предлагает разобраться в парадоксе: почему для работы с большими данными предприятия обращаются к платформам с открытым исходным кодом, но когда требуется обработать «маленькие» массивы информации — предпочитают закупаться проприетарными бизнес-приложениями, структурированными платформами бизнес-аналитики и базами данных? Неужели для анализа относительно небольших объемов данных не проще масштабировать бесплатные большие системы с открытым исходным кодом?
Бизнесу не откажешь в прагматичности, поэтому есть причины, почему он останавливает свой выбор на проприетарных решениях. Во-первых, для многих компаний стоимость решений не является основополагающей — их интересует минимизация рисков и соблюдение требований по управлению данными класса предприятий. Во-вторых, как уже не раз говорилось отраслевыми экспертами, Open Source не является по-настоящему бесплатным софтом. Для гарантии его бесшовного внедрения и работы требуются усилия квалифицированных специалистов, профессиональная поддержка — то есть те же составляющие, которые необходимы для нормального функционирования проприетарного софта. Другими словами, платформы с открытым исходным кодом не всегда выходят на окупаемость.
Тем не менее, Open Source-стратегии создают привлекательные возможности для предприятий, которые не желают мириться с устареванием приложений. Некоторые из них при выборе нового софта принципиально отдают предпочтение открытому коду. Более того, при распределении ИТ-бюджетов Open Source фактически превратился в одну из основных статей расхода. Это объясняется тем, что компании, которые планируют способы продвижения бизнеса, учитывают следующие его преимущества: возможность применения гибких методов создания приложений, в том числе веб-приложений, новые подходы к анализу накапливающихся данных, а также открывающиеся перспективы для борьбы с конкурентами.
Но подчас мало самого понимания этих преимуществ, чтобы извлечь из них пользу. История знает немало примеров, когда те или иные фирмы подошли к вопросу внедрения Open Source слишком агрессивно и были вынуждены «откатиться» к своим проверенным временем проприетарным стекам ПО. Учитывая, что таких примеров не так мало, на первый взгляд даже удивительно, почему Open Source с его пока ещё зачаточными функциями корпоративного класса стал так популярен.
Мэтчетт говорит, что объяснение этого явления лежит на поверхности: «Среда Open Source является идеальным местом для творческих людей. Здесь они могут развивать свои навыки, приобретать новые знания, налаживать взаимоотношения за пределами собственной компании, при этом внося собственный вклад в жизнь сообщества. Не стоит забывать, что креативные люди ищут признания, хотят привлечь внимание — и Open Source даёт им это». Сходной точки зрения придерживается и бывший президент крупного поставщика ПО для хранения данных Hortonworks Райниш Верма. По его словам, обустройство Open Source-решений «идет рука об руку с возможностью привлечения лучших технических талантов». Таким образом, ключ к пониманию популярности Open Source — желание потенциальных сотрудников работать в условиях открытости, поэтому работодатели вынуждены идти им навстречу.
Когда организации принимают решения о переводе своих инфраструктур на софт, основой которого является открытый код, это не значит, что им нужно что-то разрабатывать с нуля. В большинстве случаев вариативности открытого готового ПО на рынке достаточно для удовлетворения практически любых запросов. Нужно понимать, что создание и разворачивание софта с открытом кодом — далеко не дешевая процедура, поэтому многие фирмы, особенно из числа СМБ, предпочитают заключать с поставщиками софта контракты на оказание техподдержки. Что касается выбора поставщиков, то в качестве таковых обычно подбираются главные контрибуторы (наполнители кодовой базы) Open Source-проектов; предпочтения также отдаются коммерческому поставщику софта, «на балансе» которого имеются бывшие контрибуторы, которые активно вносят вклад в кодовую базу проекта.
Чем больше кодовая база Open Source-проекта, как, например, у аналитических платформ, тем больше у неё контрибуторов. Постепенно кодовая ветка проекта разрастается, что в итоге выливается в несколько конкурирующих дистрибутивов. При выборе стратегии нужно иметь представление о типичной бизнес-модели поставщика решений Open Source — помимо открытых компонентов она предусматривает лицензирование запатентованных компонентов корпоративного уровня. Для пояснения: открытый софт, лицензируемый на условиях GPL, предусматривает его установку на любых компьютерах, но имеются различия между способом развертывания софта.
Если домашнему пользователю обычно достаточно базовой версии софта, то в случае корпоративного применения потребуется получить лицензию или оплатить техподдержку — это необходимо для развертывания проприетарных компонентов типа дополнительных уровней безопасности, обслуживания, а также функций управления, требуемых для работы софта на промышленном уровне.
В качестве иллюстрации работы модели Open Source можно привести дистрибутив Apache Hadoop, основными поставщиками которого являются Hortonworks, Cloudera и MapR Technologies. Важно отметить, что последние 10 лет — именно столько лет потребовалось Big Data-платформам, чтобы выйти из ниши в мейнстрим — ни одна из этих компаний не позиционирует себя как дистрибутора Hadoop, предпочитая заявлять, что являются поставщиками «платформ обработки данных следующего поколения». Это объясняется тем, что эти вендоры не хотят ассоциироваться сугубо с этим проектом в его первозданном виде. Они, в частности, не ограничиваются применением оригинальной Hadoop MapReduce или даже распределенной файловой системой Hadoop.
Такое позиционирование имеет смысл, поскольку крупные поставщики платформ Big Data обогатили традиционные возможности дистрибутива Hadoop дополнительными функциями управления (модифицируемыми по требованию заказчика), поддержкой SQL и бизнес-приложений, компонентами для работы в режиме реального времени, Spark и сфокусировались на машинном обучении. В будущем Hortonworks, Cloudera и MapR Technologies придется доказывать состоятельность своих продуктов с учетом их приспособленности к работе с контейнерами, устройствами IoT, облачными окружениями и edge-архитектурами.
Разумеется, охватить все эти ниши единому поставщику представляется непосильной задачей, поэтому каждый из вендоров сосредоточится на определенных нишах:
• Hortonworks. Нацеливаясь на место основного поставщика аналитической платформы для крупных предприятий, компания строго придерживается чистоты открытого исходного кода, но при этом может похвастаться тесными партнерскими отношениями с Microsoft и IBM. Подписка на платформу предусматривает индивидуальную интеграцию с проприетарными пакетами её партнеров.
• Cloudera. Задачей удовлетворения нужд предприятий компания занимается с момента своего основания и теперь оказывает помощь при переходе на приложения следующего поколения. Специализация Cloudera — обеспечение перехода с дорогостоящих устаревших СХД к инструментам оперативного управления данными и аналитическим системам оперативного реагирования.
• MapR. Компания известна тем, что вместо простой распределенной файловой системы Hadoop создала полностью транзакционную, программно-управляемую файловую систему для многослойного хранения данных. Технически платформа MapR работает как масштабируемый контейнерный узел, что обеспечивает удобную среду для развертывания конвергентных типов приложений для онлайн-аналитики, обработки транзакций и больших данных.
Следует иметь в виду, вначале на функциональном уровне получатель услуг вышеуказанных Open Source-поставщиков найдет минимум отличий между платформами, но со временем, когда они заработают в реальных условиях, проявятся ключевые различия.
Мэтчетт советует ИТ-менеджерам быть осмотрительными при выборе Open Source-стратегии, но при этом стремится опередить желание сотрудников, которые неизбежно захотят работать в среде Open Source. Он считает, что не обязательно ждать, когда мода на Open Source станет повальной и уже сейчас информировать их о том, что происходит в мире открытого кода, какие существуют проекты и др.
Движение к Open Source лучше всего начать с небольших проектов. Если стратегия на предприятии уже утверждена, отдельных исполнителей таких проектов имеет смысл поощрять. По словам Мэтчетта, Open Source — это ничем неограниченное поле для экспериментов. Одних только дистрибутивов существует множество сотен, и предприятию нужно лишь определиться, какой из них позволяет использовать открытые приложения комфортнее всего. Не помешает также разузнать о ключевых элементах основных программ, например о том, как их нужно обновлять, управлять ими или интегрировать в существующую архитектуру.