Корпорация Teradata анонсировала свой новый подход к развертыванию «озер данных» на основе «шаблонных проектов», в которых нашел свое применение многолетний опыт консалтинга и оптимизации больших данных. Данный подход поможет клиентам построить «озера данных» и пользоваться их преимуществами. Новый подход на основе шаблонов проектов применяется в отрасли впервые, подтверждая лидерство корпорации Teradata в области оказания консалтинговых услуг для бизнес-пользователей, специалистов по обработке и анализу данных, а также IT-специалистов по вопросам построения «озер данных», представляющих исключительную коммерческую ценность.
Организации изучают функциональные возможности «озер данных» для понимания и использования растущих объемов данных. Однако работу IT-отделов осложняют серьезные проблемы, такие как недостаток передовых методик, нехватка специалистов по обработке и анализу данных, и даже неясность в отношении определения «озера данных». Наряду с этими сложными задачами, растет число вариантов технологической реализации. Например, обычно считается, что «озера данных» аналогичны технологии Hadoop, которая является прекрасным выбором для многих рабочих нагрузок «озер данных»; однако «озеро данных» может быть построено на основе нескольких различных технологий, таких как Hadoop, NoSQL, Amazon Simple Storage Service (S3), реляционная база данных (система управления реляционными базами данных, RDBMS), либо их комбинаций. И до тех пор, пока технологии определяют результат, для успешного построения «озера данных» необходим план. Шаблон проекта «озера данных» — это и есть тот самый план. Шаблон проекта содержит объекты интеллектуальной собственности на основе передовых методик для корпоративного сегмента в сочетании с продуктами, разработанными совместно с другими компаниями на основе их опыта успешного привлечения клиентов.
«Корпорация Teradata вышла на передовой рубеж создания шаблонов реализации „озер данных“, — утверждает Тони Баер (Tony Baer), старший аналитик компании OVUM. — „Озеро данных“ отличается от хранилища рабочих данных. Преимущества, которые предлагает Teradata, основаны на реальном практическом опыте, помогая клиентам справляться с управлением данными в условиях разнородных сред. С приобретением компании Think Big, корпорация Teradata приобрела ценные интеллектуальные активы — шаблоны проектов, которые помогут построить прозрачные „озера данных“».
Благодаря доступу к новым данным, таким как записи службы поддержки клиентов, сведения о посещении сайтов, IP-трафик, содержимое журналов событий, информация от датчиков, хранящаяся в «озере данных», пользователи могут рассматривать ситуации, обычно требующие взаимной проверки нескольких одновременных интерпретаций данных. Ниже описана пара таких случаев: создание улучшенных моделей распознавания оттока клиентов посредством выделения текста из звонков службы поддержки клиентов, хранящихся в «озере данных», с последующим применением методов предиктивной аналитики текста; обеспечение анализа тенденций по отношению к комбинациям громадных потоков машинных данных и данных клиентов. Например, для коммунальных предприятий «озера данных» создают основу для сравнительной оценки выполнения нескольких моделей данных для изучения последствий установки энергосберегающего оборудования и скрытого эффекта снижения потребления электроэнергии (через несколько месяцев).
«Кто не слышал о кошмарах внедрения „озер данных“? Именно поэтому мы развиваемся: нас просят прийти и помочь исправить недостатки „озер данных“, которые не только создают проблемы, но и дорого обходятся компаниям, — говорит Рон Бодкин (Ron Bodkin), президент компании Think Big, входящей в корпорацию Teradata. — Мы приспосабливаем наш подход, основанный на шаблоне проекта „озера данных“, к каждому конкретному случаю. Таким образом, наши шаблоны и программные платформы поддержки - это серьезные инструменты на пути к успеху, доказавшие свою эффективность. К сожалению, многие компании считают сложности использования больших данных препятствием. Мы вытаскиваем клиентов из кризисных ситуаций и помогаем компаниям, IT-специалистам и специалистам по обработке и анализу данных планировать, внедрять и использовать преимущества „озер данных“. Последние, вообще-то, задумывались как серьезное подспорье для бизнеса — таковыми они и становятся, когда их построением занимаются профессионалы».
С самого начала компания Think Big сохраняет нейтралитет в отношении платформ и технологий и сосредоточена на реализации преимуществ технологий с открытым исходным кодом, таких как Apache Hadoop, Apache Spark и NoSQL. Think Big предлагает ряд услуг по созданию проектов на основе шаблонов «озер данных», включая: шаблон Data Lake Foundation для коллективов, только начинающих работу с «озером данных» или которым необходимы советы по использованию передовых методик; шаблон Data Lake Architecture, разработанный для организаций, которым требуются рекомендации по применению передовых методик работы с «озером данных» и выбору технологий; шаблон Data Lake Analytics, который поддерживает первичную обработку данных при реализации аналитических циклов.
Компания Think Big помогла многим ведущим и инновационным компаниям отрасли внедрить «озера данных» и разработать проекты реализации Hadoop/больших данных, включая следующие компании: HGST, входящую в состав Western Digital; одного из крупнейших международных поставщиков финансовых услуг; ведущего производителя полупроводников; крупнейшего производителя устройств хранения данных и управления данными; известного производителя спортивной одежды, и знаменитого мирового производителя безалкогольных напитков.
Корпорация Teradata также предлагает разнообразные продукты и технологии, усовершенствованные для использования в средах «озер данных». В их число входит Teradata Listener — продукт, упрощающий передачу потока больших данных в «озеро данных» благодаря интеллектуальному программному решению, не требующему дополнительного обслуживания; программный комплекс Teradata Appliance for Hadoop, недорогой выбор для хранения данных; Presto — технология, обеспечивающее реализацию современной архитектуры SQL-on-Hadoop; и, наконец, акселераторы «озера данных», построенные на основе протокола IP, а именно, Pipeline Controller и Buffer Server, совместная работа которых обеспечивает эффективное управление перемещением данных из местных серверов в хранилище Hadoop.