Наряду с активным обсуждением возможных применений технологии больших данных, в последнее время делается также немало практических шагов в этом направлении. В частности, Google только что объявила о доступности облачного сервиса Google Dataproc, с сентября прошлого года находившегося в стадии бета-тестирования и представляющего собой объединение на управляемой основе технологий Apache Hadoop и Apache Spark. Как сообщает Google, участники тестирования с помощью Developers Console и Cloud SDK опробовали конфигурации, включающие от трех до нескольких тысяч виртуальных ЦП. Новый сервис допускает интеграцию с такими сервисами Google, как BigQuery (ускорение обработки запросов к большим данным), Cloud Bigtable (работа с сильно разреженными таблицами) и Cloud Storage. Dataproc можно также использовать совместно с Google Cloud Dataflow для пакетной или оперативной обработки потоковых данных. Разработчики могут теперь познакомиться с общедоступной бета-версией инструмента Cloud Vision API, дающего возможность оценивать эмоциональную окраску лиц на анализируемых изображениях.
Компания Alteryx расширила свой набор облачных аналитических сервисов Analytics Gallery средствами прогнозной аналитики Predictive Analytics District, содержащими целый ряд новых инструментов, приложений и примеров использования. С их помощью можно строить и верифицировать модели, после чего они могут быть экспортированы во внешние скоринговые системы. Использование указанных инструментальных средств не требует низкоуровнего кодирования.
Еще один заметный игрок рынка аналитики и оперативной обработки событий — компания TIBCO Software — присоединилась к консорциуму Cloud Foundry Foundation, призванному сделать Cloud Foundry промышленным стандартом платформы для развертывания облачных приложений.
Одно из заметных препятствий на пути широкого использования Big Data и продвинутой аналитики — дефицит специалистов, глубоко разбирающихся в данной области. Университет Рутгерса намерен внести свой вклад в решение указанной проблемы, запуская в конце марта новый цикл учебных программ длительностью 44 недели, пройдя который специалисты получат соответствующий сертификат. Университет планирует использовать передовую методику дистанционного обучения Experiential Teaching Online (XTOL). Пока что курс доступен выпускникам и профессионалам в США. Он включает такие дисциплины, как анализ данных (Data Analytics), исследование клиентской базы (Understanding Customers), прогнозирование прибыльности (Predicting Profitability), изучение предпочтений клиентов (Customer Preferences), а также ряд предметов, относящихся непосредственно к Big Data, в частности, Web Mining и Deep Analytics and Visualization.