Навязчиво рекламируемый термин «большие данные», используемый в контексте анализа крупномасштабных массивов данных, может кануть в лету. По крайней мере, такое впечатление вызвала панельная дискуссия по большим данным, организованная 21 мая на конференции MIT Sloan CIO Symposium в Кембридже, шт. Массачусетс.
Сложно оспорить такого авторитета, как Томас Дэвенпорт, автора книги «Big Data at Work», который в ходе панельной дискуссии, сказал, что термин «большие данные» не несет большого смысла. В качестве альтернативы большим данным предлагались такие термины, как «э-знание» (e-knowledge) и «конвергентные данные» (converged data). В конечном итоге, главное понять, что за бизнес-проблему вы хотите решить, а затем определить, какие данные потребуются для ее решения.
Хотя может показаться, что модному выражению «большие данные» суждено сойти на нет, в ИТ-сегменте создаются приложения, предназначенные для сборки гигантских потоков данных. В физическом мире, пожалуй, нет лучшего примера подобных цифровых данных, чем данные сенсоров, которые используются в похожем на жука самоуправляемом автомобиле Google, продемонстрированном компанией 27 мая.
По сути дела этот автомобиль, немного напоминающий ранний Volkswagen Beetle, перевел самовождение на новый уровень, избавившись от старого доброго руля вместе с педалями тормоза и газа. Автомобиль можно вызвать через приложение для смартфона, а пассажиры в нем только сидят, но не участвуют в управлении.
Хотя, возможно, еще пройдет годы (если это вообще произойдет), прежде чем пионерские автомобили Google появятся на дорогах, исходный посыл разработок Google — освободить водителя от вождения — вполне разумен. Google достигла своего первого успеха, когда послала цифровые роботы обегать Всемирную паутину для обследования контента, ранжировала ценность этого контента и затем сделала его веб-адреса доступными каждому пользователю браузера.
Хотя идея добавлять к результатам поиска контекстную рекламу исходила не от Google, модель с использованием рекламы неплохо послужила компании. Самоуправляемый автомобиль Google концептуально является продолжением сканирования Интернета, за исключением того, что автомобиль сканирует физический мир и Google собирает и анализирует сенсорные данные, которые (теоретически) должны вас уберечь от физической аварии.
Изъятие руля с педалями тормоза и газа имеет смысл в чисто техническом мире, где вера в цифровую технологию превосходит веру в ненадежные человеческие суждения. И люди действительно получают в свое распоряжение большую красную аварийную кнопку, которую можно будет нажать в случае неминуемой катастрофы. Догадываюсь, что став королем самоуправляемой навигации, Google найдет способ делать на этом деньги.
Разработка автомобиля Google — хороший пример правильного использования конвергентных данных вместо того, чтобы наполнять озеро данных, а потом пытаться понять, что вы собираетесь делать с всеми этими собранными данными.
В числе участников панельной дискуссии в Массачусетском технологическом институте присутствовали научный специалист по данным Пунит Батра и CIO по продуктам для стратегических инвестиций и данным корпорации Fidelity Investments Даррелл Фернандес. Оба согласны в том, что сбор данных и усилия сообщества вендоров по линии анализа должны вращаться вокруг конвергенции. Эти вендоры сегодня предлагают узконаправленные и несовместимые продукты, не имеющие простых средств интеграции по многим источникам данных. Максимальную пользу от данных дает только интеграция разнообразных потоков данных.
Для переосмысления практики использования и анализа данных бизнесу не обязательно заниматься такими далеко идущими проектами, как самоуправляемые автомобили. В рекламном мире сегодня происходит трудная перестройка, поскольку данные, направляемые через мобильные приложения, открывают большие возможности. Однако эта перестройка также требует более быстрого и более адресного сбора данных и размещения рекламы, чем при использовании браузеров на настольных ПК и ноутбуках.
Большие промышленные компании типа General Electric сегодня занимаются созданием приложений для использования всех сенсорных данных, которые ранее задействовались лишь в небольшой степени. Что же касается термина «большие данные», пора его отправлять на покой и начинать думать о том, какие типы конвергентных данных были бы наиболее ценны для вашей организации.