Для того, чтобы раскрыть ценность данных, они не обязательно должны быть большими, вам также не потребуются большая команда или огромный бюджет. Все, что нужно — целеустремленность, минимальные навыки аналитической работы и качественные, очищенные от различных «шумов» данные, пишет CIO исследовательской компании Sundial Capital Research Эрик Браун на портале Enterprisers Project.
За последние несколько лет в ИТ появилось немало новых технологий, одной из них стали большие данные. Эта технология просочилась сквозь стены научных лабораторий и перекинулась на области, которые имеют лишь опосредованное отношение к данным, например, маркетинг, операционную деятельность, финансы и т. д. О Big Data много говорят как в Интернете, так и в организациях, однако далеко не вся эта информация соответствует действительности. Более того, вокруг больших данных сложилось четыре основных мифа, которые препятствуют технологии приносить пользу как небольшим, так и крупным компаниям.
Первый миф: большие данные предназначены только для больших компаний
Инициативы в области больших данных приносят пользу не только крупнейшим в мире компаниям, но и небольшим фирмам. В подавляющем большинстве случаев предприятия СМБ обладают более скромными массивами данных, чем крупные компании, однако подход к анализу и использованию этих данных остается таким же, как и для больших фирм. Независимо от того, работает ли в организации 20, 200 или 2000 человек, вы можете применять для анализа данных те же процессы и платформы, что и Amazon. Преследуемая цель — сокращение расходов, улучшение продаж, увеличение доходов и создание новых инновационных возможностей для роста.
Второй миф: большой бюджет, крупные команды, сложные платформы
На протяжении многих лет я слышу некоторые компании говорят, что они не могут «делать большие данные», потому что они небольшие и у них нет огромных бюджетов, которыми обладают большие компании. Однако реальность такова, что входной порог в мир больших данных не настолько высок, как многие ошибочно считают. В качестве примера можно привести одну компанию, штат которой насчитывает меньше 10 сотрудников, однако это не мешает ей получать миллионные доходы и применять один из самых сложных процессов обработки данных. Компания инвестировала часть средств для приобретения ПО и переобучения нескольких своих сотрудников, однако эти затраты уже многократно окупились.
У нее маленькая команда, нет больших бюджетов и сложных платформ, но она отлично справляется с большими данными. Как ей это удалось? На помощь пришли облачные платформы — их задействование на порядок упрощает анализ, что делает его экономически эффективным для любой организации.
Третий миф: чем больше данных, тем лучше
Могут ли быть сомнения, что хорошее управление данными гораздо выгоднее инвестиций в большее количество данных. Приступая к анализу данных, некоторые пользователи, как правило, воодушевляются количеством собранных данных и в гонке за ним переступают границы разумного. Поначалу кажется, что добавив в прогнозируемый проект больше переменных, можно будет получить более точный результат, но это не всегда так. В некоторых случаях ориентация на точность приводит к менее надежным моделям, поскольку эти модели могут быть чрезмерно оптимизированы для одного конкретного набора данных. В итоге, если с течением времени характеристики данных будут меняться, это может привести к катастрофическим диспропорциям.
Таким образом, возрастающее количество данных, которые принимаются во внимание (не всегда, но во многих случаях), увеличивает шансы на отклонение от результата, поэтому в расчет следует принимать не «массу» данных, а их качество — они должны быть как можно чище. Вместо того, чтобы постоянно искать дополнительные данные, которые в теории можно добавить в свои системы и процессы, лучше всего прибегнуть к поиску способов, которые помогут улучшить существующие процессы обработки данных. Чем больше данных, тем больший риск, особенно это касается компаний, которые проверяют свои модели нерегулярно, а также уделяют недостаточное внимание управлению данными и процессам обработки данных. Важно понимать, что залог успеха в аналитике данных кроется не в их количестве, а в качестве управления ими.
Четвертый миф: машины лучше, чем люди
В последнее время много говорится о том, что применение новых подходов к обработке данных, таких как машинное обучение и искусственный интеллект, автоматически приводит к успеху. Предполагается, что машины могут делать гораздо больше человека, однако такая точка зрения расходится с действительностью: они могут делать только то, что им диктует человек. Несмотря на то, что развитие ИИ не стоит на месте и двигается в том числе по направлению к созданию мыслящих роботов, пока что эти исследования не выходят за рамки эксперимента. Модель машинного обучения будет эффективной только в том случае, если в ее основе будут лежать те наборы данных, которые применялись для ее создания изначально. В обозримом будущем не может быть и речи о том, чтобы ИИ обрабатывал неподготовленные наборы данных, иначе эта обработка будет бесконтрольной.
Стремление к цели
Сталкиваясь в жизни с определенными ситуациями, человек накапливает опыт и затем руководствуется им и здравым смыслом, чтобы понять, является ли то, что он увидел или услышал, правильным или нет. Тем не менее, иногда человеческая логика дает сбой, воспринимая большие данные, ИИ и машинное обучение как универсальное средство для решения всех проблем. Это играет на руку компаниям, которые зарабатывают продажами Big Data-платформ крупным предприятиям, убеждая тех, что для работы с большими данными нужны большие бюджеты, крупные команды и дорогостоящие платформы. Компании, работающие в сфере ИИ-консалтинга и машинного обучения, всегда будет пытаться продать «больше», потому что именно так они зарабатывают деньги и остаются конкурентоспособными в своей сфере. Конечно, зарабатывать деньги — это то, ради чего приходят в бизнес, и предприятиям стоит нанимать консультантов, потому что в некоторых случаях они являются единственной альтернативой. Но чтобы извлечь из ваших данных ценность, вам не нужно много данных, огромный бюджет или большие платформы. Все, что вам действительно нужно для начала, — это стремление к цели, минимальные аналитические навыки и чистые данные.