Когда ещё не наступила эпоха обработки данных, в компаниях использовалось нечто напоминающее то, что мы сегодня называем бизнес-аналитикой (BI). Исторически термин BI определялся как способ сводить информацию из всех бизнес-процессов (например, таких, как выставление счетов, отгрузка, управление складскими запасами, продажи) для создания общей картины происходящего в бизнесе и некоторого представления о его будущем.
Однако по мере роста объемов данных, совершенствования алгоритмов их обработки и повышения скорости вычислений область BI превратилась в набор различных идеологий и методов анализа, в результате чего обычно ассоциируемые с ней процессы и результаты стали чем-то совершенно иным. Эти изменения вводят в заблуждение относительно сущности BI и в значительной мере снижают ценность любой полученной информации из-за огромных объемов обрабатываемых данных.
Ввиду непредсказуемости результатов традиционный процесс BI не был идеальным показателем эффективности бизнеса в будущем. Проще говоря, ценность BI, особенно в том виде, как она определялась прежде, поставлена под сомнение.
Это означает, что нам необходимо заново определить BI и учесть элементы её процессов, чтобы выяснить, какие данные являются ценными с точки зрения BI и как ими можно управлять.
Все начинается с извлечения данных. Правильнее сказать, со способов извлечения. Они делятся на четыре аналитические категории, каждая из которых может управлять процессом BI.
- Добыча данных (data mining). Здесь главные задачи — моделирование и выявление знаний в целях составления прогноза, а не описания. В идеальном случае добыча данных применяется для выявления новых структур в больших наборах данных, что и отличает ее от традиционной BI.
- Моделирование или визуализация данных (data modeling, data visualization). Это модель анализа данных, ориентированная на обнаружение информации для конкретного плана или случая. Тут применяется фильтрация по заданным критериям (например, какое количество определенного продукта было продано в течение некоего периода). •
- Предсказательная аналитика (predictive analytics). С помощью алгоритмов, составленных на основе предсказательной модели, и анализа исторических данных и транзакций определяются будущие тенденции. Идеально подходит для анализа тенденций и выявления будущих устойчивых структур.
- Приложения статистического анализа (statistical applications). Они призваны помогать пользователям собирать, анализировать и интерпретировать данные с использованием традиционной математической статистики. Обычно такие приложения применяются для анализа результатов обследований и других частных наборов данных. В сущности это далекие предки BI в её нынешнем виде.
Такая эволюция BI и наборы аналитических моделей являются весьма многообещающими для компаний любого размера, особенно работающих со сверхбольшими объемами данных (big data). Компании могут воспользоваться общедоступными источниками, такими как геоинформационные системы и результаты переписей, которые в дальнейшем можно сравнивать с исторической информацией, хранящейся во внутренних и внешних источниках. Это как раз то направление, в котором развивается BI, превращающаяся в конгломерат аналитических инструментов для сверхбольших объемов данных, извлекаемых из множества источников, и адаптируемых алгоритмов. Всё это направлено на то, чтобы уже сегодня предоставить компаниям недоступные прежде инструменты выявления тенденций и составления прогнозов.