Графовые базы данных облегчают обработку и анализ больших наборов данных, но ИТ-отделы все еще находятся на ранних стадиях их внедрения. Сейчас самое время подумать о том, подходят ли они и с чего начать, пишет на портале InformationWeek Мэри Шеклетт, президент консалтинговой компании Transworld Data.

В течение последних нескольких лет поставщики и эксперты продвигали графовые базы данных как лучший способ масштабирования доступа к базам данных и управления данными. Корпоративные ИТ-отделы сначала медленно переходили на эту технологию, но сейчас этот процесс набирает обороты.

MarketsandMarkets прогнозирует, что продажи ПО для графовых баз данных вырастут с 1,9 млрд. долл. в 2021 г. до 5,1 млрд. долл. в 2026-м. По оценкам Emergen Research, к 2030 г. этот рынок достигнет 11,25 млрд. долл.

Графовые базы данных зародились как концепция в 1960-х, когда ограничения иерархических баз данных, таких как IBM IMS, были обойдены с помощью того, что тогда называлось виртуальными записями. Однако привлекать внимание компаний они стали только в 2010-х.

Действительно, когда речь идет об обработке больших массивов данных из разрозненных источников и систем, графовые базы данных могут превосходить по производительности реляционные базы данных типа SQL.

Текущие сценарии использования, похоже, подтверждают это.

В финансовом секторе графовые базы данных поддерживают сложную аналитику, соединяя множество различных точек данных, которые дают компаниям инсайты о том, как, когда и где зарождается мошенническая деятельность. С их помощью компании также могут увидеть связи между мошеннической деятельностью и кредитными картами, адресами и транзакциями. Возможность обнаружить и пресечь мошенничество до того, как оно проявится, имеет огромное значение. В 2021 г. только американские потребители потеряли из-за мошенничества более 5,8 млрд. долл.

В аэрокосмической отрасли Lockheed Martin Space использует графовые базы данных для управления своей большой цепочкой поставок. По словам ее CDAO Тобина Томаса, компания применяет такие технологии, как графы, чтобы соединить все взаимосвязи вместе и получить возможность видеть жизненный цикл, его конкретные части или компоненты и взаимосвязи между всеми элементами.

В здравоохранении графовые базы данных могут соединить множество точек данных для наблюдения за тем, как пациенты переходят между специалистами в рамках системы здравоохранения, а также для лучшего понимания темпов и причинных факторов возникновения заболеваний.

Одним словом, любая организация, столкнувшаяся с необходимостью анализа большого спектра точек данных, многие из которых кажутся несвязанными, получит пользу от использования графовой базы данных.

Что такое графовая база данных?

Графовая база данных названа так потому, что она повторяет структуру графа «точка-точка». В базе данных хранятся элементы, которые связаны с набором узлов и ребер, причем ребра представляют собой связи между узлами. Эти узловые связи позволяют напрямую связывать данные в хранилище и, во многих случаях, извлекать их с помощью одной операции.

Графовые базы данных используют NoSQL, что является благом для ИТ-отдела, в котором обычно есть сотрудники с навыками работы с SQL, а их способность обнаруживать и связывать тысячи различных взимосвязей между данными для аналитики и инсайтов делает их идеальным решением для анализа веб-страниц, социальных сетей и неструктурированных данных. Структура графовой базы данных, основанная на принципе «точка-точка» и не содержащая столбцов, делает ее более быстрой и гибкой, чем реляционная база данных SQL.

Начало работы с графовыми базами данных

Несмотря на радужные рыночные прогнозы, только 12,7% компаний-респондентов исследования DATAVERSITY заявили в 2019 г., что используют графовые базы данных, и только четверть — что планируют использовать их в будущем. Одним из препятствий оказалось недостаточное понимание технологии.

ИТ-специалисты имеют хорошо отточенные навыки работы с реляционными базами данных и понимают их место в общем ландшафте баз данных, но у них до сих пор не ясного понимания, чем графовые базы данных отличаются от реляционных и каковы их преимущества.

Учитывая эти пробелы в знаниях и опыте, что ИТ-отдел может сделать сейчас, чтобы не упустить то, что может стать мощной аналитической платформой? Вот несколько идей:

1. Найдите сценарий использования

Графовые базы данных полезны в криминалистике, где важно связать множество различных точек данных (некоторые из них кажутся не имеющими отношения друг к другу), чтобы создать потрет подозреваемого. То же самое относится и к медицинскому приложению, которое стремится понять происхождение болезни и почему она поражает одних людей, а не других.

В обоих случаях необходимо анализировать большие объемы данных. Именно здесь графовые базы данных проявляют себя с лучшей стороны, а реляционные базы данных демонстрируют свои ограничения.

2. Начните с одного проекта

Первый пример использования в бизнесе должен быть четко определен и спроектирован. Это даст вашим сотрудникам возможность учиться и экспериментировать с технологией. Это также позволит сотрудникам определить методологию работы с графовыми базами данных. А администратор баз данных может начать думать о том, как они должны вписываться в общую архитектуру данных.

3. Ищите стратегического поставщика или партнера-консультанта

Опыт работы с графовыми базами данных вполне доступен.

Некоторые поставщики предлагают «стартовые» предложения, в рамках которых компании могут бесплатно попробовать продукт и инструменты для работы с ним и получить помощь от службы поддержки, пока они учатся работать с графовыми базами данных. Если у вас есть поставщик-партнер, который предлагает и помощь, и удобные инструменты для разработки графовых баз данных, этот вариант стоит рассмотреть.