Этот термин был введен в оборот в начале 2014 г. аналитической фирмой Gartner для описания нового поколения платформ данных in-memory (хранящих операционные данные непосредственно в оперативной памяти), которые способны осуществлять онлайновую обработку транзакций (OLTP) и онлайновую аналитическую обработку (OLAP) в реальном времени, не требуя дублирования данных.
Как считают отраслевые аналитики, гибридная транзакционно-аналитическая обработка (Hybrid Transaction / Analytical Processing, HTAP) является будущим бизнес-приложений.
В последние десятилетия считалось наилучшей практикой содержать отдельно операционные и аналитические системы, чтобы аналитические рабочие нагрузки не нарушали операционные процессы. Чтобы обеспечить адекватное быстродействие для аналитических запросов, данные обычно копировались из одной или многих операционных систем в витрину данных (data mart) или в хранилище данных (data warehouse).
Этот подход был поставлен под вопрос в 2009 г. с публикацией экспертной статьи Хассо Платтнера, озаглавленной A Common Database Approach for OLTP and OLAP Using an In-Memory Column Database. В ней доказывалось, что успехи технологии in-memory создают предпосылки для нового подхода к эксплуатации стандартных бизнес-приложений, при котором данные могут храниться в единственном экземпляре без ущерба для транзакций или аналитической обработки.
Сегодня HTAP-системы уже коммерчески доступны, и их поставляют как крупные вендоры, например SAP с ее платформой HANA, так и не очень большие стартапы, в частности VoltDB, NuoDB, Clustrix и MemSQL.
В Gartner считают, что HTAP-системы могут устранить четыре главных недостатка традиционного подхода.
Во-первых, при аналитической обработке в HTAP данные не нужно переносить из операционных баз данных в хранилища данных. Во-вторых, данные транзакций доступны для аналитики прямо с момента своего создания. В третьих, детализация данных (drill-down) из аналитических агрегатов верхнего уровня всегда ведет к свежим данным HTAP-приложений. И наконец, вы устраняете или по меньшей мере уменьшаете потребность в размножении копий одних и тех же данных.
Gartner подчеркивает, что базы данных in-memory существенно отличаются по подходу к их реализации от обычных баз данных на флэш-дисках или кэширования в оперативной памяти. Возможно поэтому не смотря на то, что большинство крупных производителей СУБД сегодня предлагают опции обработки in-memory, эта технология обычно применяется только для аналитики и требует копирования данных. А это, в свою очередь, означает наличие задержки между моментом, когда новая транзакция записывается в базу данных, и моментом, когда обновленная информация становится доступной для анализа, т. е. это не настоящие HTAP-системы.
Хотя ряд отраслевых аналитиков продолжает рассматривать системы in-memory как «предмет роскоши», оправданный лишь в ситуациях, требующих обработки в реальном времени, в Gartner убеждены, что HTAP-подходы более экономичны, так как повышенные затраты на оборудование с лихвой компенсируются снижением затрат на операции и существенно повышенной гибкостью. Этот взгляд, похоже, подтверждается ростом числа организаций, объявляющих о переводе своих бизнес-приложений в HTAP-системы.
На основе всесторонних исследований Gartner пришла к выводу, что революционный отраслевой эффект HTAP-технологии будет возрастать. Гибридная транзакционно-аналитическая обработка будет побуждать ведущих поставщиков приложений к инновациям, обеспечивающим более компетентное восприятие ситуации и повышение маневренности бизнеса. Переход на использование вычислительных технологий in-memory повлечет за собой крупные перестройки в устоявшихся архитектурах, технологиях и профессиональных навыках.
Многие архитектурные подходы в области больших данных, например, Data Lakes, еще продолжают разделять транзакционную и аналитическую обработку. С ростом числа HTAP-приложений станет ясно, что такие подходы являются лишь частью общей стратегии информационной архитектуры.