Примерно 80% руководителей ИТ-служб признают, что никогда не видели в глаза своих счетов за электроэнергию, а предприятия тешат себя иллюзиями, что их системы хранения данных обладают неограниченными возможностями. Конечно, никто не в состоянии сдержать рост потребностей в информационных емкостях, однако существует возможность взять под контроль ресурсы хранения и соответствующие расходы — для этого надо не забывать пресловутый экологический принцип: “сокращать, использовать многократно, утилизировать”. ИТ-системы никогда не бывают экологичными сами по себе, их экологичность зависит от того, как они используются и что замещают.
Электронные архивы представляют собой область операционной деятельности, требующую особого внимания, если вы хотите добиться оптимальных результатов, ведь потребность в емкостях для хранения документов растет экспоненциально. Одним из ключевых средств оптимизации является технология однократного, или одноэкземплярного, хранения. Современные серверные системы позволяют применять для приложений с большим объемом выходных данных (High-Volume Transaction Output, HVTO) сохранение данных в одном экземпляре и тем самым существенно сокращать стоимость хранения электронных документов.
HVTO-приложения имеют дело с внутрикорпоративным контентом, включая отчеты об операциях, а также с данными, ориентированными на клиентов, вроде официальных отчетов, деклараций о корпоративной политике, счетов и обычной корреспонденции. Все эти документы, традиционно предназначавшиеся для распечатывания и отправки на исполнение, хранятся, как правило, в системах управления корпоративным контентом (ECM). Такие системы обеспечивают интерфейс как для внутреннего доступа, так и для онлайновой публикации. Стремясь сократить потребности в емкостях хранения, поставщики ECM-систем традиционно предлагали средства компрессии данных, но это оказывалось малоэффективным при работе с документами, изобилующими графическими элементами.
Система с однократным хранением по определению позволяет сохранять информационные объекты в одном экземпляре, обеспечивая при этом совместный доступ к объектам множеству пользователей. Фактически это средство для дедупликации (устранения дупликации) и повышения эффективности. Однократное хранение в сочетании с возможностью трансформации — прекрасный пример реализации принципа “сокращать, использовать многократно, утилизировать”. Трансформацией в данном случае мы называем процесс, выходные данные которого являются входными для другой системы, возможно, в измененной форме, например в формате для печати или презентации. Метод однократного хранения позволяет сократить общий объем хранимой информации, поскольку каждый объект имеется лишь в единственном экземпляре, а общие элементы данных, содержащиеся в больших документах, могут использоваться многократно. Высокоскоростные технологии извлечения данных в сочетании с преобразованием форматов “на лету” дают возможность повторного использования хранимого контента в самых разных целях.
Приложения с большим объемом выходных данных
Чтобы понять, как все это реализуется, рассмотрим типичный сценарий из мира HVTO. Объемные массивы документов производятся в виде пакетов, содержащих сотни тысяч, а иногда и миллионы единиц хранения. Обычно эти массивы порождаются корпоративными приложениями и центрами подготовки текстов на регулярной основе, т. е. ежедневно, еженедельно, ежемесячно или ежегодно. Структура у документов в массиве одинаковая, различия имеются лишь в конкретных данных о транзакциях (в именах, адресах, элементах строк, статистических параметрах и т. п.).
Оформительские элементы, в частности логотипы, графика, шрифты, формы и маркетинговые лозунги у всех документов в пакете идентичны. Одни и те же ресурсы присутствуют в каждом документе, и внутри ECM-системы они хранятся во множестве экземпляров. Совокупный объем таких повторяющихся ресурсов, предназначенных для оформления “внешних” документов, намного превосходит объемы индивидуальных, транзактных составляющих контента в тех же документах — иногда соотношение достигает 10:1.
Решения на основе принципа однократного хранения для HVTO используют интеллектуальный механизм, позволяющий отделить в массивном пакете документов общие ресурсы от контента, уникального для каждой транзакции. Внутри уникальных транзактных фрагментов расставляются указатели, обеспечивающие привязку к соответствующим местам повторяющихся оформительских элементов и за счет этого значительно сокращающие общий объем документа. Все процессы, необходимые для такого разделения, протекают во время загрузки ECM-системы.
Когда на вход ECM-системы поступает запрос на извлечение документа, оформительские и транзактные элементы объединяются в режиме реального времени, в результате документ воссоздается в точности в своем исходном виде. Экономия на объеме получается огромной, нередко потребность в емкостях уменьшается на 90% и более. Во многих случаях решение окупается уже за первые несколько месяцев.
Потенциальная экономия от решений с однократным хранением
Есть простой метод для оценки потенциальной экономии при использовании подобных решений. Он включает пересмотр производственных графиков и анализ образцов выходных документов. Это необходимо для определения общего ожидаемого сокращения потребности в емкостях и соответствующего уменьшения затрат.
Хороший пример быстрой окупаемости подобных инвестиций в систему однократного хранения — страховая компания, в которой ежедневно подготавливается порядка 2 млн. документов. Каждый документ в отдельности сравнительно невелик, средний объем составляет порядка 70 Кб, но ежедневная потребность в емкостях хранения достигает 140 Гб (2 млн. × 70 Кб). Ежемесячно пакет документов обрабатывается по 22 раза, и месячная потребность в емкости составляет 3080 Гб.
С учетом отраслевых стандартов и объемов исходящей от клиентов информации компания определила, что при полной загрузке ее затраты на хранение 1 Гб составляют 25 долл./мес. Суммарная стоимость хранения документов равнялась 77 000 долл./мес. (3080 Гб × $25/ Гб). После внедрения системы с однократным хранением ежедневная потребность в емкостях может сократиться на 83%, что дает экономию 63 910 долл./мес. или 766 929 долл./г.
Технология однократного хранения помогает организациям снижать затраты при хранении материалов как в обычном формате, предназначенном для вывода на печать, так и в занимающих гораздо больше места форматах вроде PDF или TIFF. Поскольку документы воссоздаются на лету при их извлечении, появляется возможность повторного использования контента, а также выбора формата для представления документа в удобном для клиента виде. Можно также извлекать из документов порции информации и создавать на их основе фрагменты для многократного использования (например, в формате CSV).
Когда-то мы полагали, что имеющиеся у нас запасы воды неисчерпаемы. Потом нам пришлось осознать, что это не так. Питать иллюзии относительно неограниченных дешевых хранилищ информации также было бы ошибкой. Истинная, вычисленная с учетом всех факторов стоимость хранения существенно превышает стоимость дисков. Она включает еще и операционные затраты, связанные с резервированием, площадями в дата-центрах и зарплатой сотрудников, поддерживающих инфраструктуру. Возможно, еще более важным соображением с точки зрения экологии является стоимость электроэнергии, необходимой для питания серверов и охлаждающего оборудования. Примерно 40% ИТ-бюджетов предприятий приходится на инфраструктуру хранения, а значит, сегодня как никогда актуальной становится проблема оптимизации соответствующих затрат с помощью принципа “сокращать, использовать многократно, утилизировать”. Она не только приведет к экономии денег, но и сделает ИТ-инфраструктуру более экологичной.