Системы хранения данных перемещаются из центров обработки данных на периферию (edge). Опрошенные порталом ComputerWeekly эксперты обсуждают особенности периферийного хранилища, рассматривают характеристики периферийных вычислений, которые его формируют, и технологии, которые для него требуются.
Крупные монолитные централизованные ЦОДы могут уступить место сотням или тысячам небольших хранилищ данных и устройств, каждое из которых имеет собственную емкость хранения.
Движущей силой этого является перенос организациями своих процессов на «периферию» бизнеса. Edge computing — это уже не просто размещение локального хранилища в удаленном или филиальном офисе (RoBo). Периферийные вычисления скорее обусловлены развитием Интернета вещей (IoT), «умных» устройств и датчиков, а также таких технологий, как автономные автомобили. Все эти технологии все больше нуждаются в собственном локальном периферийном хранилище.
Аналитики Gartner подтверждают, что бизнес-данные перемещаются из дата-центров в облако и на периферию. Компания выделяет четыре варианта использования edge-хранилищ: распределенные облака и дата-центры, обработка данных на периферии, совместная работа с контентом и доступ к нему, а также ввод и потоковая передача цифровых данных.
Этот список не является исчерпывающим — такие приложения, как автономные транспортные средства, которые находятся за пределами корпоративных ИТ, также являются движущей силой периферийных вычислений. Кроме того, промышленные процессы, датчики и IoT — все это движущие силы, которые толкают к переносу все больше вычислений на периферию.
Рынок периферийных систем хранения данных формируется под влиянием изменений в технологии хранения и приложений для периферийных вычислений. Edge-устройствам все чаще требуется надежное и безопасное постоянное хранилище, а приложениям — производительность, выходящая за рамки возможностей карт SD или micro-SD, которые используются в устройствах IoT и одноплатных компьютерах первых поколений.
Где находится периферия?
Несколько лет назад периферийные вычисления наиболее тесно ассоциировались с развертыванием RoBo. В плане хранения данных здесь предполагалось обеспечение хотя бы некоторого уровня резервного копирования или репликации для защиты данных, особенно в случае отказа устройства, а также кэширование или хранение данных перед отправкой их в дата-центр для дальнейшей обработки. Такой пакетный подход достаточно хорошо подходит для розничной торговли и других сред с достаточно предсказуемыми потоками данных.
Но добавление хранилища в виде сетевого ПК, небольшого сервера или устройства NAS действительно хорошо работает только в офисных или бэк-офисных средах, поскольку они статичны, экологически стабильны и обычно достаточно безопасны.
Сегодняшние границы бизнеса гораздо шире и охватывают гораздо более неблагоприятные операционные среды. Они варьируются от заводского цеха, где периферийные устройства подключены к производственному и силовому оборудованию, до камер и других датчиков вне помещений, телекоммуникационных комплектов и даже автомобилей.
Энрико Синьоретти, аналитик GigaOM, называет эти среды промышленной периферией, удаленной периферией или дальней периферией. Система хранения данных здесь должна быть надежной, простой в управлении и — учитывая количество устройств, которые могут развернуть компании, — экономически эффективным решением.
Характеристики периферийной системы хранения данных
Периферийные приложения требуют, чтобы система хранения данных была физически прочной, защищенной физически и виртуально — часто зашифрованной — и выдерживала перепады температуры и вибрации. Она должна быть устойчивой, но потреблять мало энергии. В некоторых случаях она также должна быть быстрой, особенно если компании хотят применять на периферии искусственный интеллект.
Алекс Макдональд, председатель Ассоциации производителей сетевых систем хранения данных (SNIA) в EMEA, говорит, что к периферийным относятся «технологии хранения и памяти, которые обеспечивают размещение генерируемых на периферии данных, включая твердотельные накопители, SSD-массивы, встроенную память DRAM, флэш-память и постоянную память».
В некоторых случаях edge-СХД и вычислительные системы должны быть адаптированы для работы в гораздо более широком диапазоне сред, чем обычные ИТ-среды. Это требует физической прочности и мер безопасности. Например, одноплатные компьютеры часто используют съемные карты памяти. Хотя шифрование защищает от потери данных, оно не может предотвратить физическое извлечение модуля памяти.
«Среды, требующие дополнительных мер защиты во встроенных приложениях, от автомобильной до производственной сферы, требуют устройств с повышенной прочностью и улучшенными техническими характеристиками», — говорит Макдональд.
Организации, работающие с периферийными вычислениями, также рассматривают память класса SCM (Storage Class Memory), NVMe-over-fabrics и гиперконвергентную инфраструктуру (HCI).
HCI с ее встроенной системой хранения, возможно, лучше всего подходит для приложений, которые могут потребовать расширения в будущем. ИТ-команды могут относительно легко добавлять узлы HCI — даже в удаленных местах — без существенных накладных расходов на управление.
Но по большей части требования к емкости хранения данных для периферийных вычислений относительно невелики. Основное внимание уделяется не хранению нескольких терабайт, а системам, способным обрабатывать чувствительные ко времени, «скоропортящиеся» данные, которые затем анализируются на месте и передаются в центральную систему — обычно в облако — или имеет место комбинация того и другого.
Это требует от систем способности выполнять немедленные действия с данными, например, выполнять аналитику, прежде чем передавать их в центральное хранилище или процесс. Такая сортировка данных должна быть оперативной и, в идеале, происходить рядом с вычислительными ресурсами. Это, в свою очередь, вызвало интерес к NVMe-over-fibre channel и SCM.
И, разместив в устройстве локальную память, разработчики систем могут минимизировать одну из самых больших проблем периферийных вычислений — требования к пропускной способности.
Проблема данных в периферийных вычислениях
Организации, которые хотят добавить хранилище в свои периферийные системы, делают это, по крайней мере частично, чтобы снизить нагрузку на свои сети и централизованные дата-центры или уменьшить задержки при обработке данных.
У некоторых компаний сейчас так много периферийных устройств, что они рискуют перегрузить локальные сети. Хотя идея децентрализованных вычислений, подключенных к облаку, привлекательна, на практике сетевые задержки, возможность сетевых сбоев и даже стоимость облачного хранения данных побудили производителей устройств включить в них, по крайней мере, поддержку локального хранения данных.
Растущее число производителей также выпускает edge-аплаенсы, которые работают рядом с устройствами IoT (или, точнее, позади них) для сбора данных с них. Некоторые из них являются устройствами передачи данных, как, например, Edge Appliance от Google, а некоторые берут на себя часть ИИ-обработки, освобождая от нее сеть.
Благодаря этому системные архитекторы могут обеспечить более надежную форму периферийных вычислений. Рядом с датчиком или устройством обрабатывается больше данных, решения могут приниматься быстрее с помощью аналитики или ИИ, а объем данных, отправляемых в корпоративную локальную сеть или облачную службу, может быть значительно сокращен.
Добавление на периферии хранилища, напрямую или с помощью аплаенсов, также позволяет осуществлять репликацию или пакетное архивирование и облегчает работу с прерывистыми или ненадежными соединениями, особенно для мобильных приложений. Джимми Там, генеральный директор Peer Software, говорит, что некоторые производители интегрируют жесткие диски в сочетании с твердотельными накопителями, чтобы позволить устройствам хранить бóльшие объемы данных по более низкой цене.
«В случае, когда периферийное хранилище в основном ориентировано на использование в качестве платформы для сбора данных, которая затем реплицирует или передает данные в облако, большая часть хранилища может быть оснащена HDD вместо SSD, чтобы обеспечить бóльшую плотность данных», — говорит он.
Новые технологии хранения данных для периферии
Маловероятно, что какая-то одна технология хранения данных будет доминировать на периферии. «Хотя решения для хранения на периферии обладают общими фундаментальными принципами, это не единая технология, поскольку она должна быть адаптирована к конкретным сценариям применения», — отмечает Gartner. Тем не менее, аналитики ожидают, что все больше технологий хранения данных будут «edge ready», включая технологии для дата-центров, которые лучше отвечают требованиям периферии.
Поставщики IoT и других периферийных устройств будут работать над повышением производительности хранения данных, особенно за счет перехода на системы хранения класса серверов и рабочих станций, такие как Flash, NVMe и NVMe-over-fabrics, а также SCM, а не полагаться на технологии на базе USB, такие как SD или micro-SD.
Однако в центре внимания, похоже, будет вопрос управления все большим количеством устройств, оснащенных системами хранения. Новые разработки, такие как 5G, только расширят сферу применения периферийных вычислений, поэтому компании будут искать хранилища, которые будут не только прочными, но и самовосстанавливающимися, и, по крайней мере, при нормальной работе, в значительной степени самоуправляемыми.