Американская компания Algolia, поставщик технологий поиска для разработчиков веб-сайтов и мобильных приложений, обнаружила, что в SSD-накопителях Samsung есть проблема, которая может привести к потере данных при выполнении асинхронных операций Queued TRIM. В частности, кроме очистки помеченных операционной системой удалённых данных, накопитель может очистить и часть актуальной информации. Удаление обнаруживается при возвращении пустой области вместо ранее сохранённых данных. Проблема затрагивает только операционные системы GNU/Linux, так как Windows по умолчанию QTRIM не использует.
По словам представителей компании, они обнаружили проблему в работе кластеров Linux-систем после того, как в дата-центре компании стал срабатывать механизм защиты от потери данных, и некоторые файловые разделы ext4 на дисковых подсистемах переключались в режим только чтения из-за повреждения. Как сообщает Algolia, сначала системные администраторы предполагали в работе Linux-систем случайные сбои, однако через некоторое время после восстановления данных сбои происходили повторно.
Более детальное изучение системных журналов выявило, что сбои не являются ни случайными, ни следствием аппаратной неисправности, ни ошибок в самой ОС и приложений — просто таким образом SSD-накопители Samsung реагировали на получение асинхронной команды TRIM: происходила не только очистка ячеек фл’ш-памяти с неактуальным содержимым, но и удаление последних 512 байт некоторых файлов. Вскоре проблема приобрела критический масштаб, сообщила Algolia. Значительная часть последующих двух недель была потрачена на изолирование и восстановление серверов, на которых происходили сбои.
Бракованными оказались следующие модели накопителей — Samsung SM843TN, PM853T, модели серии Samsung SSD 840 Pro и модель серии Samsung SSD 850 Pro емкостью 512 Гб.
Samsung была уведомлена о наличии проблемы. Она помогала Algolia выяснить причину потери данных.