Восстановление RAID 10

Переход массива 10-го уровня в критический режим и отсутствие бэкапов чреваты в ряде случаев приводят к потере информации. При возникновении проблемы необходимо срочно обращаться в сервис. Специалистами ГК «Интегрус» накоплен большой опыт по диагностике и восстановлению RAID 10, позволяя оперативно решить проблему с минимальными временными затратами.

Восстановление RAID 10

Массиву 10-го уровня присущ высокий уровень отказоустойчивости, он сохраняет рабочие качества при неисправности как одного, так и половины дисков. Срочная помощь специалистов для восстановления RAID 10 может потребоваться, если неисправными оказались диски, составляющие зеркало.

Преимущества и недостатки RAID 10

RAID 10 является составной конфигурацией, использующей зеркалирование и чередование одновременно. Используется четыре и более винчестеров. Их количество всегда четное, т.к. данные записываются контроллером поблоково.

Диски объединяются попарно, образуя зеркала (R1). Каждая полученная пара объединяется в страйп (R0). Наличие избыточности делает некритичным даже неисправность половины дисков.

Фактически 10-й уровень — это пары массива RAID 1 внутри RAID 0. Комбинирование массивов двух уровней, ведет к тому, что RAID приобретает как слабости, так и достоинства обоих.

Плюсы:

  • высокая скорость работы (чтения, записи) сопоставима с RAID 0, т.к. потоки с различных дисков обрабатываются параллельно;
  • надежность, высокая отказоустойчивость при условии, что неисправны диски, принадлежащие к разным зеркалам;
  • массив реализуется на программном или аппаратном контроллерах;
  • минимальное время ожидания в сравнении с другими RAID.

Минусы:

  • нецелесообразность масштабирования – использование четного количества дисков;
  • стоимость дискового пространства увеличивается в два раза из-за необходимости зеркалирования, полезный объем снижается;
  • невозможность заменить сломанный винчестер – выход из строя одного носителя может пройти незамеченным, но повреждение еще одного из пары зеркал – фатально;
  • высокая нагрузка на протяжении длительного времени ведет к потере работоспособности других носителей, в результате чего массив может разрушиться;
  • восстановить RAID 10 при полной утрате работоспособности за счет использования стандартных режимов не получится;
  • сложность настройки в сравнении с простыми массивами.

Исходя из приведенных характеристик, целесообразность использования RAID 10 снижается. Есть смысл использовать его для «тяжелых» приложений, требовательных к высокой производительности машины.

Причины потери информации с RAID 10

Ни одна конфигурация RAID не способна обеспечить абсолютную защиту от утраты данных. Для RAID 10 критическая ситуация возникает при логических или физических неисправностях. Самыми частыми причинами потери данных выступают внешние воздействия, такие как:

  • отказ сервера;
  • перегрев материнской платы;
  • неисправность в работе операционной системы (критична для программных контроллеров);
  • скачки напряжения;
  • неисправность (поломка, некорректная замена) контроллера;
  • программный сбой RAID-контроллера;
  • рассинхронизация массива и выход из строя дисков, составляющих одно зеркало;
  • аппаратный сбой работы более половины дисков;
  • вредоносное воздействие вирусов;
  • человеческий фактор — случайное удаление или повреждение файлов, вмешательство в таблицу разделов, некорректное форматирование, повторная инициализация;
  • отсутствие регулярного мониторинга состояния массива.

Как восстановить данные с RAID 10: этапы

Восстановление данных с RAID 10 допускается за счет средств обычного контроллера (или имеющего функцию Host), хотя операция с высокой долей вероятности оказывается некорректной. Чаще всего требуется применение специальных аппаратных и программных решений.

Пытаться своими силами справиться с проблемой, даже если на одном диске массива зафиксированы аппаратные проблемы, нежелательно. Хаотичные эксперименты по восстановлению работоспособности оборудования ведут к фатальным последствиям, усугубляют неисправность, в результате чего данные утрачиваются безвозвратно.

Наличие бэкапа является страховкой, если повреждения RAID 10 окажутся критичными.

Категорически нельзя для проблемного RAID 10:

  • допускать запись на исходные диски;
  • модифицировать содержимое (форматировать, инициализировать, создавать/удалять разделы, выполнять проверки при помощи утилит и т.п.).

Для выбора оптимального алгоритма для восстановления данных RAID 10 выполняется детальная диагностика.  Важно понимать, что послужило причиной неисправности: массив развалился или перешел в режимы Degraded/Falled, пропали разделы/тома, был сделан некорректный Rebuild, возникла ошибка после пересборки, перегорел контроллер. Специалисты способны восстановить данные RAID 10 даже при критических ошибках RAID-контроллера, а также появлении синего экрана смерти.

Обобщенно требуется:

  • Создать посекторную копию каждого диска, входящего в массив. При копировании может выясниться, что требуются дополнительные работы. Например, при серьезных повреждениях поверхности дисков иногда целесообразней выгрузку выполнять в режиме клона, а не копирования.
  • Определить очередность носителей.
  • Уточнить размер RAID-блока.
  • Проверить наличие смешений и разрывов в процессе записи блоков, а также зон, содержащих служебные данные.
  • Выполнить сборку виртуального массива.
  • Устранить при необходимости логические проблемы.
  • Перенести пользовательскую информацию на исправный диск.

При тестировании проверяется работоспособность дисков, аппаратные проблемы. С дисков, пригодных к логическому анализу, снимаются образы. Носители разбиваются на пары, с анализом их синхронизированности.

В ситуациях, когда оба диска из блока содержат поврежденные сектора, пытаются недостающую область для одного диска вычесть из другого. После попыток спасти массив подручными средствами без обращения к специалистам даже частичное восстановление информации уже считается успешным.

Как правило, профессионалы используют программное и аппаратное восстановление RAID 10. Работа с носителями ведется в режиме чтения, используются различные программные средства для корректной сборки виртуального массива.

Аппаратное восстановление требует значительного объема практических знаний. Массив создается с нуля на новом контроллере с идентичной конфигурацией и отсутствием функции инициализации. Использования ребилда запрещено.

Если для создания массива 10-го уровня использовался аппаратный RAID-контроллер Adaptec, можно перебросить его с соблюдением последовательности дисков на другую платформу. Как правило, работоспособность массива восстанавливается на новом сервере без проблем. Если такой возможности нет, можно программно собрать массив через RAID Reconstructor.

Восстановление серверов с носителями, объединенными в RAID 10 с использованием утилиты Intel Rapid Storage Technology, при наличии бэкапа позволяет просто заменить диск. Утилита подтягивает его в массив самостоятельно.

Наличие утилит существенно упрощает работы по восстановлению. Большинство утилит имеет автоматический режим, упрощающий работу. Если массив восстановлен частично, дополнительно используются средства программного восстановления.

Чаще всего применяется профессиональные программные средства восстановления утерянной информации для RAID – R-Studio, WinHex или RS RAID Retrive, поддерживающее все файловые системы. На RAID-конструкторе RS RAID Retrive:

  • выбирается тип добавления массива, подлежащего сканированию (автоматический, по производителю, ручной);
  • выбираются диски, входящие в RAID 10, определяется конфигурация массива;
  • собранный массив отображается как простой накопитель, работать с которым можно при помощи Мастера восстановления файлов;
  • выполняется сканирование (быстрое или полный анализ), в результате которого восстанавливается прежняя структура папок и файлов;
  • восстановленные файлы сохраняются в указанном месте;
  • заново создается массив, файлы копируются в него.

Для восстановления RAID 10 Linux используется утилита mdadm. Для пересборки RAID 10 используется команда поиска необходимой конфигурации с указанием перечня дисков, входящих в массив. Также при помощи утилиты можно легко заменить диск или использовать запасной диск для горячей замены.

Программные массивы 10-го уровня реализуются довольно часто на базе Windows 10, что несколько удешевляет его стоимость, но снижает производительность и отказоустойчивость. ПР RS RAID Retrive помогает справиться с проблемой и восстановить данные по описанному выше алгоритму.

Восстановление данных с Raid 10 выполняется программными и аппаратными методами только после диагностики. При оперативном обращении к специалистам массив пересобирается без потери данных.

Присоединяйтесь к нам,
чтобы получать чек-листы, реальные кейсы, а также
обзоры сервисов раз в 2 недели.