Специалисты ГК «Интегрус» специализируются на диагностике и восстановлении данных с RAID массива любого уровня, обладая опытом работы с механическими и логическими повреждениями, спасая информацию даже в самых безнадежных случаях.
Информация – безусловная ценность, поэтому ее сохранность обеспечивается всеми доступными способами, в том числе с использованием систем хранения критически важных данных. RAID-массивы представляют собой технологию, объединяющую два или более накопителей в единую логическую систему для повышения производительности и отказоустойчивости.
Использование RAID массивов доказало свою эффективность, в результате чего они создаются на всех доступных хранилищах данных (NAS, серверах). При любой конфигурации массива он собирается из полностью идентичных носителей, соединенных контроллером.
Для бюджетных моделей чаще всего выбирается самый простой алгоритм работы, что снижает уровень безопасности и требует более частого ремонта. Использование продвинутых моделей увеличивает надежность, но не является панацеей.
Основные причины неисправности RAID
Нельзя гарантировать 100% работоспособности даже самой надежной техники. Благодаря установке различных защит, повреждение массивов происходит нечасто. В тех случаях, когда массив получил повреждение, необходимо выбрать правильную тактику поведения, чтобы восстановить RAID без потери данных.
В RAID массивах данные хранятся на стандартных дисках, таких же, как и в обычных ПК. Благодаря используемой технологии и оперативной передаче неисправных носителей в специализированную лабораторию, потеря данных случается крайне редко.
Восстановление RAID массивов остается длительным процессом, там как скорость работы заметно снижается, и может потребовать отключения питания для замены поврежденного носителя. Для серверов такое развитие событий нежелательно. Именно поэтому нужно знать причины неисправностей, чтобы избежать проблем в будущем.
Проблемы c RAID контроллером
Контроллер распределяет данные и создает из отдельных дисков единый массив. Программные контроллеры более дешевые, чаще выходят из строя. Аппаратные – надежны, но дороги, и к тому же они несовместимы с аналогичными моделями других компаний.
Для восстановления RAID дисков потребуется приобрести модель той же фирмы, какая была установлена ранее. Если этого не сделать массив придется восстанавливать заново, потеряв информацию.
Выйти из строя контроллер может из-за бросков или резкого отключения напряжения. Наличие бесперебойного источника питания помогает решить проблему, но не снимает ее до конца.
Ошибка сборки/пересборки
Каждая перезагрузка вынуждает массив пересобираться заново. Любой форс-мажор в процессе пересборки приводит к разрушению RAID. Если коробки RAID-контроллера или NAS сбоят, диск выпадает из массива, теряется конфигурация. Попытка пересоздания рейда усугубляет проблему.
Неисправность диска
Массивы защищены в случае поломки одного накопителя, но выход из строя нескольких дисков приводит к потере работоспособности и данных. Регулярная профилактика состояния винчестеров снижает риск разрушения RAID.
Проблемы логики
Чередование данных между накопителями в пределах логического тома обеспечивает нормальное функционирование массива. При удалении данных, некорректном форматировании повреждается файловая система, а массив не может собраться из-за невозможности определить диски.
Сбой сервера
Неисправность или сбой сервера в большинстве случаев приводит к необходимости восстанавливать RAID с использованием стороннего программного обеспечения.
В число других причин, влекущих необходимость восстановления RAID, входят ошибки пользователя и невнимательность системных администраторов, вредоносное ПО, использование некачественного оборудования, неполадки со SMART, внешнее воздействие, неудачный запуск утилит.
Большинство массивов умеют обнаруживать неисправность HDD, а цепная реакция, когда из-за выхода из строя одного диска вылетают другие, маловероятна (такое развитие событий опасно только для RAID 0, не имеющего избыточности). Чаще всего повреждение касается логики или программной части массива.
Как восстановить RAID массив
На процесс восстановления влияют:
- количество HDD;
- причина неисправности;
- файловая система ОС;
- уровень RAID;
- тип контроллера.
Чаще всего используют три вида массивов: RAID 1, RAID 10, RAID 5, хотя неисправность вероятна и на уровнях 2, 3, 4, 6, 0, а также их комбинациях 01, 10, 50, 05, 60, 06.
Программное восстановление
Чаще всего для восстановления данных RAID используются программные способы. Несмотря на то, что его часто рекомендуют для начинающих сисадминов, он сложен и трудоемок.
Общий алгоритм действий выглядит следующим образом:
- оценивается состояние дисков и подбираются допустимые операции;
- пригодные для анализа диски в режиме чтения подключаются в систему;
- выясняются точные параметры массива – от порядка дисков до узора контрольных сумм (чем опытнее специалист, тем больше он видит данных для анализа);
- с некорректно работающих дисков снимаются посекторные образы;
- определяются неактуальные диски, отсутствие которых не сразу повлияло на массив;
- имитируется при помощи ПО корректная работа RAID;
- создается рабочий образ с виртуального массива.
Утилита raid data (или аналогичное приложение Recovery Diskinternals) для решения простых задач, например, восстановления RAID информации с внешнего накопителя.
- подсоединить диски к ПК;
- подключить их в нужной последовательности (не более пяти);
- подключить резервный носитель, выбранный в качестве хранилища;
- запустить ОС;
- определить настройки при помощи RAID Reconstructor;
- запустить лицензионное приложение R-Studio;
- добавить участников RAID, выполнить настройки;
- при верной установке параметров появятся разделы, готовые к восстановлению.
Восстановление RAID через mdadm для ОС Linux. Утилита управляет программными массивами:
- определить наличие повреждений и диск под замену # cat /proc/mdstat (проблему листинг команды определяет как [U_];
- запросить подробную информацию о массиве # mdadm -D /dev/md0 (статус clean, degraded означает повреждение RAID);
- убрать неисправный диск # mdadm /dev/md0 –remove /dev/vdc и добавить новый # mdadm /dev/md0 –add /dev/vdd;
- восстановление запускается автоматически после замены # mdadm -D /dev/md0.
В некоторых случаях в массив при помощи утилиты можно добавить запасной диск для «горячей замены».
После некорректного отключения или перезагрузки, когда система перестает видеть массив, но определяет входящие в него диски, при помощи mdadm пересоздается RAID. Для этого потребуется:
- восстановить связь дисков;
- просканировать их;
- вписать вывод в конфигурационный файл рейда;
- смонтировать файловые системы, обозначенные в fstab;
- проверить правильность примонтированных дисков.
Несмотря на надежность NAS хранилищ, может возникнуть необходимость восстановления RAID на QNAP. В результате случайного удаления данных, сбоя системы или неисправности аппаратной части устройства критически важная информация теряется. Для ее восстановления при корректной работе хранилища файлы восстанавливаются из сетевой корзины, если такая возможность настроена заранее.
В тех случаях, когда QNAP не включается и извлечь информацию простым путем не получается, надо заменять устройство. Выполнение процедуры не гарантирует сохранности данных после настройки нового сервера, хотя шансы спасти информацию достаточно велики.
Для восстановления RAID на QNAP при выходе из строя контроллера или аппаратной части устройства, а также полоски несколько накопителей можно использовать Hetman RAID Recovery. Потребуется винчестер с объемом не меньше объема данных, хранящихся в массиве, и последовательное выполнение ряда действий:
- подключить диски с ПК с ОС Windows (при отсутствии достаточного количества портов использовать расширители или разветвители);
- запустить программу, которая просканирует диски и соберет массив;
- запустить быстрый анализ дисков (если нужные для восстановления RAID файлы не обнаружены потребуется полный анализ);
- выбрать в каталоге Multimedia файлы, подлежащие восстановлению, и путь сохранения.
Восстановить RAID на контроллере материнской платы Intel, когда требуется заменить неисправный диск, можно через Intel Rapid Storage Technology. В меню будут отображаться с серийными номерами все накопители, в том числе и нерабочий.
- Выключить ПК, отключить дефектный диск.
- Переподключить новый диск, перезапустить ПК.
- Intel RST предложит исправить массив, добавив вновь подключенный диск для восстановления.
Если выяснится, что диск из массива исключен неверно, массив получит повреждения. Для восстановления данных потребуется запустить утилиту Hetman RAID Recovery. Программное обеспечение работает для массивов всех уровней, вычитая параметры RAID и информацию о материнке, на основе которой создан.
Разработчики упрощают решение типовых проблем, но не во всех случаях программное восстановление способно помочь.
Аппаратное восстановление
Этот способ восстановления данных с жесткого диска RAID требует опыта работы с «черным ящиком», так как малейшая ошибка приводит к фатальным последствиям. В этом случае массив воссоздается «на железе», с восполнением недостающих участков за счет образов и использованием ПО для исправления разрушения логической структуры. Любые упрощения алгоритма приводят к полной потере данных.
- Уточняются параметры RAID массива – порядок винчестеров, размеры блоков, рабочие алгоритмы, узоры контрольных сумм. Исключается все ненужное, пересчитывается недостающее.
- Делаются посекторные копии для всех дисков массива.
- Массив заново создается на другом, абсолютно идентичном контроллере. Если использовать ребилд, есть все шансы потерять данные безвозвратно.
- При выборе контроллера учитывается тот факт, что некоторые модели автоматически запускают инициализацию. Это критично для данных.
- Все носители должны быть исправны – только в этом случае процесс будет успешно завершен, а данные – спасены.
- При частичном восстановлении данных применяют программные средства.
Что делать, чтобы восстановление RAID прошло успешно
Гарантированно избежать потери данных можно, регулярно создавая резервные копии. Если критически важные файлы не были сохранены заранее, не стоит заниматься самостоятельными попытками спасти информацию. Самостоятельные попытки спасения массива снижают шансы на восстановление данных с RAID.
Категорически нельзя:
- запускать утилиту chkdsk при механической неисправности диска;
- применять программы восстановления данных без предварительной диагностики проблемы;
- пересоздавать новый RAID на старых дисках;
- выполнять пересборку при разрушении файловой системы;
- вести запуск на носители после обнаружения проблемы;
- запускать автоматическую инициализацию.
Квалифицированные инженеры, обладающие опытом и знаниями по восстановлению массивов, разрабатывают индивидуальную стратегию в каждом конкретном случае. Даже при типовом повреждении требуется применение различных методик, чтобы восстановить RAID без потери данных в кратчайший срок.