Главная Технология Почему RAID6 ?

Почему RAID6 ?

Принципиальное отличие технологий создания дисковых массивов - RAID5 и RAID6 - заключается в том, что в первой для восстановления данных используются одна контрольная сумма, а во второй - две.

Это позволяет в массиве RAID6 восстановить данные после выхода из строя 2 жестких дисков. Но, с другой стороны, и доступное дисковое пространство уменьшается на два диска. Насколько оправдана такая надежность с точки зрения экономии дискового пространства?

По данным производителей жестких дисков, вероятность возникновения невосстановимой ошибки (UER) чтения оценивается как 1 блок (512Б) на 1014 бит данных (для дисков SATA), то есть на 12 ТБ данных допустимо возникновение одного невосстановимого блока данных. Таким образом, при реконструкции диска в массиве RAID5 объемом более 12ТБ возникает высокая вероятность появления второй ошибки чтения и потери полосы данных (stripe), что в свою очередь приведет к прерыванию реконструкции массива и полной потере данных. в этой связи, не рекомендуется создавать массивы RAID5 более 12ТБ. В технологии RAID6 благодаря вычислению сразу двух контрольных сумм такого ограничения на размер массива нет.

Также стоит отметить, что порча блоков на диске происходит в результате износа, который происходит равномерно на всех дисках массива, ввиду практически одинаковой нагрузки на диски в массиве. В результате одновременное появление двух ошибок не такая уж маловероятная вещь.

Альтернативной технологией, уменьшающей вероятность потери данных, является RAID5E, в которой резервный диск (spare drive) встраивается в массив.  При этом на всех дисках массива организуется свободной 1/N часть пространства, которая при отказе одного из дисков используется в качестве горячего резерва.

Развитием RAID5 с целью уменьшения вероятности потери данных является технология RAID5E, в которой кроме контрольной суммы на всех дисках резервируется место, использующееся при отказе одного из дисков в качестве горячего резерва (hot-spare).

По сравнению с RAID5, в которой резервный диск (если предусмотрено его использование) простаивает, технология RAID5E отличается немного лучшей производительностью, но вероятность потери данных во время реконструкции массива, которая в среднем занимает около 24 часов - остается той же.

Тем не менее, многие производители отдают предпочтение RAID5E (или его аналогу RAID5EE, часто выдаваемому за RAID6) только потому, что эти технологии требуют меньше вычислительных мощностей и поэтому позволяют получить более высокие показатели скорости. С точки зрения экономичности хранения данных, у RAID5E нет преимуществ перед RAID6.

Другой распространенный вариант - разбиение больших массивов на несколько отдельных RAID5 с последующим объединением - RAID50. Его никак нельзя назвать более экономичным по сравнению с RAID6. К тому же дополнительная логика, необходимая для объединения массивов, усложняет администрирование и снижает надежность системы.

Алгоритм расчета контрольных сумм RAID6, реализованный в ПО RAIDIX уникален тем, что позволяет получить очень высокие показатели производительности с минимальной нагрузкой на процессор.

По сути, производительность СХД больше не зависит от производительности RAID-контроллера  и определяется только скоростью установленных дисков и пропускной способностью канала передачи данных. Таким образом, технология RAID6 в продуктах RAIDIX стала оптимальной с точки зрения сочетания факторов надежности, скорости и стоимости хранения данных.

Разработанный алгоритм RAID6 позволил реализовать в ПО RAIDIX механизм  Advanced Reconstruction, значительно повышающий скорость чтения данных за счет автоматического исключения из процесса двух самых медленных дисков.

Высокая скорость RAID6 в решениях RAIDIX обеспечивает значительно меньшее время реконструкции массива (около 3 часов), при этом производительность СХД во время реконструкции практически не уменьшается и не приводит к задержкам в производственных процессах.

Альтернативные технологииRAID6 (AVRORAID)
  • Высокая скорость RAID5 по сравнению с RAID6
  • Максимально возможная производительность для установленных дисков и канала передачи данных
  • RAID5 является более экономичным с точки зрения дискового пространства
  • Экономичное решение для массивов более 12 ТБ
  • Высокая вероятность потери данных в массивах RAID5 и RAID5E более 12ТБ
  • Надежность не снижается с увеличением размера массива
  • Снижение производительности системы при реконструкции массивов RAID5 и RAID5E (около 24 часов)
  • Быстрая реконструкция массива (около 3 часов)

Резюмируя, можно сказать, что разработанная технология RAID6 предоставляет продукту RAIDIX следующие преимущества:

  • Самая высокая производительность в своем классе, определяемая только возможностью установленных дисков;
  • Минимальная стоимость хранения данных для массивов более 12 ТБ;
  • Быстрая реконструкция массива (около 3 часов);
  • Минимальное снижение производительности системы при реконструкции;
  • Сохранение производительности массива при замедлении работы отдельных дисков.