-
AVRORA 2.0
Отказоустойчивый кластер с рекордной производительностью
Почему RAID6 ?
Принципиальное отличие технологий создания дисковых массивов - RAID5 и RAID6 - заключается в том, что в первой для восстановления данных используются одна контрольная сумма, а во второй - две.
Это позволяет в массиве RAID6 восстановить данные после выхода из строя 2 жестких дисков. Но, с другой стороны, и доступное дисковое пространство уменьшается на два диска. Насколько оправдана такая надежность с точки зрения экономии дискового пространства?
По данным производителей жестких дисков, вероятность возникновения невосстановимой ошибки (UER) чтения оценивается как 1 блок (512Б) на 1014 бит данных (для дисков SATA), то есть на 12 ТБ данных допустимо возникновение одного невосстановимого блока данных. Таким образом, при реконструкции диска в массиве RAID5 объемом более 12ТБ возникает высокая вероятность появления второй ошибки чтения и потери полосы данных (stripe), что в свою очередь приведет к прерыванию реконструкции массива и полной потере данных. в этой связи, не рекомендуется создавать массивы RAID5 более 12ТБ. В технологии RAID6 благодаря вычислению сразу двух контрольных сумм такого ограничения на размер массива нет.
Также стоит отметить, что порча блоков на диске происходит в результате износа, который происходит равномерно на всех дисках массива, ввиду практически одинаковой нагрузки на диски в массиве. В результате одновременное появление двух ошибок не такая уж маловероятная вещь.
Альтернативной технологией, уменьшающей вероятность потери данных, является RAID5E, в которой резервный диск (spare drive) встраивается в массив. При этом на всех дисках массива организуется свободной 1/N часть пространства, которая при отказе одного из дисков используется в качестве горячего резерва.
Развитием RAID5 с целью уменьшения вероятности потери данных является технология RAID5E, в которой кроме контрольной суммы на всех дисках резервируется место, использующееся при отказе одного из дисков в качестве горячего резерва (hot-spare).
По сравнению с RAID5, в которой резервный диск (если предусмотрено его использование) простаивает, технология RAID5E отличается немного лучшей производительностью, но вероятность потери данных во время реконструкции массива, которая в среднем занимает около 24 часов - остается той же.
Тем не менее, многие производители отдают предпочтение RAID5E (или его аналогу RAID5EE, часто выдаваемому за RAID6) только потому, что эти технологии требуют меньше вычислительных мощностей и поэтому позволяют получить более высокие показатели скорости. С точки зрения экономичности хранения данных, у RAID5E нет преимуществ перед RAID6.
Другой распространенный вариант - разбиение больших массивов на несколько отдельных RAID5 с последующим объединением - RAID50. Его никак нельзя назвать более экономичным по сравнению с RAID6. К тому же дополнительная логика, необходимая для объединения массивов, усложняет администрирование и снижает надежность системы.
Алгоритм расчета контрольных сумм RAID6, реализованный в ПО RAIDIX уникален тем, что позволяет получить очень высокие показатели производительности с минимальной нагрузкой на процессор.
По сути, производительность СХД больше не зависит от производительности RAID-контроллера и определяется только скоростью установленных дисков и пропускной способностью канала передачи данных. Таким образом, технология RAID6 в продуктах RAIDIX стала оптимальной с точки зрения сочетания факторов надежности, скорости и стоимости хранения данных.
Разработанный алгоритм RAID6 позволил реализовать в ПО RAIDIX механизм Advanced Reconstruction, значительно повышающий скорость чтения данных за счет автоматического исключения из процесса двух самых медленных дисков.
Высокая скорость RAID6 в решениях RAIDIX обеспечивает значительно меньшее время реконструкции массива (около 3 часов), при этом производительность СХД во время реконструкции практически не уменьшается и не приводит к задержкам в производственных процессах.
Альтернативные технологии | RAID6 (AVRORAID) |
---|---|
|
|
|
|
|
|
|
|
Резюмируя, можно сказать, что разработанная технология RAID6 предоставляет продукту RAIDIX следующие преимущества:
- Самая высокая производительность в своем классе, определяемая только возможностью установленных дисков;
- Минимальная стоимость хранения данных для массивов более 12 ТБ;
- Быстрая реконструкция массива (около 3 часов);
- Минимальное снижение производительности системы при реконструкции;
- Сохранение производительности массива при замедлении работы отдельных дисков.