Подробное знакомство с raid-массивами

Введение

Пословицу «Пока гром не грянет, мужик не перекрестится» знает почти каждый. Жизненная она: пока та или иная проблема не коснется юзера вплотную, тот о ней даже не задумается. Умер блок питания и прихватил с собой пару-тройку девайсов — пользователь бросается искать статьи соответствующей тематики о вкусном и здоровом питании. Сгорел или начал глючить от перегрева процессор — в «Избранном» появляется пара-тройка ссылок на развесистые ветки форумов, на которых обсуждают охлаждение CPU.

С жесткими дисками та же история: как только очередной винт, хрустнув на прощание головками, покидает наш бренный мир, обладатель ПК начинает суетиться, чтобы обеспечить улучшение жизненных условий накопителя. Но даже самый навороченный кулер не может гарантировать диску долгую и счастливую жизнь. На срок службы накопителя влияет много факторов: и брак на производстве, и случайный пинок корпуса ногой (особенно если кузов стоит где-нибудь на полу), и пыль, прошедшая сквозь фильтры, и высоковольтная помеха, посланная блоком питания… Выход один — резервное копирование информации, а если требуется бэкап на ходу, то самое время строить RAID-массив, благо сегодня почти каждая материнка обладает каким-нибудь RAID-контроллером.

На этом месте мы остановимся и сделаем краткий экскурс в историю и теорию RAID-массивов. Сама аббревиатура RAID расшифровывается как Redundant Array of Independent Disks (избыточный массив независимых дисков). Раньше вместо independent употребляли inexpensive (недорогой), но со временем это определение потеряло актуальность: недорогими стали почти все дисковые накопители.

История RAID началась в 1987 году, когда появилась на свет статья «Корпус для избыточных массивов из дешевых дисков (RAID)», подписанная товарищами Петерсоном, Гибсоном и Катцем. В заметке была описана технология объединения нескольких обычных дисков в массив для получения более быстрого и надежного накопителя. Также авторы материала рассказывали читателям о нескольких типах массивов — от RAID-1 до RAID-5. Впоследствии к описанным почти двадцать лет назад массивам прибавился RAID-массив нулевого уровня, и он обрел популярность. Так что же представляют собой все эти RAID-x? В чем их суть? Почему они называются избыточными? В этом мы и постараемся разобраться.

Если говорить очень простым языком, то RAID — это такая штука, которая позволяет операционной системе не знать, сколько дисков установлено в компьютере. Объединение хардов в RAID-массив — процесс, прямо противоположный разбиению единого пространства на логические диски: мы формирует один логический накопитель на основе нескольких физических. Для того чтобы сделать это, нам потребуется или соответствующий софт (об этом варианте мы даже говорить не будем — ненужная это вещь), или RAID-контроллер, встроенный в материнку, или отдельный, вставляемый в слот PCI либо PCI Express. Именно контроллер объединяет диски в массив, а операционная система работает уже не с HDD, а с контроллером, который ей ничего ненужного не сообщает. А вот вариантов объединения нескольких дисков в один существует великое множество, точнее, около десяти.

Ну и наконец: как установить Raid массив на пк?

Установка RAID массива достаточно сложная задача, требующая от пользователя определенных знаний. В рамках данной статьи я не могу дать точных инструкций по настройке RAID массива на домашнем ПК. Но постараюсь задать определенный вектор.

Для установки Raid массива нам потребуется:

  • Несколько абсолютно одинаковых жестких дисков.
  • Материнская плата, поддерживающая Raid массивы (обратитесь к инструкции на мат. плату. Поддерживает ли она такую функцию?)
  • Умение ориентироваться в БИОС компьютера. На многих ОС семейства Windows установка RAID массива начинается с настроек в БИОСе.

Надеюсь, я смог ответить на ваши вопросы по Raid массивам, и теперь вектор задан. Осталось действовать!!!

Расскажете об этой статье своим друзьям:

Raid JBOD

JBOD Raid описание

JBOD (Just a bundle of disks), то есть связка жестких дисков, рейд массивом строго говоря не является. Однако несколько дисков могут быть объединены в один логический раздел с помощью операционной системы, либо аппаратно, с помощью рэйд контроллера, поддерживающего функцию построения jbod массива. Файлы обычно записываются последовательно до конца диска, далее запись продолжается на следующий указанный hdd. Подобная организация данных не требует специального оборудования, как я сказал выше, и может быть реализована на программном уровне средствами ОС или стороннего ПО. Однако при поломке одного из дисков файловая система разрушается и требуется операция восстановления данных jbod массива.

JBOD массив описание

Минимально необходимое количество томов (дисков) для создания jbod — 2.

Восстановление JBOD

В случае выхода из строя дискового jbod массива необходимо определиться с порядком дисков, это не сложно сделать, если в джибод-массиве всего два накопителя, и задача становится сложнее, если дисков три или более. В этом случае нужно провести анализ таблиц размещения файлов, определиться с адресацией начала файла или директории и проведя необходимые вычисления достаточно легко определить очередность дисков в массиве. Так же нужно отметить, что в ряде случаев, когда один или несколько дисков jbod массива вышли из строя и не подлежат восстановлению, информацию с поврежденного jbod все же можно достать, пусть и частично.

Программный RAID для Windows:

Начните с Windows XP, Microsoft интегрировала функции RAID в свои операционные системы. Какой тип на самом деле зависит от вкуса Windows:

  • Windows XP допускает составные тома (один том на двух или более дисках), также известный как JBOD.
  • Windows Vista Ultimate дает разрешение на чередование JBOD и RAID 1.
  • Также Windows 7 Home позволяет использовать JBOD и RAID 1, в то время как Professional и Ultimate добавляют зеркалирование RAID 0. В Windows 2000 Professional также есть JBOD, 0 и 1.
  • Операционные системы Windows Server, начиная с 2000 года, имеют JBOD, 0, 1, плюс фактически поддерживает распределенную четность RAID 5.

Что ж, Windows RAID предлагает несколько преимуществ. Вы также можете создавать массивы из диспетчера оконных дисков, чтобы на самом деле не нужно было настраивать BIOS. Кроме того, он более гибкий, наряду с зеркалами, которые позволяют создавать их из существующих томов, содержащих данные, а также удалять одну половину зеркала, оставив при этом другую. Вы можете зеркалировать отдельные разделы, которые также включают разделы с разных дисков, на один диск.

Разрыв в лавине данных

До сих пор RAID эволюционировал одновременно с предъявляемыми требованиям, но если задуматься… Согласно исследованиям компании Cisco, траффик сети испытает приблизительный совокупный среднегодовой темп роста 32% между 2011 и 2015 годом. Компания IDC прогнозирует необходимый совокупный среднегодовой темп роста вместимости устройств хранения размером в 50% за тот же период. Gartner оценила совокупные ежегодные темпы роста расходов на ИТ в 5%, а показатель расходов на телекоммуникационное оборудование составил 7%.

В то же время, учитывая рост количества данных, создаваемых и используемых по всему миру, разрыв в производительности требует решения проблем RAID, связанных с поддержанием уровня производительности и ускорения обработки данных. В основном все процессоры достигают скорости записи в 1 наносекунду в L1 кэш-памяти, 10 наносекунд в L2 и 100 наносекунд в основной кэш-памяти. Это намного быстрее, чем скорость записи в 10 милисекунд на СХД уровня 1 или в 20 милисекунд уровня 2 и в СХД ближнего профиля. Данные подтверждают время ожидания в 100 000 раз вследствие нарушения иерархичности памяти.

Комбинация такого разрыва производительности и расширенного роста данных и траффика сети, скорее всего, перегружает RAID СХД-инфраструктуру, создавая `узкие места`, пропуская такты производительности приложения и делая сложнее для компаний извлекать все необходимое из своих данных. Современный мир озабочен данной проблемой, ведь скорость доступа к данным является самым важным аспектом нашей жизни — все хотят получить доступ ко всему и немедленно.

Составные RAID массивы

У основных уровней RAID есть свои достоинства и недостатки. И вполне понятно, почему инженеры стали мечтать о таком RAID, который бы объединял достоинства нескольких уровней. Составной RAID массив – это чаще всего сочетание быстрого RAID 0 с надежным RAID 1, 3 или 5. Итоговый массив действительно обладает улучшенными характеристиками, но и платить за это приходится повышением стоимости и сложностью решения.

Составной RAID строится так: сначала диски разделяются на наборы (set). Затем на основе каждого из наборов строятся простые массивы. А завершается все объединением этих массивов в один мегамассив. Запись типа X+Y означает, что сначала диски объединены в RAID уровня X, а затем несколько RAID X массивов объединены в RAID уровня Y.

Создание массива

Надеюсь, с выбором типа массива вы уже справились. Если на вашей плате есть RAID-контроллер, вам ничего, кроме нужного количества дисков и драйверов этого самого контроллера, не понадобится. Кстати, имейте в виду: есть смысл объединять в массивы только диски одинакового объема, причем лучше одной модели. С дисками разного объема может отказаться работать контроллер, и, скорее всего, вы сможете задействовать лишь часть большого диска, равную по объему меньшему из дисков. Кроме того, даже скорость stripe-массива будет определяться скоростью самого медленного из дисков. И мой вам совет: не пытайтесь сделать RAID-массив загрузочным. Это возможно, но в случае возникновения каких-либо сбоев в системе вам придется нелегко, так как восстановление работоспособности будет сильно затруднено. Кроме того, опасно размещать несколько систем на таком массиве: почти все программы, отвечающие за выбор ОС, убивают информацию из служебных областей винчестера и, соответственно, портят массив. Лучше выбрать иную схему: один диск — загрузочный, а остальные объединены в массив.

Matrix RAID в действии. Часть объема дисков используется массивом RAID-0, оставшуюся часть пространства забирает массив RAID-1.

Каждый RAID-массив начинается с BIOS RAID-контроллера. Иногда (только в случае с интегрированными контроллерами, да и то не всегда) он встроен в основной BIOS материнки, иногда расположен отдельно и активируется после прохождения самотестирования, но в любом случае вам туда надо. Именно в BIOS задаются нужные параметры массива, а также размеры блоков данных, используемые винчестеры и так далее. После того как вы все это определите, достаточно будет сохранить параметры, выйти из BIOS и вернуться в операционную систему.

Там обязательно нужно установить драйверы контроллера (как правило, дискета с ними прилагается к материнке или к самому контроллеру, но они могут быть записаны на диск с другими драйверами и служебным софтом), перезагрузиться, и все, массив готов к работе. Можете разбивать его на логические диски, форматировать и заполнять данными. Помните только о том, что RAID не панацея. Он спасет вас от потери данных при гибели винчестера и минимизирует последствия такого исхода, но не спасет от скачков напряжения в сети и сбоев некачественного блока питания, который убивает оба диска сразу, без оглядки на их «массивность».

Пренебрежительное отношение к качественному питанию и температурному режиму дисков может существенно сократить срок жизни HDD, бывает, все диски массива выходят из строя, а все данные оказываются безвозвратно потерянными. В частности, современные винчестеры (в особенности IBM и Hitachi) очень чувствительны к каналу +12 В и не любят даже малейшего изменения напряжения на нем, так что перед закупкой всего оборудования, необходимого для построения массива, стоит проверить соответствующие напряжения и при необходимости включить новый БП в список покупок.

Питание жестких дисков, равно как и всех остальных комплектующих, от второго блока питания, на первый взгляд, реализуется просто, но в такой схеме питания немало подводных камней, и нужно сто раз подумать, прежде чем решиться на такой шаг. С охлаждением все проще: необходимо лишь обеспечить обдув всех винчестеров, плюс не ставьте их вплотную друг к другу. Простые правила, но, к сожалению, соблюдают их не все. И случаи, когда оба диска в массиве умирают одновременно, нередки.

Кроме того, RAID не отменяет необходимости регулярно изготавливать резервные копии данных. Зеркалирование зеркалированием, но если вы случайно испортите или сотрете файлы, второй диск вам никак не поможет. Так что делайте бэкап всякий раз, когда вы можете его делать. Это правило действует вне зависимости от наличия RAID-массивов внутри ПК.

Так что, are you RAIDy? Да? Отлично! Только в погоне за объемом и скоростью не забудьте другую пословицу: «Заставь дурака Богу молиться, он и лоб расшибет». Крепких вам дисков и надежных контроллеров!

Raid 50

Raid 50 описание

Raid 50 является комбинацией между двумя рэйд-массивами пятого уровня, объединенными между собой в страйп, или raid 0. Минимальное количество дисков для построения рэйд 50 массива — шесть штук.

Raid 50 описание

На иллюстрации показан частный случай организации такого массива. Нужно иметь ввиду, что на ряде контроллеров идет каскадное представление дисков по цепочке физический-логический-физический. То есть шесть физических жестких дисков объединяются в два логических массива (диска) raid-5, далее они представляются как два физических диска соответствующего размера и уже эти диски объединяются между собой в страйп, со своим размером блока и очередностью и восстановление raid может быть в такой ситуации весьма нетривиальной задачей. Полученный логический диск собранный по технологии рейд 50, уже средствами ОС воспринимается как физический, и размечается и форматируется.

В качестве иллюстрации возможных нагромождений представим что этот «физический» диск raid-50 делится средствами ОС на два логических, из которых собирается JBOD или raid-0 уже средствами ОС. Инженер осуществляющий восстановление данных raid и получивший шесть дисков которые состояли в подобном массиве может потратить массу времени на построение таблиц соответствия блоков и дисков.

Восстановление Raid-50

Как и в случаях с рэйд массивами 6-го уровня, на raid-50 достаточно часто встречаются надстройки в виде слайсов, крутятся десятки виртуальных машин, *nix файловые системы, VMFS и прочие радости бытия. Восстановление информации с raid50 является достаточно сложной задачей. Для начала нужно попытаться получить максимально полную информацию о предполагаемой конфигурации, количестве и размере разделов и т.п. Далее, определившись с конфигурацией, целесообразно идти по пути сборки, которой оперировал raid контроллер. То есть сначала собираются все рэйд-5 массивы входившие в состав raid50, выгружаются в отдельные образы и уже они объединяются в виртуальный страйп.

Что вы имеете в виду под Raid 5?

В конце концов, жесткие драйверы на выделенных серверах выходят из строя. Нет никакого смысла в этом факте. Все уровни Raid, за исключением Raid 0, снижают вероятность потери данных и простоев с поврежденного жесткого диска на выделенном сервере. Решение Raid повышает производительность ввода-вывода благодаря значительным улучшениям скорости записи и чтения. Рейд 0 только используется для производительности ввода-вывода. Этот уровень не помогает с избыточностью, как другие уровни рейда.

Сервер Raid 5 — это исправление, специально разработанное как хранилище. Его конфигурация увеличивает пространство за счет использования четности для достижения чередования данных. Это означает, что в случае отказа любого из жестких дисков система не пострадает. В случае отказа двух жестких дисков пользователи могут потерять свои данные.

Если вам интересно, как это происходит, продолжайте читать. В конфигурации Raid 5 есть три диска. Предположим, что один из жестких дисков выходит из строя, тогда Raid 5 работает как самоисцелитель. Эта технология гарантирует, что восстановление данных начинается немедленно из-за паритета среди доступных запасных дисков. Как указано выше, если два из этих жестких дисков перестанут работать одновременно, ваши данные будут потеряны, к сожалению.

Из-за чередования конфигурация Raid 5 предлагает улучшение производительности в два раза для функций чтения. Тем не менее, вы должны рассмотреть несколько моментов, прежде чем выбрать Рейд 5. Итак, взгляните на эти проблемы сейчас!

  • Рейд 5 занимает около нескольких дней, чтобы восстановить большие диски размером более 2 ТБ. Период перестроения подвергает риску данные, поскольку сервер усердно работает для расчета недостающих данных. Когда ваш сервер работает усердно, он работает очень медленно и даже становится непригодным для использования во время перестроения. Таким образом, вы должны учитывать это при переходе на Raid 5.
  • Если URE (Неисправимая ошибка чтения) происходит во время перестроения, тогда все ваши данные будут потеряны. Нельзя восстановить эти данные, и, следовательно, они исчезли навсегда только потому, что массив поврежден из-за URE.

Недостатки бонуса без депозита

  • Медленный процесс восстановления после сбоя
  • Терпеть только отказ одного диска

Имея эти риски под рукой, Raid 5 рекомендуется для пользователей, у которых есть небольшие диски с низким URE. Теперь вы получите представление о Raid 5; пришло время перейти к другому.

RAID 0, страйпинг

По другому называется Striping (страйпинг). Для организации такой схемы хранения необходимо как минимум 2 диска одинакового объема. Особенностью RAID-0 является возможность получить виртуальный том большего размера, чем составные диски. Принцип записи данных на диски — последовательное чередование дисков блоками данных одинаковой длинны (Stripe Unit). При этом первая часть данных записывается на первый диск, вторая — на второй и так далее, пока не закончатся физические носители (первая строка записи). После этого запись следует на первый носитель, но на следующий блок данных этого носителя, затем на второй блок второго носителя и так далее(последующие строки). Недостатком такой организации хранения данных является отсутствие дублирования, что при выходе из строя хотя бы одного носителя приводит к полной потере данных. Однако, такой тип организации данных при правильном подборе размера Stripe Unit позволяет получить бОльшую производительность виртуального тома, чем единичного физического носителя.

Raid 6

Raid 6 описание

Дальнейшее логическое развитие пятого рэйда — raid 6, который от пятого отличается наличием двух блоков контрольных сумм, и соответственно в состоянии пережить выход из строя двух дисков в массиве. Типы ротации блоков контрольных сумм те же — forward, backward и их dynamic вариации. При выходе из строя трех дисков и больше в рэйд 6 массиве сервер перестает функционировать и требуется восстановление информации. Точно так же различают рэйд форвард, рэйд бэквард и их динамик вариации.

Raid 6 backward описание

Raid 6 forward описание

Минимально необходимое количество дисков для создания raid6 массива — 4.

Восстановление raid 6

И опять методология сходна с восстановлением информации на raid 5, проблема осложняется только тем, что из коммерческого программного обеспечения мало кто может похвастаться поддержкой восстановления данных с raid 6. Но в целом порядок тот же — определение очередности, размера блоков и выяснение степени актуальности. Кроме того, нужно отметить что на raid 6 массивах чаще чем на 5-х и уж тем более чаще чем на страйпах или рейд-зеркалах встречаются такие вещи, как слайсы, десятки виртуальных машин, малораспространенные файловые *NIX системы и прочие прелести.

Рекомендую к прочтению дополнительные материалы: восстановление raid 6 и raid 6 wide pace proNAS OS

Рейд 10 против Рейда 5 Сравнительная таблица

Теперь давайте кратко рассмотрим функции Raid 10 и Raid 5 в следующей сравнительной таблице Raid 10 и Raid 5.

Особенности Рейд 10 Рейд 5
Ключевой особенностью Зеркальное чередование: сочетает зеркальное отображение и чередование для повышения производительности и отказоустойчивости. Паритет с чередованием
Чередование Да, равномерно распределить данные по группам дисков. Каждая группа владеет двумя дисками, которые настроены как зеркальные изображения. Таким образом, Raid 10 сочетает в себе функции как Raid 1, так и Raid 0 Да, данные чередуются равномерно среди всех дисков Raid. Кроме того, информация о четности хранится только одна. Таким образом, восстановление данных возможно в случае отказа любого диска
Отказоустойчивость, избыточность и зеркалирование Его функция зеркалирования данных делает его отказоустойчивым. Если драйвер поврежден, данные могут быть быстро восстановлены путем копирования на другие диски Нет избыточности или зеркалирования. Здесь отказоустойчивость может быть достигнута путем измерения и сохранения информации о четности. Он терпит один сбой физического диска
Перфоманс Быстрые операции чтения из-за чередования, а также быстрые операции записи, поскольку каждый блок данных требует зеркального отражения или записи дважды. Здесь записи происходят на двух разных дисках для параллельного появления. Нет необходимости рассчитывать информацию о четности Быстрое чтение из-за чередования данных на нескольких физических дисках. Здесь записи выполняются немного медленнее из-за необходимости измерения информации о четности. Поскольку четность рассчитывается, диск не становится узким местом
Приложения Хотя производительность важна для операций записи и чтения, а также для быстрого восстановления после сбоя Эффективный баланс достойной производительности, эффективного хранения, хорошей безопасности и устойчивости к сбоям. Идеально подходит для приложений и файловых серверов, имеющих ограниченный номер. жестких дисков
Необходимое минимальное количество дисков 4 3
Паритетный диск Контрольная сумма и четность не измеряются в конфигурации Raid 10 Информация о четности распространяется на все физические диски. Если какой-либо диск поврежден, информация о четности используется для восстановления данных, хранящихся на диске
преимущества Быстрое восстановление данных в случае сбоя диска Отказоустойчивость, быстрое чтение и недорогое резервирование. Здесь данные могут быть доступны во время восстановления неисправного диска
Недостатки бонуса без депозита Использование диска составляет всего 50%. Таким образом, это недорого для получения избыточности при хранении по сравнению с хранением информации о четности Восстановление после сбоя происходит медленно из-за вычислений четности для восстановления содержимого и восстановления замещающего диска. Можно читать из системы Raid, но функции чтения в течение этого времени могут быть довольно медленными.

RAID 7.3

Изначально RAID был исключительно аппаратной технологией. Физический RAID-контроллер способен поддерживать несколько массивов различных уровней одновременно, однако более эффективная реализация RAID возможна с помощью программных компонентов (драйверов). Так, ядро Linux позволяет гибко управлять RAID-устройствами. Взяв за основу модули ядра Linux и технологии помехоустойчивого кодирования, разработчики программной технологии RAIDIX сумели создать решение для построения высокопроизводительных отказоустойчивых СХД на базе стандартных комплектующих.

ПО RAIDIX позволяет работать с массивами уровней RAID 0, RAID 5, RAID 6 и RAID 10. Среди патентованных алгоритмов «Рэйдикс» – уникальные уровни RAID 7.3 и N+M.

RAID 7.3 является аналогом RAID 6 с двойной четностью, но имеет более высокую степень надёжности. RAID 7.3 – уровень чередования блоков с тройным распределением четности, который позволяет восстанавливать данные при отказе до трех дисков в массиве и достигать высоких скоростных показателей без дополнительной нагрузки на процессор. RAID 7.3 существенно снижает вероятность отказа дисков без потерь в производительности и стоимости и зачастую используется для крупных массивов объемом более 32 ТБ.

Переопределение производительности ЦОДа

Использование СХД на основе флэш с существующей СХД может сэкономить значительное количество денег, так как многоуровневые СХД-массивы с флэш на RAID-контроллере (вместе с интеллектуальным ПО) могут заместить огромное количество дисков, которое является необходимым для сохранения уровней I/O в традиционных СХД-массивах. Комбинированный подход позволяет компаниям интеллектуально использовать флэш-СХД и свои существующие жесткие диски вместе, что обеспечивает оптимальное соотношение цена/качество в многоуровневой СХД-среде.

Такой подход был выбран и корпорацией LSI, лидера в сегменте рынка и лидера технологии в оборудовании RAID и высокопроизводительных СХД-контроллеров. Недавно компания LSI представила продуктовый порфель Nytro,объединяющий в себе флэш-технологию PCIe с ПО интеллектуального кэширования и управления. По данным LSI, подобная комбинация обеспечивает впечатляющее ускорение производительности, которая зависит от конфигураций и приложения, но легко увеличивает производительность различных HDD. Нередко производительность приложение ускоряется в 5-6 раз, а в некоторых случаях, по данным пользователей, в 30 раз.

Новые решения, такие как продуктовая линейка LSI Nytro, предлагающие флэш СХД-адаптер PCIe, обеспечивают различные вместимости и отвечают разным требованиям. Высокая вместимость флэш-решений PCIe может быть использована в основной СХД для получения непрозрачной СХД с наибольши значением, но по приемлемой цене. Средняя вместимость флэш-решений, которые сочетают флэш-технологию PCIe с ПО интеллектуального кэширования, может ускорять SAN и комплекс DAS соединенных СХД, и обеспечивать баланс между стоимостью и ценностью результата. Низкая вместимость флэш-решений, которая сочетает RAID-контроллернуюю карту со встроеннымм ПО флэш и интеллектуального кэширования для ускорения DAS соединенных СХД, несет преимущества флэш `в массы`.

Интеллектуальное внедрение флэш-технологий может помочь развитию RAID, решить проблемы, связанные с разрывом в лавине данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector