Рейд массив что это такое
RAID для «чайников» и не только
KDV, iBase.ru, 26.11.2004, последнее обновление – 27.02.2009.
Со времени первой публикации статьи, на forum.ibase.ru в ее обсуждении появилась масса интересных сообщений. Так что после чтения статьи рекомендую обязательно просмотреть топик на форуме.
В интернете есть масса статей с описанием RAID. Например, эта описывает все очень подробно. Но как обычно, читать все не хватает времени, поэтому надо что-нибудь коротенькое для понимания – а надо оно или нет, и что лучше использовать применительно к работе с СУБД (InterBase, Firebird или что то иное – на самом деле все равно). Перед вашими глазами – именно такой материал.
Примечание. Сейчас есть хорошая статья о RAID в Википедии.
В первом приближении RAID это объединение дисков в один массив. SATA, SAS, SCSI, SSD – неважно. Более того, практически каждая нормальная материнская плата сейчас поддерживает возможность организации SATA RAID. Пройдемся по списку, какие бывают RAID и зачем они. (Хотел бы сразу заметить, что в RAID нужно объединять одинаковые диски. Объединение дисков от разных производителей, от одного но разных типов, или разных размеров – это баловство для человека, сидящего на домашнем компьютере).
RAID 0 (Stripe)
Грубо говоря, это последовательное объединение двух (или более) физических дисков в один «физический» диск. Годится разве что для организации огромных дисковых пространств, например, для тех, кто работает с редактированием видео. Базы данных на таких дисках держать нет смысла – в самом деле, если даже у вас база данных имеет размер 50 гигабайт, то почему вы купили два диска размером по 40 гигабайт, а не 1 на 80 гигабайт? Хуже всего то, что в RAID 0 любой отказ одного из дисков ведет к полной неработоспособности такого RAID, потому что данные записываются поочередно на оба диска, и соответственно, RAID 0 не имеет средств для восстановления в случае сбоев.
Конечно, RAID 0 дает ускорение в работе из-за чередования чтения/записи.
RAID 0 часто используют для размещения временных файлов.
RAID 1 (Mirror)
Зеркалирование дисков. Если Shadow в IB/FB это программное зеркалирование (см. Operations Guide.pdf), то RAID 1 – аппаратное зеркалирование, и ничего более. Упаси вас от использования программного зеркалирования средствами ОС или сторонним ПО. Надо или «железный» RAID 1, или shadow.
При сбое тщательно проверяйте, какой именно диск сбойнул. Самый частый случай погибания данных на RAID 1 – это неверные действия при восстановлении (в качестве «целого» указан не тот диск).
RAID 1+0
RAID 2-3-4
RAID 5
Для него нужно минимально 3 диска. Данные четности распределяются по всем дискам массива
Обычно говорится, что «RAID5 использует независимый доступ к дискам, так что запросы к разным дискам могут выполняться параллельно». Следует иметь в виду, что речь идет, конечно, о параллельных запросах на ввод-вывод. Если такие запросы идут последовательно (в SuperServer), то конечно, эффекта распараллеливания доступа на RAID 5 вы не получите. Разумеется, RAID5 даст прирост производительности, если с массивом будут работать операционная система и другие приложения (например, на нем будет находиться виртуальная память, TEMP и т. п.).
Объем дискового массива RAID5 расчитывается по формуле (n-1)*hddsize, где n – число дисков в массиве, а hddsize – размер одного диска. Например, для массива из 4-х дисков по 80 гигабайт общий объем будет 240 гигабайт.
Есть интересное мнение по поводу «непригодности» RAID5 для баз данных. Как минимум его можно рассматривать с той точки зрения, что для получения хорошей производительности RAID5 необходимо использовать специализированный контроллер, а не то, что есть по умолчанию на материнской плате.
RAID 10, 50
Дальше идут уже комбинации из перечисленных вариантов. Например, RAID 10 это RAID 0 + RAID 1. RAID 50 – это RAID 5 + RAID 0.
Интересно, что комбинация RAID 0+1 в плане надежности оказывается хуже, чем RAID5. В копилке службы ремонта БД есть случай сбоя одного диска в системе RAID0 (3 диска) + RAID1 (еще 3 таких же диска). При этом RAID1 не смог «поднять» резервный диск. База оказалась испорченной без шансов на ремонт.
Для RAID 0+1 требуется 4 диска, а для RAID 5 – 3. Подумайте об этом.
RAID 6
В отличие от RAID 5, который использует четность для защиты данных от одиночных неисправностей, в RAID 6 та же четность используется для защиты от двойных неисправностей. Соответственно, процессор более мощный, чем в RAID 5, и дисков требуется уже не 3, а минимум 5 (три диска данных и 2 диска контроля четности). Причем, количество дисков в raid6 не имеет такой гибкости, как в raid 5, и должно быть равно простому числу (5, 7, 11, 13 и т. д.)
Допустим одновременный сбой двух дисков, правда, такой случай является весьма редким.
По производительности RAID 6 я данных не видел (не искал), но вполне может быть, что из-за избыточного контроля производительность может быть на уровне RAID 5.
Rebuild time
У любого массива RAID, который остается работоспособным при сбое одного диска, существует такое понятие, как rebuild time. Разумеется, когда вы заменили сдохший диск на новый, контроллер должен организовать функционирование нового диска в массиве, и на это потребуется определенное время.
Во время «подключения» нового диска, например, для RAID 5, контроллер может допускать работу с массивом. Но скорость работы массива в этом случае будет весьма низкой, как минимум потому, что даже при «линейном» наполнении нового диска информацией запись на него будет «отвлекать» контроллер и головки диска на операции синхронизации с остальными дисками массива.
Резюме
Еще часто не включают write cache, в результате чего запись на raid происходит медленнее, чем на обычный одиночный диск. Дело в том, что у большинства контроллеров эта опция по умолчанию выключена, т.к. считается, что для ее включения желательно наличие как минимум батарейки на raid-контроллере, а также наличие UPS.
Текст
В старой статье hddspeed.htmLINK (и в doc_calford_1.htmLINK) показано, как можно получить существенное увеличение производительности путем использования нескольких физических дисков, даже для IDE. Соответственно, если вы организуете RAID – положите на него базу, а остальное (temp, OS, виртуалка) делайте на других винчестерах. Ведь все равно, RAID сам по себе является одним «диском», пусть даже и более надежным и быстродействующим.
признан устаревшим. Все вышеупомянутое вполне имеет право на существование на RAID 5. Однако перед таким размещением необходимо выяснить – каким образом можно делать backup/restore операционной системы, и сколько по времени это будет занимать, сколько времени займет восстановление «умершего» диска, есть ли (будет ли) под рукой диск для замены «умершего» и так далее, т. е. надо будет заранее знать ответы на самые элементарные вопросы на случай сбоя системы.
Я все-таки советую операционную систему держать на отдельном SATA-диске, или если хотите, на двух SATA-дисках, связанных в RAID 1. В любом случае, располагая операционную систему на RAID, вы должны спланировать ваши действия, если вдруг прекратит работать материнская плата – иногда перенос дисков raid-массива на другую материнскую плату (чипсет, raid-контроллер) невозможен из-за несовместимости умолчательных параметров raid.
Размещение базы, shadow и backup
Несмотря на все преимущества RAID, категорически не рекомендуется, например, делать backup на этот же самый логический диск. Мало того что это плохо влияет на производительность, но еще и может привести к проблемам с отсутствием свободного места (на больших БД) – ведь в зависимости от данных файл backup может быть эквивалентным размеру БД, и даже больше. Делать backup на тот же физический диск – еще куда ни шло, хотя самый оптимальный вариант – backup на отдельный винчестер.
Объяснение очень простое. Backup – это чтение данных из файла БД и запись в файл бэкапа. Если физически все это происходит на одном диске (даже RAID 0 или RAID 1), то производительность будет хуже, чем если чтение производится с одного диска, а запись – на другой. Еще больше выигрыш от такого разделения – когда backup делается во время работы пользователей с БД.
То же самое в отношении shadow – нет никакого смысла класть shadow, например, на RAID 1, туда же где и база, даже на разные логические диски. При наличии shadow сервер пишет страницы данных как в файл базы так и в файл shadow. То есть, вместо одной операции записи производятся две. При разделении базы и shadow по разным физическим дискам производительность записи будет определяться самым медленным диском.
Что такое RAID массив и как он работает
Содержание статьи:
Как работает RAID массив
Принцип работы RAID состоит в том, что технология позволяет размещать данные, например, одного приложения сразу на нескольких дисках. А операции ввода и вывода обрабатываются общими усилиями так, что повышается суммарная производительность.
Дополнительный бонус технологии — повышенная отказоустойчивость, вызванная более высоким объемом памяти. Таким образом, шанс потерять личные файлы стремительно падает.
RAID массив отображается в интерфейсе компьютера как один логический диск. Тем не менее принцип его работы может быть разным: зеркальным и чередующим. Зеркальный метод подразумевает копирование идентичных данных на несколько дисков, а чередующий позволяет равномерно распределять информацию по ним. Зеркалирование и чередование дисков могут быть объединены в одном массиве.
Любая технология имеет свои сильные и слабые стороны. Давайте рассмотрим возможности и недостатки RAID подробнее.
Какие преимущества дают RAID массивы
Экономическая составляющая.
В RAID массиве вы можете использовать несколько дешевых жестких дисков, получая в результате большие объемы памяти с минимальными затратами. Идеально для хранения личной информации, такой как, например, фильмы или семейные фотографии.
Производительность.
Используя RAID массив с несколькими жесткими дисками, вы получаете гораздо более высокую производительность, чем при одном активном устройстве. До уровня SSD, конечно, диски не дотянут, но скорость чтения-записи существенно возрастет. Как следствие, если ваша система установлена на HDD, скорость запуска компьютера будет выше.
Надежность.
Шанс того, что информация на вашем компьютере будет повреждена и недоступна для восстановления стремительно падает. Ведь чем больше суммарный объем памяти, тем большему количеству секторов надо сломаться прежде чем ситуация станет критической. А шанс того, что будет поврежден нужный вам файл вообще мизерный.
Отказоустойчивость.
Если вы используете массива RAID 5 с функцией “отзеркаливания”, вы можете свободно иметь два диска с идентичными данными. Повредился один — не проблема, все хранится в целости и сохранности на втором устройстве.
Негативные стороны применения RAID массивов
Высокая стоимость.
Помимо обычных RAID массивов существуют и гибридные, “Nested” массивы. Они могут содержать, например RAID 1+0, 0+3 и другие комбинации. Стоимость таких устройств ощутимо выше и может ударить по карману.
Риск цепного самоуничтожения.
Несмотря на то, что RAID массивы надежны и шанс повреждения дисков довольно низок, всегда есть вероятность старта цепной реакции “смерти”. Например, если один из дисков вышел из строя, вполне вероятно, что и другие тоже скоро постигнут его участь. Обратите внимание, что такие риски существуют только при полном отказе. Пара битых секторов должны вас насторожить, но не должны вгонять в панику.
Особенности производства.
Некоторые уровни RAID, например RAID 1 и 5, могут выдержать отказ только одного диска. И все остальные устройства в массиве находятся в серьезной опасности до тех пор, пока поврежденный диск не будет заменен новым.
RAID контроллер — управление массивом
RAID-контроллер — это устройство, предназначенное для управления жесткими дисками в массиве хранения данных. Он используется как средство общения между ОС и физическими дисками. В условиях применения такого контроллера повышается общая производительность и защищенность компьютера от кражи личной информации.
Контроллер может быть как программным, так и аппаратным. В аппаратном RAID массиве используются ресурсы самого RAID для управления его функционалом. В программном же массиве RAID использует ресурсы компьютера, такие как центральный процессор и память. Несмотря на то, что программный контроллер выполняет те же функции, что и аппаратный, он все же не может обеспечить аналогичной производительности.
Уровни RAID массивов
Устройства RAID бывают нескольких типов, но все они классифицируются как “уровни”. Ранее список таких уровней находился в диапазоне от 0 до 5. Такая пронумерованная система позволяла IT-специалистам различать типы массивов, с которыми они имеют дело. С тех пор количество уровней было расширено и разбито на категории: стандартные, вложенные и нестандартные.
Стандартные уровни
RAID 0
Принцип работы данного массива — чередование. Позволяет поочередно записывать информацию на каждый диск, находящийся в установленном массиве, и, тем самым, повышает производительность системы.
Доступна установка неограниченного количества дисков. Если же их скорость разная, то общий результат будет определяться по самому медленному устройству. Поэтому убедитесь, что приобретенные HDD имеют равные скоростные показатели. Тем не менее, это не касается объемов. Диски могут быть с совершенно разными показателями памяти: например, один диск содержит в себе 1 Тб памяти, второй 500 Мб, а третий 2 Тб. Все они могут сосуществовать вместе без конфликтов.
Обратите внимание!
Учитывая принцип работы массива, нужно часто делать бэкапы. Дело в том, что все файлы и приложения равномерно распределяются на всех установленных жестких дисков. И если хоть один из них настигнет сбой, вполне вероятно, что программа больше не запустится.
Исходя из технических соображений, в технологии RAID 0 главное соблюсти скоростную идентичность дисков. В противном случае данное предприятие может оказаться экономически невыгодным.
Преимущества: Высокая производительность.
Недостатки: Сложности при выборе комплектующих. Низкая надежность.
RAID 1
Принцип работы массива — зеркалирование. Такая конфигурация состоит минимум из двух дисков, которые дублируют хранящуюся друг на друге информацию. Чередование недопустимо. Повышена скорость чтения, поскольку оба диска можно считывать одновременно. На скорость записи данный массив никак не влияет.
Преимущества: Высокая надежность.
Недостатки: Дорого.
RAID 2
Принцип работы массива — чередование. Главное отличие от RAID 0 заключается в том, что в данном массиве некоторые диски хранят информацию о проверке и исправлении найденных ошибок (ECC). Кроме того, RAID 2 использует специальный код Hamming, применяемый для эффективного исправления сбоев. RAID 2 не имеет преимуществ перед RAID 3 и больше не используется.
Преимущества: Массив больше не используется.
Недостатки: Массив больше не используется.
RAID 3
Принцип работы массива — чередование. В процессе работы данного массива один диск используется специально для хранения информации о четности, которая помогает равномерно заполнять пространство всех HDD. Восстановление данных осуществляется путем индивидуальных вычислений для всех установленных устройств.
Поскольку операция ввода-вывода выполняется всеми дисками одновременно, устройство лучше всего подойдет для однопользовательских систем. То есть, данным массивом не смогут пользоваться два устройства одновременно.
Преимущества: Высокая производительность.
Недостатки: Возможность работы только с одним устройством. Низкая скорость передачи данных малого объема.
RAID 4
Принцип работы массива — чередование. Данный уровень очень похож на RAID 3, но отличается от него тем, что данные теперь разбиваются на блоки, а не на байты. Таким образом создатели массива смогли справиться с проблемой низкой скорости передачи файлов небольшого объема. Главным недостатком же стала низкая скорость записи данных.
Преимущества: Повышенная скорость передачи данных, в сравнении с RAID 3.
Недостатки: Низкая скорость записи файлов.
RAID 5
Данный массив базируется на чередовании на уровне блоков четности. Информация о четности чередуется по каждому диску индивидуально и позволяет массиву функционировать даже в случае отказа одного из подключенных устройств. Архитектура же дает возможность операциям чтения и записи охватить сразу несколько дисков. Результатом становится более высокая производительность, чем если бы было подключено только одно устройство.
RAID 5 требует как минимум 3 диска для полноценной работы. Тем не менее, желательно все же начинать с 5. Ведь 3 — это самый необходимый минимум при котором массив в принципе может функционировать.
Массивы RAID 5 считаются плохим выбором для использования в системах с интенсивной записью из-за принципа работы четности. Когда диск выходит из строя, восстановления данных может занять очень много времени.
Преимущества: Высокая скорость чтения. Экономичность.
Недостатки: В случае повреждения данных, время их восстановления может занять довольно внушительный срок.
RAID 6
Похож на RAID 5, но обладает более высокой надежностью. Использование дополнительной схемы четности позволяет массиву продолжать функционировать даже в случае отказа двух дисков одновременно. Однако, что-то хорошее редко случается просто так и за все нужно платить. Такая дополнительная защита обойдется вам несколько дороже, чем в случае с массивом предыдущего уровня.
Преимущества: Высокая надежность.
Недостатки: Пониженная скорость записи, в сравнении в RAID 5.
Вложенные уровни
Некоторые уровни RAID массивов называют вложенными, по-английски Nested. Это связано с тем, что принцип их работы основан на комбинировании разных уровней RAID в один массив. Давайте рассмотрим несколько примеров.
RAID 10 (RAID 1+0)
Объединив уровни 1 и 0, массив стали называть RAID 10. Главное его преимущество заключается в более высокой производительности относительно RAID 1. Тем не менее за это придется платить, поскольку стоимость массива становится несколько выше.
RAID 01 (RAID 0+1)
Данный массив очень похож на RAID 10. Исключение составляет сам метод организации данных на дисках. Вместо того, чтобы использовать метод зеркал и создавать копии данных, в массиве применяется набор полос, который в свою очередь подвергается зеркалированию.
RAID 03 (RAID 0+3)
RAID 03 так же часто могут называть и RAID 53, поскольку схема работы этих комбинаций массивов идентична. На этом уровне используется метод чередования типа 0 для блоков виртуальных дисков RAID 3. Такая комбинация обеспечивает более высокую производительности в сравнении с одиночными массивами. К сожалению, цена возрастает вместе с производительностью.
RAID 50 (RAID 5+0)
Данная конфигурация объединяет распределенную четность RAID 5 с чередованием RAID 0 для повышения производительности первого массива без снижения защиты данных. Идеальное сочетание.
Нестандартные уровни
Нестандартные уровни RAID редко можно увидеть на обычном рынке. Это связано с тем, что они разрабатываются компаниями индивидуально для своих нужд. Приведем несколько примеров.
RAID 7
Нестандартный уровень, основанный на принципах работы RAID 3 и 4. Главное отличие — добавленное кэширование. Данный массив включает в себя встроенную операционную систему, которая выступает в роли контроллера и проводит кэширование по высокоскоростной шине. Производительность повышена относительно индивидуальных массивов.
Adaptive RAID
Адаптивный массив. Этот уровень позволяет контроллеру самостоятельно решать как хранить данные о четности на дисках. Он выбирает между RAID 3 и 5, в зависимости от того какой уровень будет работать лучше с конкретным типом имеющихся данных.
Linux MD RAID 10
Данный уровень предоставляется Linux. Он поддерживает создание вложенных и нестандартных RAID массивов. Кроме того, технология поддерживает создание стандартных конфигурация RAID 0, RAID 1, RAID 4, RAID 5 и RAID 6.
Будущее RAID массивов
RAID по прежнему находит себе применение, даже не смотря на то, что аналитики утверждают о несовременности данной технологии. Существуют альтернативы, которые предлагают большую защиту данных и были разработаны специально для устранения слабых мест RAID.
Более того, рост числа твердотельных накопителей (SSD) так же работает не в пользу RAID массивов. Суть в том, что они не содержат движущихся частей и практически не подвержены разного рода повреждениям. Тем не менее, ситуация приятно меняется, если жесткие диски массива взять и заменить на SSD. В таком случае вы сможете добиться выравнивания износа и все диски проживут приблизительно один срок.
Существует огромное количество носителей для хранения информации, но еще не было ни одного устройства, способного обойти по объемам RAID массивы. Эти гиганты и по сей день могут сослужить отличным хранилищем личной информации.
Похожие статьи про восстановление данных:
Типы и различия SSD и возможность восстановления данных с твердотельных накопителей
Краткий “Курс в мир SSD”. Все о данном типе накопителей, включая подробные объяснения точных термино.
Как диагностировать неисправность носителя данных и не потерять файлы
Носители данных — это устройства, задача которых заключается в хранении информации о пользоват.
Как восстановить жесткий диск и вернуть данные, если диск не определяется
Жесткие диски, как и любые другие устройства, подвержены разного рода воздействиям и повреждениям. Е.















