Главная страница каталога Acma.Ru - Каталог статей и интернет-ресурсов
|| О ресурсе || Новости || Добавить статью || Поиск || Гостевая книга || Реклама на сайте  

Каталог статей и интернет-ресурсов

Яндекс

Разберем RAID “по косточкам”

При выборе системы хранения данных всегда приходилось искать компромисс между ценой, доступностью данных и производительностью (ЦДП - cost, availability of data and performance, CAP). Технология RAID (redundant array of inexpensive disks, избыточный массив недорогих дисков) - не исключение, но она отличается от других решений своим подходом к ограничениям вечного треугольника ЦДП. RAID - не “монолитная” технология, а сочетание различных методов использования магнитных дисков для хранения данных.

В системах RAID разных уровней специфические характеристики различны. Приписанный каждому уровню цифровой индекс не является количественным показателем. Он используется лишь для описания конкретной конфигурации; то есть RAID уровня 5, например, не обязательно в пять раз “лучше”, чем RAID уровня 1. Некоторые из уровней определяются следующим образом.

  • Уровень 1: зеркальное копирование данных для каждого диска.
  • Уровень 2: избыточность за счет использования кода Хэмминга [он обеспечивает исправление ошибки в одном бите и обнаружение ошибки в двух битах данных. - Прим. перев.].
  • Уровень 3: расщепление (striping) данных на массиве дисков с выделением одного диска на весь набор для контроля четности.
  • Уровень 4: аналогичен RAID3, но данные распределяются на дисках не по байтам, а блоками.
  • Уровень 5: распределение данных в последовательные блоки по всем дискам массива, данные контроля четности также распределяются по всем дискам.
  • Уровень 6: подобен уровню 5, но с двойным контролем четности.

RAID0 (который специалисты не признают истинным RAID) использует метод расщепления. Сначала данные расщепляются на блоки, которые затем подорожечно записываются на каждый диск массива (сначала на первую дорожку первого диска, затем на первую дорожку второго диска и так далее).

Такой способ обеспечивает превосходную скорость выполнения операций ввода/вывода, но вовсе не приводит к избыточности данных. Чтобы восстановить данные, система должна быть способна последовательно считывать все диски, на которые была произведена запись. Если при считывании произойдет сбой, то данные будут безвозвратно испорчены.

В массивах RAID1 применяется диаметрально противоположный подход, называемый зеркальным копированием (mirroring). Копия данных, записанных на один диск массива, заносится одновременно и на второй диск массива, благодаря чему достигается избыточность данных и, следовательно, их высокая надежность. Доступ к дискам массива может происходить через параллельные интерфейсы для повышения скорости передачи данных. Таким образом, ровно половина жестких дисков в массиве используется для обеспечения избыточности.

RAID4 обеспечивает целостность данных за счет того, что сумма данных по модулю 2 (данные контроля четности, или XOR) записывается на один, специально выделенный жесткий диск массива. Очевидно, это вызывает образование “заторов”, поэтому обычно приходится использовать средства ускорения передачи данных. При таком способе независимый доступ к дискам способствует повышению скорости обработки транзакций. Производительность операций чтения значительно выше, чем производительность операций записи.

RAID 5, так же как и RAID4, осуществляет независимый доступ к дискам, но данные контроля четности распределяются по всем дискам. Расчет делается на то, что такое “расщепление” повышает производительность, так как позволяет избежать заторов, свойственных записи контрольных сумм на один диск массива. Обычно 80% пространства каждого диска используется для данных, а 20% - для контрольных сумм.

RAID10 (совокупность уровней 1 и 0) - это комбинированный способ, при котором данные “расщепляются” и зеркально копируются без вычисления контрольных сумм. Обычно две пары “зеркалированных” массивов объединяются и образуют один массив RAID 0. Этот способ целесообразно применять при работе с большими файлами.

Некоторые системы RAID могут “на ходу” изменять свою конфигурацию. Например, система AutoRAID компании Hewlett-Packard способна анализировать рабочую нагрузку и выбирать такой уровень, который обеспечит наивысшую производительность операций считывания/записи. Однако в большинстве систем предусмотрен только один, неизменный вариант конфигурации.

В новых продуктах в основном применяется технология RAID5. Дисковая подсистема 7133 от IBM для платформ Unix и Windows NT, в которой используется конфигурация RAID5. В этой подсистеме классическая шина доступа SCSI модифицирована в кольцо - такой подход гарантирует, что отказ одного кабеля не приведет к потере данных.

Между тем произошедшее за последние годы резкое увеличение производительности микропроцессоров выявило другое “узкое место”. Оказывается, дело в шине передачи данных между центральным процессором и устройством хранения. Лежащей в основе этой шины архитектуре SCSI, которая передает команды управления диском и данные, уже 15 лет.

Конфигурация RAID5 специальным образом не оптимизирована для передачи данных, однако стандарты SCSI 2 (Fast) и SCSI 3 (Ultra Fast) повышают скорость передачи. Архитектура SCSI позволяет подключать жесткие диски цепочкой к одной логической шине, но в большинстве случаев при построении конфигурации RAID этот способ стараются не применять из-за того, что такая топология не обеспечивает необходимой устойчивости. При отказе одного диска станут недоступными все диски в цепочке.

Учитывая такие особенности SCSI, некоторые создатели систем хранения попытались повысить скорость работы канала передачи данных между процессором и дисковой подсистемой. Одна из таких попыток привела к появлению технологии Fibre Channel Arbitrated Loop (FC-AL).

Число сторонников технологии FC-AL непрерывно растет. Ее поддерживают такие серьезные игроки на рынке устройств хранения, как HP, Hitachi Data Systems, Sun Microsystems, EMC и т.п. В отличие от SCSI, имеющей пропускную способность до 320 Мб/с, эта шина обеспечивает передачу данных со скоростью 2 Гбит/с в полнодуплексном режиме. В системах FC-AL для управления устройствами обычно используется набор команд SCSI 3 (для достижения обратной совместимости), но на скоростях более высоких, чем у решений SCSI на медном проводе. Технология FC-AL также способна при использовании надлежащих адаптеров обрабатывать другие широко распространенные протоколы передачи данных, такие как TCP/IP, FDDI и ATM.

Системы RAID состоят не только из аппаратных компонентов. В них обычно используется программное обеспечение, не являющееся частью операционной системы. Это скорее промежуточное ПО, которое создает необходимую устойчивость работы, например, выбор альтернативного пути передачи данных и принятие решений в случае отказа управляющего компьютера. Это ПО позволяет добиться высокой степени доступности данных, так как обнаруживает сбои и предпринимает соответствующие меры для обеспечения целостности потока данных (обычно кэшируя данные на избыточный диск, изменив путь прохождения данных на управляющий компьютер или полностью переключившись на другой компьютер).

Оно также способно начать процесс восстановления данных после того, как произойдет сбой. В число производителей ПО для RAID входят такие компании, как CLAM Associates, Veritas Software и Conley. Некоторые производители дисковых массивов, например Hitachi, разработали собственное ПО, оптимизированное для контроллеров, используемых в выпускаемых ими продуктах хранения.

Другой особенностью большинства RAID-систем является возможность “горячей” замены диска: жесткий диск, используемый в массиве, можно изъять без остановки работы всего массива. “Горячая” замена возможна только в тех RAID-системах, которые обеспечивают избыточность. Так, в системе RAID0 “горячая” замена невозможна.

RAID7 это массив обеспечивающий очень высокую производительность благодаря мощным распараллеленным вычислениям, высокоскоростному центральному процессору, операционной системе реального времени, “усовершенствованным” методам и алгоритмам кэширования, схемам минимизации задержек при записи данных контроля четности, уникальной технологии управления памятью и асинхронной архитектуре.

Администратору, обдумывающему житье

Предлагаемая шпаргалка поможет выбрать уровень RAID-массивов в соответствии с конкретными требованиями. Обычно системы RAID классифицируют по уровням, обозначающим конкретную технологию, которая используется для обеспечения избыточности и доступности данных, хранимых на жестких дисках. Но Консультативный совет по RAID предложил альтернативную схему классификации, основанную не на разновидностях технологии, а на ее функциональных возможностях. В предложенной системе классификации дисковых массивов за основу взяты признаки, обозначающие способность конкретного решения восстанавливать данные.

Самым главным критерием является устойчивость дисковой системы к сбоям (FRDS - failure-resistant disk system), которая характеризуется следующими признаками:

  • предотвращение потери данных и потери доступа к данным из-за отказа жесткого диска;
  • восстановление содержимого отказавшего диска на диск замены;
  • предотвращение потери данных из-за “пробела при записи”;
  • предотвращение потери данных из-за отказа управляющего компьютера или шины ввода/вывода;
  • предотвращение потери данных из-за отказа одного из компонентов;
  • мониторинг блоков, заменяемых на месте эксплуатации, и индикация отказов.

В соответствии с предложенной схемой классификации дисковых массивов следующим шагом для обеспечения надежности является устойчивость дисковой системы к отказам (FTDS - fault-tolerant disk system). Она аналогична FRDS, но здесь дополнительно учитываются следующие признаки:

  • возможность “горячей” замены дисков;
  • предотвращение потери данных из-за отказа кэша;
  • предотвращение потери данных из-за пропадания внешнего электропитания;
  • предотвращение потери данных из-за выхода значения температуры за пределы допустимого рабочего диапазона;
  • выдача предупреждения об отказе компонента и отклонении параметров окружающей среды;
  • предотвращение потери доступа к данным из-за отказа канала устройства;
  • предотвращение потери доступа к данным из-за отказа контроллера;
  • предотвращение потери доступа к данным из-за отказа кэша;
  • предотвращение потери доступа к данным из-за отказа блока питания.

Наивысшим уровнем в классификации считается устойчивость дисковой системы к авариям. На этом уровне выделяются следующие признаки:

  • предотвращение потери доступа к данным из-за отказов управляющего компьютера или его шины ввода/вывода;
  • предотвращение потери доступа к данным из-за пропадания внешнего электропитания;
  • предотвращение потери доступа к данным в результате замены блоков на месте эксплуатации;
  • “горячая” замена диска;
  • предотвращение потери доступа к данным из-за отказа зоны на диске.

RAID для сетей intranet

Если вашему заказчику для его системы хранения информации в корпоративной intranet-сети потребуется высокий коэффициент доступности данных и их избыточность, то сразу ли придет вам в голову использовать RAID?

Когда крупная финансовая компания захотела создать сеть intranet для улучшения связи со своими филиалами, рассредоточенными по всей территории США, то в качестве одного из главных требований она указала высокую степень доступности данных и их целостность.Вот почему компания-интегратор IwayPC, получившая контракт на создание сети intranet на базе СУБД Microsoft SQL Server, для организации непрерывно доступной системы хранения данных выбрала массивы RAID1 и RAID5. Выбрав технологию RAID, они добились отказоустойчивости. Это решение позволило заказчику сэкономить средства, чего нельзя было достичь при использовании нескольких резервных серверов данных. Поскольку у заказчика уже имелись компьютерные системы, использующие RAID1, необходимо было обеспечить их интеграцию. Специалисты IwayPC применили системы конфигураций RAID1 и RAID5, причем последняя лучше подошла для нужд заказчиков в плане ввода/вывода данных из SQL Server, так как обеспечивает более высокую скорость записи информации на жесткие диски.

Использование RAID5 для SQL Server обеспечило еще одно, хоть и менее очевидное преимущество. SQL Server требует ведения так называемого файла регистрации. Когда для хранения файлов данных используется только один диск, производительность можно повысить, ведя этот файл на другом физическом диске.

Однако часто бывает так, что код драйвера диска, на котором хранятся данные, отличается от кода драйвера диска, на который записывается файл регистрации. Это может снизить общую производительность. RAID-решение, предложенное компанией IwayPC, позволило заказчику избежать этой проблемы.






Яндекс цитирования

 
Copyright ® Acma.Ru 2005 г.