qark.ru

Главная » Статьи » Hardware » Базовая комплектация

Что надёжнее, SSD или HDD?
Краткое содержание статьи: Правда ли, что отсутствие подвижных элементов делает SSD-диски более надёжными? Этот вопрос задают себе многие компьютерные энтузиасты и IT-специалисты, когда возникает вопрос о выборе между SSD и традиционным винчестером. Мы заглянули в дата-центры, где используются SSD-накопители, изучили статистику отказов и пришли к выводу, что с твердотельными накопителями всё обстоит не так хорошо, как думают многие.

Безопасно ли хранить файлы на SSD?

Начнём с предыстории. SSD-накопители вышли на сцену в тот момент, когда компания Intel представила новую архитектуру процессоров Nehalem и одновременно объявила о том, что "узким местом" в новых ПК отныне являются не процессоры, а жёсткие диски, производительность которых, в самом деле, практически не прогрессировала. На форуме для разработчиков (IDF, Intel Developer Forum) 2008 года в Сан-Франциско компания Intel показала первые твердотельные диски и указало на те причины, вследствие которых обычные жёсткие диски снижают производительность системы с новым процессором Core i7. Три года спустя многочисленные тесты серийных SSD подтвердили, что твердотельные накопители действительно раскрывают потенциал новых процессоров, существенно повышая производительность системы.

Но производительность — далеко не единственный показатель для устройства хранения данных. Когда дело доходит до ваших данных, даже самый быстрый накопитель в мире ничего не стоит, если вы не можете быть уверены в том, что он может надёжно хранить информацию.

Данная тема ещё более актуальна сейчас, в связи с массовым переходом к техпроцессу 25 нм. Более тонкий техпроцесс предполагает снижение стоимости производства NAND-памяти, поэтому тенденция закономерна, и даже на 25 нм ячейках процесс не остановится.



За последние два года Intel дважды переходила на более тонкий техпроцесс NAND-памяти для SSD-накопителей: с 34 нм на 25 нм и с 25 нм на 20 нм

Вместе с тем, инженерам всё труднее преодолевать проблемы с памятью, произведённой по технологии 25 нм. Но нынешние покупатели всё ещё могут рассчитывать на лучшую производительность и надёжность новых твердотельных накопителей, по сравнению с предыдущим поколением. Снижение количества циклов перезаписи ячеек, обусловленное переходом на более тонкий техпроцесс, приходится как-то компенсировать.


Тип SSD Гарантированное число циклов перезаписи Общее количество записанных Тбайт (по формуле JEDEC) Ресурс накопителя (10 Гбайт/день, WA = 1,75)
25 нм, 80 Гбайт 3000 68,5 Тбайт 18,7 лет
25 нм, 160 Гбайт 3000 137,1 Тбайт 37,5 лет
34 нм, 80 Гбайт 5000 114,2 Тбайт 31,3 лет
34 нм, 160 Гбайт 5000 228,5 Тбайт 62,6 лет

Таким образом, не нужно переживать по поводу количества циклов перезаписи, которые способен выдержать ваш SSD. Для предыдущего поколения твердотельных накопителей, где применялась NAND-память, изготовленная по 34-нм техпроцессу, гарантированное число циклов перезаписи составляло 5000. Иными словами, вы можете записывать и стирать ячейку NAND 5000 раз до тех пор, пока она не начнёт терять способность сохранять данные. Исходя из того, что среднестатистический пользователь пишет, максимум, 10 Гбайт в день, потребуется примерно 31 год, чтобы диск пришёл в негодность.

Для нового поколения SSD с 25-нм памятью продолжительность жизни диска составляет около 18 лет. Конечно, здесь мы очень упрощаем реальное положение вещей. Такие специфические для SSD проблемы, как усиление записи (write amplification), сжатие данных и сборка мусора могут влиять на реальный результат. Тем не менее, понятно, что нет веских причин сразу после покупки SSD-диска начинать отсчитывать часы до того момента, когда ему придёт конец.

С другой стороны, мы точно знаем, что некоторые SSD-накопители уже пришли в негодность. В этом легко убедиться, изучив данный вопрос на форумах или в отзывах интернет-магазинов. Но проблема в данном случае заключается не в исчерпании ресурса ячеек. Как правило, к выходу диска из строя приводит ошибка прошивки. Нам известны случаи, когда производители настоятельно рекомендуют подвергнуть новый диск перепрошивке, что способствует повышению надёжности, а иногда и заметному улучшению производительности накопителя.

Ещё одна причина выхода из строя SSD связана с электронной начинкой. Конденсатор или чип памяти могут прийти в негодность, что приводит к поломке диска. Конечно, мы ожидаем меньшего количества подобных проблем, по сравнению с обычными HDD, имеющими движущиеся детали, которые неизбежно выходят из строя по истечении определённого времени.

Но правда ли, что отсутствие движущихся деталей делает твердотельный накопитель надёжнее диска на магнитных пластинах? Этот вопрос волнует всё большее число компьютерных энтузиастов и IT-специалистов. Именно он заставил нас проанализировать реальную надёжность SSD, чтобы отделить факты от беллетристики.

Что мы знаем о накопителях?

SSD — относительно новая технология (во всяком случае, по сравнению с жёсткими дисками, возраст которых приближается к 60 годам). Таким образом, нам предстоит сравнить новый тип накопителей с технологией, проверенной временем.

Но что мы реально знаем о надёжности обычных жёстких дисков? На этот вопрос проливают свет два важных академических исследования.

В 2007 году компания Google обнародовала исследование надёжности 100 000 дисков потребительского уровня с интерфейсом PATA и SATA, применявшихся в дата-центрах Google.

Примерно в то же время доктор Бианка Шредер (Bianca Schroeder) совместно с экспертом доктором Гартом Гибсоном (Garth Gibson) провели расчёт частоты замены более 100 000 накопителей, которые применялись в одной из крупнейших национальных лабораторий США.

Разница между этими двумя исследованиями лишь в том, что во втором случае в исследовании участвовали накопители с интерфейсом SCSI и Fibre Channel, а не только PATA и SATA.

Тем, кто хочет более детально ознакомиться с результатами академических изысканий, мы советуем прочитать хотя бы второй — в 2007 году этот аналитический отчет был признан лучшим на конференции File and Storage Technologies (FAST ’07) в США. Если чтение подобных источников не входит в ваши планы, мы приводим здесь ключевые моменты, непосредственно затрагивающие интересующий нас вопрос.

Средняя наработка до отказа (MTTF)

Если речь идёт об измерении надёжности накопителя, можно вспомнить о таких двух показателях, как средняя наработка на отказ (MTBF — Mean Time Between Failures), под которой понимается среднее время между отказами, а также средняя наработка до отказа (MTTF — Mean Time To Failure), ключевым отличием которой является допущение, что после отказа система не может быть восстановлена.

Вот что пишет на этот счет Википедия:
В английском языке используется термин MTBF (Mean Time Between Failures) — среднее время между отказами или наработка на отказ, а также MTTF (Mean Time To Failure) — средняя наработка до отказа. Следует заметить, однако, что публикуемые величины MTBF/MTTF часто основываются на результатах ускоренных испытаний — в течение ограниченного времени, позволяющего выявить преимущественно долю производственного брака. В таком случае, заявленное значение MTBF говорит не столько собственно о надёжности, и тем более не о долговечности, сколько о проценте забракованных изделий. Например, MTBF порядка 1 млн/ч для жёсткого диска, очевидно, не означает 114 лет непрерывной безотказной работы — и не только потому, что эксперимент такой продолжительности не мог быть проведён, но и потому, что сам производитель назначает ресурс (срок службы) не более 5—10 лет и гарантийный срок 1—5 лет.

Рассмотрим в качестве примера накопитель Seagate Barracuda 7200.7, который имеет заявленный показатель наработки на отказ 600 000 часов.

В любой крупной выборке накопителей половина этих дисков выйдет из строя в первые 600 000 часов работы. Так как статистика отказов HDD в крупной выборке распределена относительно равномерно, следует ожидать, например, что каждый час будет выходить из строя один диск. При таком значении MTBF можно расчитать частоту отказов за год (Annualized Failure Rate, AFR), которая составит 1,44%.

Но исследования Google и доктора Бианки Шредер выявили совсем иные показатели. Дело в том, что число вышедших из строя накопителей не всегда соответствует количеству дисков, которые подлежали замене. Вот почему Шредер измеряла не рейтинг отказов (AFR), а интенсивность замены накопителей (Annualized Replacement Rate — ARR). Рейтинг ARR основывается на реальном количестве накопителей, заменённых согласно данным сервисных журналов:

В то время, как значение AFR по даташитам варьируются от 0,58% до 0,88%, наблюдаемые показатели замены дисков ARR составляют от 0,5% до 13,5%. Таким образом, наблюдаемый показатель ARR, в зависимости от конфигурации накопителей и их типа, может быть до 15 раз выше, чем значения AFR в соответствии с даташитами.

Производители жёстких дисков определяют число отказов иначе, чем это делаем мы, а потому не удивляет, что данные, которые они приводят, не соответствуют реальной надёжности накопителей. Обычно рейтинг MTBF определяется на основе ускоренного тестирования, информации о возврате винчестеров или с помощью тестирования отобранных дисков. Данные о возврате накопителей — весьма сомнительная информация. Как утверждает Google, "мы сталкивались... с ситуациями, когда тест накопителей давал "зелёный свет" дискам, которые неизбежно отказывали на практике".

Статистика отказов HDD по времени

Большинство пользователей считает, что график кривой отказа HDD имеет форму ванной. Вначале мы ожидаем, что многие диски выходят из строя вследствие так называемой "детской болезни", то есть различного рода заводских недоработок и непосредственно процесса "обкатки". Затем, по завершении начального периода, процент отказа дисков должен быть минимален. Наконец, в конце предполагаемого срока службы, кривая отказа HDD неотвратимо ползёт вверх, так как детали накопителя имеют определённый ресурс. Подобный ход мысли, который представляется вполне логичным, отражён на следующем графике.

Но этот график не соотвествует реальному положению вещей. Исследования Google и доктора Бианки Шредер показали, что отказы HDD с течением времени стабильно увеличиваются.


Надёжность дисков Enterprise-класса


При сравнении двух исследований можно представить, что показатель 1 000 000 MTBF для диска Cheetah намного ближе к заявленным в даташите MTBF 300 000 часов. Это означает, что накопители "потребительского" и Enterprise-класса имеют примерно одинаковый процент ежегодного выхода из строя, особенно когда сравниваются диски примерно равного объёма. Как утверждает директор по техническому планированию компании NetApp Вал Берцовичи (Val Bercovici), "... то, как дисковые массивы справляются с соответствующими отказами жёстких дисков, продолжает создавать в восприятии потребителя точку зрения, что более дорогие диски должны быть более надёжными. Одна из грязных тайн данной индустрии заключается в том, что большинство дисков Enterprise-класса состоит из тех же компонентов, что и накопители потребительского класса. Тем не менее, их внешние интерфейсы (FC, SCSI, SAS и SATA) и, что более важно, специфические особенности firmware, оказывает наибольшее влияние на поведение дисков потребительского и Enterprise-класса в реальных условиях".

Безопасность данных и RAID

Исследование Шредер охватывает диски Enterprise-класса, задействованные в больших RAID-массивах одной из крупнейших лабораторий по высокопроизводительным вычислениям. Как правило, мы ждём, что хранение данных в RAID-конфигурациях обеспечивает более высокий уровень безопасности, но отчёт Шредер обнаружил нечто удивительное.

Распределение времени между заменами диска показывает снижение частоты отказов, что означает, что ожидаемый промежуток времени до очередной замены диска постепенно увеличивается с тех пор, как был заменён предыдущий диск.

Таким образом, отказ одного накопителя в массиве повышает вероятность отказа другого накопителя. Чем больше времени прошло с последней замены диска, тем больше времени пройдёт до замены другого. Конечно, это имеет последствия с точки зрения реконструкции RAID-массива. После первого отказа в четыре раза возрастает вероятность того, что вы столкнётесь с очередным выходом диска из строя в течение того же часа. В пределах 10 часов вероятность отказа диска увеличивается только в два раза.

Температура



Ещё один неожиданный вывод можно сделать из отчёта Google. Исследователи брали показатели температуры SMART (Self-Monitoring, Analysis and Reporting Technology) – технологии, которую поддерживает большинство жёстких дисков. И обнаружили, что более высокая температура накопителя никак не коррелирует с более высокой частотой отказов. Судя по всему, температура оказывает воздействие на надёжность старых накопителей, но и в этом случае эффект не столь значителен.

Технология SMART — действительно умна?

SMART по-английски означает "умный", но действительно ли данная технология контроля состояния винчестера справляется со своей функцией? Если ответить кратко, то нет. Технология SMART создавалась для того, чтобы сообщать об ошибках диска достаточно рано для того, чтобы вы могли осуществить резервное копирование данных. Однако, согласно отчёту Google, более трети вышедших из строя накопителей не включили режим тревоги SMART.

Данный факт особо не удивляет, так как многие специалисты годами подозревали нечто подобное. В действительности, технология SMART оптимизирована на обнаружение механических неполадок, в то время как основную часть функциональности жёсткого диска обеспечивает электронная начинка. Вот почему некорректная работа HDD и неожиданные проблемы, вроде внезапного отключения питания, остаются незаметными для SMART до тех пор, пока не возникают ошибки, связанные с целостностью данных. Если вы рассчитываете на то, что SMART сообщит вам о грядущем выходе диска из строя, всё равно необходимо обеспечить дополнительный уровень защиты, если вы хотите быть уверены в сохранности данных.

Кратко о надёжности SSD

Отказ диска подразумевает, что устройство больше не функционирует. Но возврат может предполагать множество причин. Это создаёт определённую проблему, ведь у нас нет никакой дополнительной информации по причинам возврата дисков: они могли быть мертвы ещё при поступлении в магазин, сломаться в течении срока эксплуатации или всего лишь имела место некая несовместимость с железом, помешавшая покупателю использовать накопитель.


Продажи между 10.1.2009 и 4.1.2010, возвраты до 10.1.2010
Top-3 лидеров возврата SSD Статистика возвратов Top-3 лидеров возврата HDD Статистика возвратов
OCZ Vertex 2 90 Гбайт 2,80% Seagate Barracuda 7200.11 160 Гбайт 8,62%
OCZ Agility 2 120 Гбайт 2,66% Samsung SpinPoint F1 1 Tбайт 4,48%
OCZ Agility 2 90 Гбайт 1,83% Hitachi Deskstar 7K2000 3,41%
Продажи между 4.1.2010 и 10.1.2010, возвраты до 4.1.2011
OCZ Agility 2 120 Гбайт 6,70% Seagate Barracuda 7200.11 160 Гбайт 16,00%
OCZ Agility 2 60 Гбайт 3,70% Hitachi Deskstar 7K2000 2 Tбайт 4,20%
OCZ Agility 2 40 Гбайт 3,60% WD Caviar Black WD2001FASS 4,00%

Эта информация лишь преумножает количество вопросов. Если основная часть продаж осуществлялась через интернет-магазин, то существенное влияние на статистику отказов могла оказать плохая упаковка или повреждения в ходе доставки. Более того, мы также не имеем никакой возможности выяснить, как покупатели использовали эти диски. Существенный разброс в частоте отказов лишь подчёркивает данную проблему. Например, число возвратов для Seagate Barracuda LP увеличилось с 2,1% до 4,1%, в то время как для Western Digital Caviar Green WD10EARS она упала с 2,4% до 1,2%.

Так или иначе, эти данные действительно ничего не говорят нам о надёжности. Но для чего, в таком случае, они вообще нужны? Вывод заключается лишь в том, что во Франции большинство покупателей были более чем удовлетворены покупкой Intel SSD и не возвращали их, в отличие от накопителей других брендов. Удовлетворение потребителя – тема интересная, но она намного менее интересна, чем реальная частота отказов. Так что продолжим наш анализ.

Отзывы дата-центров

Стоимость за гигабайт продолжает оставаться барьером, мешающим даже крупным организациям использовать тысячи SSD одновременно. Но даже с учётом того, что мы не имеем доступа к полноценным массивам твердотельных накопителей, не означает, что мы не можем осветить вопрос надёжности SSD в реальных условиях, основываясь на опыте небольших организаций. Мы решили связаться с нашими знакомыми, работающими в сфере IT, и получили довольно интересные отзывы нескольких дата-центров.

NoSupportLinuxHosting.com: меньше 100 SSD



Зеркалирование загрузочного раздела на основе двух SSD-дисков Intel X25-V

Хостинг "No Support Linux" не приводит точное число установленных накопителей, но компания сообщает, что использует "немалое количество" SSD. Мы знаем, что они применяют менее сотни твердотельных дисков, которые задействованы следующим образом:

  • Intel X25-V объёмом 40 Гбайт используются как зеркалируемые загрузочные диски для тонких серверов и серверов хранения данных ZFS;
  • Intel X25-M объёмом 160 Гбайт используются в качестве кэша L2ARC в серверах ZFS;
  • Intel X25-E объёмом 32 Гбайт используются как зеркалируемые ZIL-тома в серверах ZFS.

Все эти диски используются не менее одного года, а некоторым из них недавно исполнилось два года. С учётом сказанного необходимо отметить, что компания не сталкивалась ни с одним фактом выхода из строя SSD-накопителя.

Когда мы спросили, какие преимущества даёт применение твердотельных дисков в серверах, мы получили следующий ответ:

В сочетании с ZFS и гибридными системами хранения, применение SSD-накопителей позволяет получить существенный прирост производительности, по сравнению с традиционными дисками на магнитных пластинах. Мы по-прежнему используем жёсткие диски в качестве основного хранилища, так что мы можем сохранить их преимущество в цене, одновременно извлекая преимущество от SSD по скорости. Рано или поздно, мы планируем полностью перевести наши сервера SAN на SSD-накопители. Но в течение 2011 году мы будем придерживаться гибридной системы хранения, используя ZFS.

InterServer.net

InterServer использует твердотельные диски лишь на серверах баз данных. В частности, на серверах с процессором Xeon используются накопители Intel X25-E (SSDSA2SH032G1GN), что позволяет извлечь максимальный результат от высокой пропускной способности накопителя. О каких значениях производительности здесь идёт речь? InterServer говорит нам о достижении 4514 запросов в секунду для сервера MySQL. На старом сервере Xeon, оснащённом IDE-винчестерами, количество запросов MySQL в секунду составляет 200-300. Нам известно, что твердотельные диски применяются в InterServer с 2009 года и с тех пор не было ни одного выхода диска из строя.

Итак, компания InterServer сообщила нам следующую информацию в контексте использования SSD:

Intel SSD — день и ночь в отношении надёжности, когда речь заходит о сравнении с некоторыми другими накопителями. Например, диски SuperTalent SSD имеют весьма высокий показатель отказов, включая модели FTM32GL25H, FTM32G225H и FTM32GX25H. По нашим оценкам, около двух третей этих дисков вышли из строя с начала эксплуатации. Причём, после выхода из строя информацию с этих дисков практически нельзя было восстановить. То есть накопитель просто исчезал из системы и его больше невозможно было прочитать. Жёсткие диски "умирают" более благородно и в большинстве случаев информацию с них легко восстановить. Но мы не можем сравнить их с Intel SSD, так как до сих пор ещё не сталкивались с выходом из строя последних.

Steadfast Networks: более 100 SSD

Steadfast Networks применяет около 150 SSD Intel, что делает данную компанию несколько более крупным пользователем SSD, чем две предыдущие. Применяются модели линейки X25-E (32 Гбайт и 64 Гбайт) и X25-M (80 Гбайт и 160 Гбайт). В меньшем количестве представлены накопители Intel X25-V40 объёмом Гбайт, а также установленные клиентами компании твердотельные диски других марок, такие как OCZ Vertex 2, SuperTalent и MTron Pro. Независимо от марки, все эти SSD применяются только в серверах баз данных либо в качестве кэша.



Steadfast Networks — почти 150 SSD в работе

За два года использования твердотельных накопителей Steadfast Networks лишь дважды имела опыт отказа дисков, потребовавших их замены, причём оба случая привели к необходимости восстановления данных с SSD. Возможность восстановления данных с вышедшего из строя твердотельного диска зависит от взаимодействия между контроллером и firmware. Сценарий, описанный представителем InterServer относительно дисков SuperTalent, является худшим из возможных — данные вообще не удалось восстановить. Но этот случай не является общим правилом для SSD.


Тип Количество Средний показатель AFR Текущий срок жизни диска
SSD около 150 1,60% 2+
HDD около 2800 5% 6+

Имея большую выборку, мы, наконец, нашли случаи отказов SSD. Но по сравнению с накопителями на магнитных пластинах их процент по-прежнему достаточно низок. Тем не менее, президент компании Steadfast Networks Карл Циммерман (Karl Zimmerman) считает, что это всё же занижает преимущества SSD и поясняет это следующим образом:

Просто мы получаем заметно более высокую производительность операций ввода/вывода [при использовании SSD] по меньшей цене, чем могли бы получить то же самое, используя обычные жёсткие диски. У нас много клиентов, которым нужна большая производительность I/O, чем могут дать четыре SAS-диска со скоростью вращения шпинделя 15 000 об/мин в конфигурации RAID 10, не говоря уже о том, что сам по себе подобный апгрейд требует перехода на сервера с большим шасси, поддерживающим более четырёх дисков, оснащённые крупной платой RAID и т. д. Другим конфигурациям необходимо больше 16 дисков со скоростью шпинделя 15 000 об/мин, чтобы обеспечить требуемый уровень производительности операций I/O. Переход на один SSD (или пары штук в RAID-конфигурации) значительно упрощает конфигурацию сервера и, в целом, делает её ощутимо дешевле. Достаточно сказать лишь о том, что обычно достаточно одного SSD, чтобы заменить не меньше четырёх жёстких дисков, причём показатель AFR для четырёх HDD составляет около 20%, в то время как для одного SSD он равен 1,6%.

Softlayer: около 5000 SSD!



Softlayer: свыше 1000 SSD!

Люди из Softlayer — наши давние друзья, а ещё они создали крупнейшую в мире хостинг-компанию. Так что, о хранении данных они знают немало. Используя около 5000 SSD-накопителей, они предоставили нам впечатляющий объём данных для анализа. Вот отчёт, предоставленный компанией Softlayer.


Накопитель Число дисков в компании Рейтинг AFR Текущий срок жизни диска
Intel 64 GB X25-E (SLC) 3586 2,19% 2
Intel 32 GB X25-E (SLC) 1340 1,28% 2
Intel 160 GB X25-M (MLC) 11 0% менее 1
HDD-накопители 117 989 см. отчет Шредер

Опыт Softlayer в отношении частоты отказов дисков SAS и SATA соотвествует отчёту Google, о которым мы говорили в начале данной статьи. Проще говоря, частота выхода из строя жёстких дисков прямо пропорциональна возрасту накопителя и на практике результаты очень близки к тому, что доказали исследования Google и Шрёдер. В первом году жизни процент отказов накопителей (AFR) составляет 0,5-1% и постепенно возрастает до 5-7% к пятому году жизни.

Частота выхода из строя жёстких дисков не удивляет, но показатель выхода из строя твердотельных накопителей оказался достаточно близок к результатам AFR по HDD. Конечно, SSD-диски эксплуатируются пока всего два года и нужно подождать, пока пройдёт 3-4 года с начала эксплуатации, чтобы узнать, сохранится или нет в отношении к SSD-дискам тенденция увеличения частоты отказов, характерная для магнитных накопителей.


Softlayer использует почти полностью SSD-накопители на основе SLC-памяти, чтобы избежать проблем с износом ячеек при многократных операциях перезаписи. Если основываться на сценариях использования компанией накопителей, то мы знаем, что ни один из дисков не вышел из строя по причине износа ячеек. Но многие из отказавших SSD вышли из строя без соответствующего предупреждения SMART. Это именно то, о чём мы уже неоднократно слышали от сотрудников дата-центров. Как отмечали специалисты компании InterServer, жёсткие диски имеют склонность выходить из строя более "благородно". SSD зачастую "умирают" внезапно, независимо от причины поломки, что отмечают многие конечные пользователи по всему миру. Опыт Softlayer более разнообразный, по сравнению с InterServer: некоторые накопители удалось восстановить, а другие — нет. Ни один из 11 накопителей Intel серии X25-M в Softlayer не вышел из строя, но дисков этой линейки слишком мало, чтобы на основе этого делать какие-либо выводы, да и эксплуатируются они менее года.

Так ли важна надёжность накопителя?

Несмотря на то, что твердотельные диски на SLC-памяти занимают всего лишь часть рынка SSD, мы получили намного больше информации по данному типу накопителей, чем по моделям, в которых используется более дешёвая память типа MLC. Даже с учётом того, что выборка накопителей в нашем обзоре составляет 1/20 от количества жёстких дисков в предыдущих обзорах, имеющаяся информация позволяет считать, что твердотельные диски на SLC-памяти нельзя назвать более надёжными, чем жёсткие диски с интерфейсом SAS и SATA.

Если вы потребитель, данный факт позволяет сделать важные выводы. Производители SSD пытаются акцентировать внимание на двух основных преимуществах данной технологии: лучшей производительности и надёжности. Однако, если хранить данные на SSD не более безопасно, чем на обычном жёстком диске, то производительность становится единственной реальной причиной для приобретения твердотельного диска.


Мы не утверждаем здесь, что производительность SSD не важна (или не впечатляет). Тем не менее, сама по себе технология SSD в данный момент имеет узкую специфику. Если бы вы собрались противопоставить твердотельные накопители против жёстких дисков по скоростным характеристикам, то обнаружили бы интересный факт: по производительности SSD-накопитель бюджетного класса превосходит HDD примерно на 85%. Твердотельный диск класса Hi-End обеспечивает преимущество над жёстким диском на 88%, что также не слишком впечатляет.

Эта достаточно тонкая разница объясняет, почему такие компании, как Intel, акцентируют внимание именно на надёжности твердотельных накопителей. На недавней презентации новой линейки SSD 320 компания Intel вновь попыталась обыграть этот мотив, используя информацию по возвратам дисков с сайта Hardware.fr в качестве доказательства надёжности своих изделий. Несомненно, именно отличная репутация SSD-накопителей Intel является ответом на вопрос, почему у нас так много информации по твердотельным дискам данной марки. Но данные Hardware.fr, которые приводит Intel, похоже, не соотвествуют реальному положению вещей.


Производительность SSD-накопителей будет лишь расти, в то время как наиболее продвинутые производители будут снижать стоимость таких дисков. Вместе с тем, это означает, что производителям придётся искать иные способы дифференцировать свои изделия.

До тех пор, пока в новых SSD - даже hi-end класса - продолжают выявляться явные баги с прошивками и прочие недоработки, потребители, заинтересованные, в первую очередь, в надёжности хранения данных, будут рассматривать технологию SSD как недостаточно зрелую. Поэтому мы полагаем, что на сегодняшний день именно надёжность должна стать основной мишенью эволюции SSD.

Intel дал потребителям серьёзный запас уверенности, несколько месяцев назад подняв срок фирменной гарантии для новой линейки SSD 320 с трёх до пяти лет. Конкурирующие модели SSD mainstream-класса, основанные на контроллерах SandForse первого и второго поколения, а также контроллере Marvell с интерфейсом SATA 6 Гбит/с, продолжают продаваться с трёхлетней гарантией. Накопители Enterprise-класса также, в основном, поставляются с пятилетней гарантией. Понятно, что это стимулирует вендоров продавать системы, оснащённые более надёжными накопителями, чтобы снизить расходы на гарантийное обслуживание в течение трёх или пяти лет. Но, конечно, трудно закрыть глаза на "детские болезни" технологии SSD, вроде необходимости обновления прошивки, которые, по большому счёту, затрагивают и производительность твердотельных накопителей.

Пояснения к вопросу о надёжности

Жёсткие диски и накопители на основе NAND-памяти иногда выходят из строя и это связано с различными факторами, обусловленными их уникальной архитектурой и конструкцией. Когда мы говорим о надёжности жёстких дисков, на ум приходит тот факт, что они основаны на механических деталях, часть из которых во время работы диска находится в движении. И хотя конструктивно жёсткие диски соответствуют очень строгим допускам, тем не менее, каждая деталь имеет определённый срок службы.

Мы также знаем, что SSD-накопители лишены подобных проблем. Их "твердотельная" природа в принципе исключает риск повреждения считывающей головки или выхода из строя шпинделя.

Но хранение данных на SSD неотъемлемо связано с виртуализацией, так как здесь нельзя физически разметить статическое LBA-пространство, как на жёстком диске. Поэтому возникают другие факторы, определяющие надёжность накопителя. Прошивка — это самый существенный из них, мы видим воздействие данного фактора всякий раз, когда слышим о неполадках в работе SSD.

За последние три года все баги в SSD-накопителях Intel всегда решались обновлением прошивки. Проблемы Crucial с управлением энергосбережением модели m4 были решены выходом новой прошивки. И мы видели, что самый известный партнёр SandForce, — компания OCZ — ответила на многочисленные жалобы потребителей выходом сразу нескольких прошивок. Фактически, случай SandForce наиболее показателен. Поскольку производители SSD-дисков могут использовать различные прошивки в качестве средства дифференциации моделей, диски на основе контроллеров SandForce от разных производителей, очевидно, могут иметь различные баги, свойственные конкретной прошивке. Данный факт, несомненно, только усложняет задачу повышения надёжности твердотельных накопителей.

Если оставить специфику SSD в стороне, то теперь нам необходимо определить надёжность дисков различных производителей. Проблема здесь заключается в том, что способы, при помощи которых каждый вендор, реселлер или потребитель измеряет данный показатель, несколько различается, что делает объективное сравнение практически невозможным.


В частности, мы были очень впечатлены презентацией SSD-накопителей Intel на IDF 2011, где акцентировалось внимание на надёжности. Но в дискуссии с компанией ZT Systems, данные которой приводила Intel, мы выяснили, что в приводимом рейтинге AFR 0,26% не учитывается количество накопителей и речь идёт лишь об "подтверждённых" ошибках. На самом деле, если вы — IT-менеджер, то для вас важна и частота "незарегистрированных" ошибок. Речь идёт о ситуациях, когда вы отсылаете дефектное изделие продавцу, а он отвечает, что с диском всё в порядке. Это не означает, что диск свободен от неполадок, так как причина могла заключаться в конкретной конфигурации либо иных прикладных факторах. На самом деле, существует немало реальных примеров такого рода.

"Незарегистрированные" ошибки, как правило, случаются в 2-3 раза чаще, чем "утверждённые". На самом деле, компания ZT System приводит другие данные по частоте "неутверждённых" ошибок — 0,43% для 155 000 накопителей Intel X25-M. Но мы снова сталкиваемся с тем фактом, что эти данные не отсортированы по сроку службы накопителей, так как диски рассматриваются в группах. Согласно техническому директору ZT System Кейси Черетани (Casey Cerretani), конечная величина в данный момент лишь рассчитывается, но примерно мы можем говорить о показателе AFR 0,7% в первый год эксплуатации. Конечно, этот показатель по-прежнему ничего не значит с точки зрения надёжности в долгосрочной перспективе, что является одной из главных проблем при оценке надёжности твердотельных накопителей в сравнении с HDD.

Основной вывод состоит в том, что теперь мы знаем, какое влияние различные методы оценки надёжности накопителей оказывают на конечный результат. Более того, лишь время покажет, насколько надёжность SSD-накопителей превосходит соответствующий показатель для HDD. Зато теперь вы точно знаете, что сейчас какой-либо однозначный вывод сделать невозможно, так как очень много исходных данных вызывают сомнения.

В качестве заключения

Наш отчёт по дата-центрам охватывает только частоту выхода из строя SSD Intel, так как накопители именно этого производителя в настоящий момент пользуются наибольшим доверием у крупных предприятий. Учитывая проблемы с определением надёжности SSD, мы преднамеренно не ставим задачу найти самого надёжного производителя, но сотрудники отдела маркетинга Intel, судя по всему, не зря получают свою зарплату.

В исследовании Google отмечается следующее: "Известно, что частота отказов в значительной мере зависит от модели, производителя и возраста диска. Наши данные не противоречат этому факту. Но большинство отмечаемых со временем сбоев связаны именно с возрастом диска".

Опыт, о котором мы узнали от дата-центров, применим ко всем SSD. Один из директоров предприятий сообщил нам, что считает цену OCZ Vertex 2 замечательной, но их надёжность — ужасной. В конце прошлого года его компания запускала некую новую систему, по случаю чего было закуплено около 200 накопителей Vertex 2, 20 из которых не работали по прибытию. И это не первый человек, который рассказывает нечто подобное.

Что на практике это значит для SSD?

Давайте взглянем на всё изложенное здесь в некой рациональной перспективе. Вот что мы узнали о надёжности жёстких дисков из исследований Google и Шрёдер:

  1. MTBF ничего не говорит о надёжности;
  2. Ежегодная частота отказов (AFR) выше, чем заявляет производитель;
  3. Диски не имеют тенденцию выходить из строя в первый год эксплуатации. Частота отказов постепенно увеличивается с возрастом диска;
  4. SMART не является надёжной системой, определяющей скорый выход диска из строя;
  5. Частота отказов "потребительских" дисков и накопителей "enterprise"-класса очень близка;
  6. Отказ одного диска в массиве увеличивает риск подобного поведения других дисков;
  7. Температура почти не оказывает влияния на надёжность накопителя.

Благодаря Softlayer с их парком SSD в 5000 штук, мы знаем, что первые четыре утверждения также применимы к SSD. Как мы видели в обоих исследованиях HDD, существенно влияние на их надёжность оказывает контроллер, прошивка и интерфейс (SAS против SATA). Для SSD-дисков основными факторами также являются контроллер и прошивка, причём их роль даже выше. Если правда, что износ ячеек из-за многократных операций перезаписи не играет никакой роли в статистике отказов SSD-накопителей и качество применяемой в "потребительских" дисках MCL-памяти сравнимо с SLC, напрашивается вывод, что твердотельные диски Enterprise-класса, в целом, не надёжнее "потребительских".

Меньше дисков — выше надёжность

Конечно, для систем хранения данных корпоративного класса важна не только надёжность, но и производительность. Чтобы достичь высокой производительности операций ввода/вывода, IT-специалистам приходится создавать RAID-массивы на основе жёстких дисков со скоростью шпинделя 15 000 об/мин. Нередко апгрейд для увеличения количества операций I/O приводит к покупке нового сервера, оснащённого более мощной RAID-платой и позволяющего установить больше накопителей. Учитывая превосходные характеристики I/O для твердотельных дисков, в случае их использования можно было бы ограничиться намного более скромной конфигурацией сервера, не говоря об экономии энергии и снижении температуры.

Здесь есть ещё один интересный момент.
Частота выхода из строя отдельных дисков для большого массива будет выше: по данным исследования Шредер, после отказа одного диска в массиве возрастает вероятность выхода из строя других дисков. Кроме того, существенно выше будет вероятность отказа одного из дисков в массиве, так как здесь начинает играть роль математический фактор.

В данном случае мы не поднимаем тему сохранности данных, что зависит от уровня RAID и других факторов. Понятно, что с точки зрения сохранности данных один SSD не заменит два зеркалируемых HDD, несмотря на то, что вероятность выхода из строя для него будет ниже, чем для одного из дисков в системе. Однако, если речь идёт о крупной RAID-системе, то достаточно очевидно, что надёжнее иметь конфигурацию на четырёх SSD-дисках, чем сравнимую по скорости систему на 16 HDD.

Сам факт использования SSD не снимает необходимости избыточности данных для RAID либо резервного копирования. Но вместо того, чтобы создавать громоздкие RAID-конфигурации на HDD, можно ограничиться значительно более простым решением на основе твердотельных дисков. Как пишет Робин Харрис на сайте StorageMojo: "Забудьте RAID, просто копируйте данные три раза".

Избыточность хранения данных на SSD не приводит к высокой стоимости. Если вы работаете в среднем и крупном бизнесе, вам нужно лишь скопировать информацию с производительного SSD-диска на HDD, который служит для резервного копирования.

Идея получить более высокую производительность, потратив меньше денег, не нова. SSD-диски в самом деле позволяют получить чрезвычайно высокое количество операций ввода/вывода, высокую надёжность и обеспечить избыточность хранения данных — причём цена такого решения будет ниже, чем в случае громоздкой RAID-конфигурации. Вместе с тем, массив на HDD может превосходить свой аналог на SSD в плане объёма дискового пространства. На сегодняшний день, цена за гигабайт для твердотельных дисков всё ещё слишком высока и к вопросу размещения данных на SSD следует подойти с умом, ведь хранить на них все данные вряд ли получится.

О том же для десктопов

Всё вышесказанное относится к серверам. Возложим ответственность за принятие решения о переходе или не переходе на SSD на сотрудников дата-центров.

Если же разговор заходит о десктопных системах, то мы не имеем оснований предполагать, что SSD надёжнее жёстких дисков. Так или иначе, недавние события с отзывами SSD-дисков и багами в прошивках достаточно ярко показали, что ограниченное число циклов перезаписи ячеек NAND на данный момент является далеко не основным недостатком технологии.

В конце концов, любой накопитель представляет собой электронное устройство, независимо от того, есть ли там движущихся детали или нет. И тот факт, что твердотельные диски не имеют таких деталей, в полной мере не говорит об их надёжности.

Мы задали вопрос специалистам из CMRR (Center for Magnetic Recording Research) — научного центра, располагающего исчерпывающей информацией о системах хранения данных на магнитных носителях.

Доктор Гордон Хьюз (Gordon Hughes), один из основных разработчиков технологий SMART и Secure Erase, отмечает, что и HDD, и SSD в своей эволюции расширяют границы соответствующих технологий. И когда это происходит, не ставится цели создать самые надёжные накопители в мире.

Как отмечает доктор Стив Свансон (Steve Swanson), исследующий NAND-память: "Не похоже на то, чтобы производители делали свои диски столь надёжными, как они могут делать. Они делают диски настолько надёжными, насколько это целесообразно с точки зрения финансовых затрат". Рынок определяет стоимость компонентов накопителя и она не может быть выше определённой величины.

Так, например, производители NAND-памяти продолжают выпуск 50-нм чипов, обладающих более высоким ресурсом циклов перезаписи, чем 34-нм и 25-нм чипы. Но стоимость $7-8 за гигабайт не позволит использовать такие модули в накопителях, ориентированных на массовый рынок.


Возможно, самое большое раздражение вызывает тот факт, что каждый вендор продаёт жёсткие диски и SSD, не представляя объективных данных об их надёжности, хотя все они определенно знают об истинном положении вещей, продавая миллионы устройств в год (по данным IDC, в 2009 году продано 11 миллионов SSD) и фиксируя каждый возврат.

Несомненно, частота поломок зависит от многих факторов, часть из которых находится вне компетенции производителя (качество доставки, специфика эксплуатации накопителя). Но при благоприятном стечении обстоятельств HDD достигают 3% AFR на пятый год эксплуатации, что вполне сравнимо с аналогичным показателем для SSD. Не удивительно, что специалисты из CMRR говорят о том, что на сегодня SSD не обеспечивают более высокую надёжность, по сравнению с жёсткими дисками.

Надёжность накопителей — чувствительная тема и мы потратили немало времени, общаясь с вендорами и ритейлерами, стремясь провести собственное исследование SSD, предназначенных для массового рынка. И единственный вывод, который можно сделать прямо сейчас, заключается в том, что к любой информации от производителя SSD необходимо относиться с определённой долей скептицизма.

Стоит отметить, что SSD Intel на сегодняшний день пользуются максимальным доверием у потребителей и информация от дета-центров неизменно основывается на SLC-накопителях этой марки как "золотом стандарте" для SSD. Но согласно доктору Хьюзу, нет никаких оснований полагать, что продукты Intel более надёжны, чем лучшие модели HDD. У нас нет возможности исследовать интенсивность отказов SSD, находящихся в эксплуатации более двух лет, поэтому вполне возможно, что эта статистика изменится в ту или иную сторону.

Стоит ли сейчас воздерживаться от покупки SSD? Если вы защищаете свои данные регулярно делая резервные копии файлов, то нет никаких причин избегать использования твердотельных накопителей. Например, мы применяем SSD на всех наших тестовых платформах и в большинстве рабочих станций.

Цель данного обзора состояла в том, чтобы определиться, действительно ли SSD так надёжны, что о резервном копировании хранимой на них информации можно забыть как о пережитке прошлого. Теперь мы знаем ответ на этот вопрос.

Надёжность жёстких дисков хорошо изучена в массивных исследованиях и это не удивительно, так как этот тип накопителей используется уже очень давно. Со временем мы, несомненно, узнаем значительно больше о надёжности SSD.

Категория: Базовая комплектация | Добавил: disco (28 Августа 2013)
Просмотров: 1510 | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *: