ブログ本文検索
検索エンジン
新着日記
ナノ半導体 (07/04)
intel (06/26)
Windows10サポート終了まであと4か月 (06/15)
USB Power Delivery (06/06)
Vol.93 Duran Duran - Evil Woman (05/12) カテゴリー
カレンダー
年月分類
ユーザプロフ
システム
|
2015-06-20 Sat [ 技術屋の独り言 ]
by su
方々からメールをいただき感謝しております。RAID5に踏み込んだ記事が読みたいと意見を頂いたので。 RAIDとは…についてはWIKIなどを参照してください。 RAID5の一番の問題点は、商品の案内に書かれることのない。 重大な注意点があるということです。RAID5の案内文句は、 ・3~4台のうち1台のHDDが壊れてもデータは消えない。 ・壊れた1台のHDDに差替により、次の故障に備えられる。 ・RAID1よりRAID5の方がHDDの容量を有効に利用できる。 決して書かれることのない重大な注意点 ・RAID(5)がバックアップの代わりにはならない。 ・2台目が壊れた時点で全てのデータが失われます。 ・2台目が壊れれば残りが正常でも、データは全消失です。 これを見て2台も壊れないんでは?と思う所が問題点で、 可能性は低そうに見えますが、実は、からくりがあります。 RAIDにはRAIDシステムを制御するコントローラがあります。 HDDの故障とは、コントローラからみたHDDの物理的故障です。 HDDが故障しても、それがRAIDコントローラから物理的故障と 判断出来なければ故障にはなりません。これが肝です。 RAIDコントローラは、HDDからデータの書き込みや 読み出しがうまく行かなくなった時に故障と判断します。 HDDはアナログ製品(後述)なので、よく読み書きに失敗します。 失敗すると、リトライし何度か読み書きを再挑戦します。 数回リトライしても失敗してしまう時、故障したと判断します。 HDDは、元々IBM3380と呼ばれるもので1980年に開発された。 高速化に伴う改良はあったものの機構は1980年のままである。 HDDにデータを書き込む最大の利点は、一度書かれたデータを 待機電力なしで半永久的に保管可能であることです。 書き込まれた内容に変更がなければ、不要アクセスはしません。 コントローラが、たまたま破損箇所を読み書きしない限り、 故障には絶対気づけません。OSはHDD単体の場合に限り、 基板上のS.M.A.R.T.からエラーを検知し事前対策できるが、 RAIDを組むとOSからはS.M.A.R.T.なんか全く読めません。 ここまでIT技術者は反論無いと思います。 よって、RAIDコントローラが1台のHDDの故障に気づくとき、 他HDDは既に複数箇所に破損があってもおかしくありません。 NASやServerは同時期に使われ始めた同じHDDが搭載されます。 全てが同じ環境で使われ、同じよう消耗していきます。 RAIDコントローラが気付かなければHDDは正常と判断されます。 その時まではあくまで正常なHDDとして扱われます。 私が出張した先でRAID5でデータ完全ロストは2度あります。 では、その完全ロストはいつ起きるのか? RAID5のリビルドのときに発生します。 RAID5で2台のHDDが壊れるとデータが全て消失してしますが、 1台のみなら、残2台から壊れた1台分のデータを復元できます。 この復元作業をリビルドと言います。 1台のHDDが壊れ新HDDを取り付け起動させ、リビルドしろと命令すると Serverは次のHDDの故障に備えるためにリビルドを開始します。 ここで思い返してください。 他HDDにも破損箇所が隠れている可能性があります。 RAIDのリビルドの際は全てのデータに総アクセスしますから、 1カ所でもHDD損傷や破損が隠れていれば次のHDDも死亡します。 通常RAID5でSATA 500GBのリビルドには、20時間ほどかかります。 寝て起きたら、データ全損失してる場合もあるわけです。 http://jp.fujitsu.com/platform/server/primergy/hdd_construct/note04.html 500GBで20時間なら、主流の2TBで80時間、3TBで120時間、 故障したHDDと同程度稼動していた他のHDDを20時間や80時間、 120時間も連続で読み込み動作させることがどのくらい危険かは 個人主観にもよりますが、私なら恐ろしくて絶対出来ません。 かといって、継続使用ならリビルドしない訳にもいかない。 リビルドしなければ次HDDが故障した時点で全データが消えます。 他HDDに破損があれば、アクセスした時点でもデータは全ロスト、 2台の内、1台でも故障したら全てのデータが消えるのですから、 普通のPCが通常利用するHDDを1台だけ使うより低い信頼性です。 RAID5の本当の恐怖はここで、 「リビルド中にbad blockに遭遇して完全終了」というところ。 これを防ぐため、マトモなRAID5には「Patrol Read」がありますが、 ONにすると、アクセス速度は完全にRAID1以下に陥り意味が無く、 更には、「Patrol Read」はHDDの耐久性を著しく下げる作業です。 ぶっちゃけこれがONになってるRAID5は見たことが無い。 たまたま、他のHDDが運よく無事で完全復帰を遂げるか、 隠れた破損があって全てのデータが消えるか、二つに一つです。 自社にサーバ管理者がいない場合、RAID5はお勧めしません。 会社にサーバ管理者がいて、IT知識が兼ね備わっている場合、 間違ってもその管理者はRAID5システムにしないと思います。 RAID5がRAID1より良いとされるのは、RAID5ではなくRAID5+1です。 もう一度やります。今回はあくまでHDDの障害です。 次、RAIDコントローラの障害についてやります。
| 23:27 | comments (x) | △ |
|
---|
御室技術 |
企業情報お問い合わせ |
関連事業 |
トピックスリンク |
Copyright © 2010 - 2013 OmuroGijyutsu Co.,Ltd. All Rights Reserved.