RAID5の障害と復旧
昨日、家に帰ったら、サーバからピーっていうbeep音がしてました。
最初、何の警告音か分からず、しばらく悩む羽目になりました。で、原因が分からずとりあえず再起動(無謀)。そして、起動時のRAIDカードのBIOSメッセージでRAID5アレイが縮退運転していることを知ったわけでした…
とりあえず縮退運転のまま起動。おぉ、ちゃんとRAIDが機能しているな、と感心してばかりもいられないけど、予備のHDDも無いので昨日はそのまま放置。
で、今日、エラーの起きたHDD(5台のうち4台目)を別のPCで調査してみたところ、別に異常も見つからず…きちんと全セクタが読み書き可能でした。
ま、それで、ダメもとでHDDを元に戻してrebuildしてみたら、きちんと終了してしまいました。何だったんだろう。
まぁ、なんか怖いので、予防保守としてこのHDDは交換しておくかなぁ。
ちなみに、縮退運転中の状態:
--------------------------------------------------------------------------------
Adaptec SCSI RAID Controller Command Line Interface
Copyright 1998-2002 Adaptec, Inc. All rights reserved
--------------------------------------------------------------------------------
Executing: open "aac0"
Executing: container list /full=TRUE
Num Total Oth Chunk Scsi Partition Creation System
Label Type Size Ctr Size Usage B:ID:L Offset:Size State RO Lk Task Done% Ent Date Time Files
----- ------ ------ --- ------ ------- ------ ------------- ------- -- -- ------- ------ --- ------ -------- ------
0 RAID-5 1.09TB 64KB Open 0:01:0 64.0KB: 279GB UnProt 0 042407 08:38:26
/dev/aacd0 Data 0:02:0 64.0KB: 279GB UnProt 1 042407 08:38:26
0:03:0 64.0KB: 279GB UnProt 2 042407 08:38:26
0:04:0 64.0KB! 279GB UnProt 3 042407 08:38:26
0:05:0 64.0KB: 279GB UnProt 4 042407 08:38:26
1 Legacy 232GB Open 0:00:0 0.00 B: 232GB 0 000000 00:00:00
/dev/aacd1
Executing: close
rebuild中の状態:
--------------------------------------------------------------------------------
Adaptec SCSI RAID Controller Command Line Interface
Copyright 1998-2002 Adaptec, Inc. All rights reserved
--------------------------------------------------------------------------------
Executing: open "aac0"
Stat:OK!, Task: 100, Func:R5R Ctr: 0, State:RUN 55.2%
Executing: container list /full=TRUE
Num Total Oth Chunk Scsi Partition Creation System
Label Type Size Ctr Size Usage B:ID:L Offset:Size State RO Lk Task Done% Ent Date Time Files
----- ------ ------ --- ------ ------- ------ ------------- ------- -- -- ------- ------ --- ------ -------- ------
0 RAID-5 1.09TB 64KB Open 0:01:0 64.0KB: 279GB UnProt L Rebuild 55% 0 042407 08:38:26
/dev/aacd0 Data 0:02:0 64.0KB: 279GB UnProt L Rebuild 55% 1 042407 08:38:26
0:03:0 64.0KB: 279GB UnProt L Rebuild 55% 2 042407 08:38:26
0:04:0 64.0KB: 279GB UnProt L Rebuild 55% 3 042407 08:38:26
0:05:0 64.0KB: 279GB UnProt L Rebuild 55% 4 042407 08:38:26
1 Legacy 232GB Open 0:00:0 0.00 B: 232GB 0 000000 00:00:00
/dev/aacd1
Executing: close
| 固定リンク
この記事へのコメントは終了しました。
コメント
S.M.A.R.T. 情報を引っ張り出して、エラー回数の履歴とか見れれば、HDD 自体が悪かったのか、その他なのか切り分けできね?
投稿: suisui | 2007年10月21日 (日) 07時36分
それがですね、とりあえずSATA-USB変換アダプタでつないだもので、SMART情報取れなかったんですよ。
すぐにSATA-HDDをつなげられるマシンが無かったのが敗因です。
投稿: きのし | 2007年10月21日 (日) 21時51分