« ケーブルの巻き方 | トップページ | RAIDコントローラ死亡? »

2007年10月20日 (土)

RAID5の障害と復旧

昨日、家に帰ったら、サーバからピーっていうbeep音がしてました。

最初、何の警告音か分からず、しばらく悩む羽目になりました。で、原因が分からずとりあえず再起動(無謀)。そして、起動時のRAIDカードのBIOSメッセージでRAID5アレイが縮退運転していることを知ったわけでした…

とりあえず縮退運転のまま起動。おぉ、ちゃんとRAIDが機能しているな、と感心してばかりもいられないけど、予備のHDDも無いので昨日はそのまま放置。

で、今日、エラーの起きたHDD(5台のうち4台目)を別のPCで調査してみたところ、別に異常も見つからず…きちんと全セクタが読み書き可能でした。

ま、それで、ダメもとでHDDを元に戻してrebuildしてみたら、きちんと終了してしまいました。何だったんだろう。

まぁ、なんか怖いので、予防保守としてこのHDDは交換しておくかなぁ。

ちなみに、縮退運転中の状態:
--------------------------------------------------------------------------------
Adaptec SCSI RAID Controller Command Line Interface
Copyright 1998-2002 Adaptec, Inc. All rights reserved
--------------------------------------------------------------------------------

Executing: open "aac0"

Executing: container list /full=TRUE
Num          Total  Oth Chunk          Scsi   Partition                                      Creation        System
Label Type   Size   Ctr Size   Usage   B:ID:L Offset:Size   State   RO Lk Task    Done%  Ent Date   Time      Files
----- ------ ------ --- ------ ------- ------ ------------- ------- -- -- ------- ------ --- ------ -------- ------
0    RAID-5 1.09TB       64KB Open    0:01:0 64.0KB: 279GB UnProt                        0  042407 08:38:26       
/dev/aacd0           Data             0:02:0 64.0KB: 279GB UnProt                        1  042407 08:38:26       
                                       0:03:0 64.0KB: 279GB UnProt                        2  042407 08:38:26       
                                       0:04:0 64.0KB! 279GB UnProt                        3  042407 08:38:26       
                                       0:05:0 64.0KB: 279GB UnProt                        4  042407 08:38:26       

1    Legacy  232GB            Open    0:00:0 0.00 B: 232GB                               0  000000 00:00:00       
/dev/aacd1          



Executing: close

rebuild中の状態:
--------------------------------------------------------------------------------
Adaptec SCSI RAID Controller Command Line Interface
Copyright 1998-2002 Adaptec, Inc. All rights reserved
--------------------------------------------------------------------------------

Executing: open "aac0"
Stat:OK!, Task: 100, Func:R5R Ctr: 0, State:RUN  55.2%

Executing: container list /full=TRUE
Num          Total  Oth Chunk          Scsi   Partition                                      Creation        System
Label Type   Size   Ctr Size   Usage   B:ID:L Offset:Size   State   RO Lk Task    Done%  Ent Date   Time      Files
----- ------ ------ --- ------ ------- ------ ------------- ------- -- -- ------- ------ --- ------ -------- ------
0    RAID-5 1.09TB       64KB Open    0:01:0 64.0KB: 279GB UnProt     L  Rebuild  55%    0  042407 08:38:26       
/dev/aacd0           Data             0:02:0 64.0KB: 279GB UnProt     L  Rebuild  55%    1  042407 08:38:26       
                                       0:03:0 64.0KB: 279GB UnProt     L  Rebuild  55%    2  042407 08:38:26       
                                       0:04:0 64.0KB: 279GB UnProt     L  Rebuild  55%    3  042407 08:38:26       
                                       0:05:0 64.0KB: 279GB UnProt     L  Rebuild  55%    4  042407 08:38:26       

1    Legacy  232GB            Open    0:00:0 0.00 B: 232GB                               0  000000 00:00:00       
/dev/aacd1          



Executing: close

|

« ケーブルの巻き方 | トップページ | RAIDコントローラ死亡? »

コメント

S.M.A.R.T. 情報を引っ張り出して、エラー回数の履歴とか見れれば、HDD 自体が悪かったのか、その他なのか切り分けできね?

投稿: suisui | 2007年10月21日 (日) 07時36分

それがですね、とりあえずSATA-USB変換アダプタでつないだもので、SMART情報取れなかったんですよ。
すぐにSATA-HDDをつなげられるマシンが無かったのが敗因です。

投稿: きのし | 2007年10月21日 (日) 21時51分

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: RAID5の障害と復旧:

« ケーブルの巻き方 | トップページ | RAIDコントローラ死亡? »