【自宅サーバー】HDDは逝くよ、ワトソン君【Gmirror】
【自宅サーバー】HDDは逝くよ、ワトソン君【Gmirror】
【状況】
ワトソン君、見たまえ。このCrystalDiskinfoの表示を!
とまぁ、WEBマスターが大好きなアメドラマのエレメンタリーというホームズとワトソンの江現代版実写アメドラマですね。ワトソン君は魅力的な中華系女優さんですけど、声優さんが攻殻機動隊の少佐役とかアニメのシドニアのサマリ役のあの人なのでものすごくハマり役でとても面白いです。
さてさて、今回は、我が修理のきろくDXのサーバーでもある自宅WEBサーバーのHDDが飛びました。もうSMARTの値はメチャクチャですね。使用時間も4年以上使っているので3000時間なワケがありません。数万時間単位なハズです。
明らかに不良セクタの雨荒らしになっていますね。
OSはFreeBSDでGmirrorというOS標準のソフトウェアRAID1を使ってミラーリーングを行っていました。エラーで停まったのはラウンドロビンアルゴリズムを使って相互から読み出すパフォーマンスを上げるアルゴリズムを使っていた為、一旦、サーバーは停止しました。再起動すと、自動的にミラーリングのアレイからこのHDDが外れましたので別のHDDに交換しましたが、データー他すべて無事で新しいHDDに自動的にミラーリングが再構成されました。
冗長性(じょうちょうせい)つまり問題が起きたときにも肩代わりしてくれる余裕ですね。耐障害性ともいいます。なかなか、役に立つ場面には遭遇しませんがその時はいきなり来るので今回は改めてRAID1の威力を再確認しました。
【交換作業の様子】
まず、正常時に下記のコマンドを入力すると
> gmirror status Name Status Components mirror/gm0 COMPLETE ad4 (ACTIVE) ad6 (ACTIVE)
正常時は、このように結果が表示される。
異常時は、起動させると
>gmirror status Name Status Components mirror/gm0 DEGRADED ad4 (ACTIVE)
となりad6が消えました。
この状態は、エンジンが2機の飛行機で言うと片肺飛行なのでもう片側がトンだら落ちますから速やかに、故障HDDを外して新しいHDDを装着します。
電源を落としてad6と思われるマザボのSATA番号の後の方に刺さっているHDDを外してもう一度起動します。
無事に起動してコマンドでad4が動いてるよ。というのを確認したら外したのがad6なのでこいつが故障HDDですので新品HDDと入れ替えます。
物理的に入れ替えたら、起動。
>gmirror foget gm0 >gmirror insert gm0 ad6 > gmirror status Name Status Components mirror/gm0 DEGRADED ad4 (ACTIVE) ad6 (SYNCHRONIZING,1%)
とコマンドを打ち、新しいHDDが新ad6となりシンクロされて数十分かけて全コピーされ自動でリビルドされていきます。
これで、正常なRAID1の動作に戻ります。常に2つのHDDに記録されていくのでどちらがトンでもデーターは安全ですし、読み込み時は相互に読み込むことが出来るのでパフォーマンスは体感できるぐらいには上がります。
と交換作業完了です。ちなみに2020年はこのサーバーをリプレース予定です。