vol.8 リードエラーは何故起きるのか

2013/06/18

では、「リードリトライ機能」を持っているHDDでも発生するリードエラーは何故起きるのでしょうか。また、リードエラーとは具体的にはどのような現象なのでしょうか。

1.リードエラーとは

正式には、I/O(イン・アウト)エラーと呼び、記録媒体に入力した信号と読み出した信号が一致しないことを指します。そして、既に解説したことですが、

  1. プラッタからヘッドが読み出す信号は、アナログ波形です。
  2. アナログ波形を、微分回路や積分回路を組み合わせた、論理回路を用いてデジタル信号に変換(A-D変換)しています。
  3. ヘッドの出力レベルが変わると、微分定数や、積分定数も変更しないと、エラーが起こります。
  4. ヘッドの出力が変わる原因は?(部品の故障を除く)
    • 書き込み時、読み出し時の磁気回路の変化
    • オフトラック(オフセット)
    • ヘッド浮上量の変動

このように追求して行くと、書き込み時も、読み出し時も共に安定した磁気回路を構成する垂直磁気記録方式の方が、リードエラーを起こし難いことを納得することができるのではないでしょうか。

2.リードエラーは何故起きるのか。

垂直磁気記録方式でのリードエラーの原因は、その磁気回路の構成上、浮上量の変動の影響は少なく、オフトラックが主な原因なのですが、そのオフトラックは何故起こるのでしょうか。一言でまとめてしまうと、「物理構造と機構上の問題」と言ってもよいと思います。それでは、よく言われる障害とその対処法を例に、原因と考え方を説明してみましょう。

①.長時間放置したり、冷蔵庫に入れておいたりしたら故障が回復するのは何故?

使用環境温度に起因した障害と思われます。HDDの製造はご承知の通り、クリーンルームで行われ、クリーンルームは、塵埃だけでなく温度、湿度も23℃、50%を基準に管理されています。HDDの構造は下図のようになっていて、特に温度の影響を受けやすいのは、HDD筐体とHDDカバーです。

HDD筐体は、アルミのダイキャストですが、アルミはステンレスと比較すると、5倍近い熱膨張率を持っています。ですから、温度変化によって、バイメタルのように全体が反り上がることになります。また、金属は、製造方法の影響によって、結晶形態が均一ではなく、特にダイキャストの場合は、溶けた材料の流れの方向に結晶が長くなります。そして、金属の熱膨張率は、結晶構造によって決定され、流れの方向に大きく、流れと直角方向には小さいのです。ですから、HDD筐体は、温度によってバイメタルのように反り上がるだけではなく、流れと直角方向の捩じれなども発生することになります。このような熱膨張によって全体の変形が発生している状態と成り易い、サーバなどの連続運転状態で使われているHDDが、連休などでシステム休止後の起動(コールドスタート)時には冷却された状態となっているために、リードエラーを起こし起動不能になったりするのです。そのHDDをデータ復旧業者がドライヤーなどを使って暖めてからデータを読み出すと、順調にデータ読み出しが可能になることがあるのも、この理由によります。また、温度上昇による変形でリードエラーを起こしたものは、冷凍庫などで過度に冷却することによって、(逆方向に強制的に変形させると)変形が戻り、読み出し可能になることも当然存在するのです。このように、HDDを冷蔵庫や冷凍庫で冷やすとデータの救出が可能になる現象は、決して都市伝説などではなく、理論的にもちゃんとした裏づけ説明ができることなのです。

②.データ復旧業者が、リードエラーを起こしているHDDを手にもち、色々な方向・角度・姿勢にして状況を探っているのは何故?

HDDは、ヘッドがトラックを正確に追従するように、トラッキングサーボとよばれる機能によって、ヘッドの位置制御を行い、リードエラーの発生を予防しています。しかし、HDDの内部構造、特にヘッド周りは下図のようになっていて、ヘッドアームの支点である、ボールベアリングから前のヘッド側と、後ろのVCM側を比べると、通常は銅線が大量に巻いてあるVCM側の質量が大きいアンバランスになっているため、HDDを水平に置いた場合には何の影響もありませんが、垂直(縦)に置いた場合には、VCM側が重いので下向きの力が発生し、ヘッドがプラッタの内側に向かう力となり、(HDDを図と逆向き置くと、ヘッドがプラッタの外側に向かう力となり)、トラックに対するヘッドの位置は、HDDの姿勢による微妙な影響を受けるのです。このため、データ復旧業者は、HDDのリードリトライ動作によるヘッドの動きを手で確認しながら、リードエラーの解消できる姿勢を探しているのです。