vol.9 リードエラー解消は永遠の課題
前回、リードエラーは使われている環境の影響が変わったりすることで簡単に起こり、そのデータを読み出すための工夫について解説しました。しかし、本当にそんなに簡単にリードエラーが起きるとは信じられない人もいるのではないのでしょうか。今回はその点について説明しましょう。
1.リードエラー何故起きる。
前回、主な原因はトラッキングエラー(動作中のトラックとヘッドの位置のずれ)であることを説明しましたが、ヘッドの位置決め精度は現実的にどの位になっているのでしょうか。HDDメーカである東芝が、「東芝レビュー6巻11号 一般論文 位置決め精度の改善と広帯域化を実現するHDD用2段アクチュエータ」の中でそのデータを公開しているので、引用して説明しましょう。
この「HDD用2段アクチュエータ:DSA」というのは、2012年の夏頃からWDやHGST、東芝などの大容量HDDのうち、特にサーバ用途のモデルに、リードエラー発生の予防を目的に採用された最新技術で、図3に示すように、ヘッドアーム上にPZT素子(圧電素子:素子の両端に電圧を加えると、電圧に応じて収縮する)を設置して、ヘッドの位置決め制御の手段を増やし、正確にヘッドをトラッキングさせる技術です。その結果として、図11に示すように、3σ値(99.7%の確率)で、従来のVCMだけの1段制御では8.04nmであったものが、5.69nmへ約30%の改善が実現できたとしています。
ここで、1TB/プラッタ1枚のHDDで計算すると、実際のトラック幅が約55nmですから、8nmのずれは、トラックの中心位置からトラックの端までの寸法の約30%(8/27.5=0.29)となり、筆者の経験によるリードエラーの発生限界(隣接トラックとの隙間の数値:非公開)ともいえる数値です。そして、筆者の経験では、リードエラーの原因は、ヘッドが隣接トラックのデータを読み込むことが最大要因なのです。
これは、ヘッドの位置をトラックの中心位置から、少しずつずらしながら、データのウィンドウマージンの変化を測定をする実験を行うと確認できるですが、ヘッドのリードギャップがトラックから多少外れる位置になって、ヘッド出力が低下しても、A-D変換のためのフィルター定数を変更すれば、ウィンドウマージンの低下はわずかで済むが、隣接トラック上にギャップが乗ると、そのデータが巨大なノイズとなるために、フィルター定数の変更などでも対応不可能となり、ウィンドウマージンが一挙にゼロ(エラーの発生)となってしまうのです。 そして、その時のヘッドの位置が、トラックの中心位置から端までの寸法の30%程度なのです。
(HDD製造メーカや機種による差が存在する可能性が有ります。)
この現象、つまりヘッドの位置が3σ値を超えてずれた場合(0.3%の確率)に、リードエラーを起こすとして計算すると、1TBのHDDの場合、総セクタ数19.5億のうち、590万セクタが限界を超えた位置にデータが書き込まれていて(ライト・リトライ機能は存在しない)、リードエラー(86KB毎に1回リードエラー)を起こすところを、リードリトライ機能が働いてカバーしている状態であるのが、HDDの現実の姿ということになるのです。
このヘッドの位置のずれが発生する原因は、HDDの物理的機構によるもので、データの書き込まれているトラックの位置と、読み出そうとしているヘッドの位置の相対的な差で、HDDの場合は、ヘッドがそのトラックの位置を正確に追従させることを目的とした、トラッキングサーボ機構を持っていますので、スピンドルモータの構造上の要因や、プラッタとスピンドルモータの組み立て精度などは別の要因として、直接関係する要因から除外して考えると、残るのはヘッドアームの回転軸であるボールベアリング(図3のピボットベアリング)となります。
2.ボールベアリングの何が原因なのか?
ボールベアリングの構造は、左図のように外輪と内輪の間に玉と潤滑油が入っていて、HDDの場合は、外輪と内輪は夫々別の構成部品に固定され、往復運動しかせず、その間に玉と潤滑油が入ることによって摩擦が極力少なくなるようになっているので、たとえ、外輪や内輪の中にある玉を保持するための溝(レースと呼びます)や玉の直径に誤差やバラツキが存在しても、それらの誤差による摩擦力の変動や、中心(回転軸)の位置が変わるような影響を受けないように思われますが、HDDの場合は、いままで説明してきたように、ナノ(ミクロンの1/1000)の精密な世界ですからそんなに簡単なものではなく、下記のような色々な影響を受けてしまうのです。
1.潤滑油の温度による粘度の変化
温度環境によって抵抗力が変化し、同じ制御信号を送っても同じ場所に移動しない(再現性が悪化する)ことがある。
2.最大静止摩擦と動摩擦
微小なヘッドの位置制御が不可能になる場合が発生する。(不動帯の発生・拡大/縮小)
3.動作速度と、玉のスリップの発生とスリップ率の変化
早く動かすと玉が回らずにスリップを起こし、それが影響して玉の場所がすこしずつ変わる。(回転軸の変化、抵抗力の変化)
3.まとめ
HDDの場合は、CDやDVDなどのようにディスクを交換することが無いので、データの読み出しに直接影響するのは、同じトラックにヘッドを動かした場合の、繰り返し精度(再現性)が重要なのですが、特に上記の③の影響によって、書き込み直後はヘッドの移動を繰り返しても、再現性が高いのに、時間が経過して、玉の位置が変わり、更に玉の直径に誤差があったりすると、再現性が低下し、リードリトライ機能をもってしても、読み出し可能なヘッド位置を得ることができず、(その時点では)回復不能なリードエラーとなってしまうことがあるのは、このような理由によるためなのです。また、第2のアクチュエータとして、ボールベアリングと別の構造となる機構が導入されたのもこの理由によるものなのです。