vol.12 物理/論理フォーマット

2013/06/22

HDDは製造工場で全ての部品を組み込んだ、組み立てが完了した状態では、まだコンピュータなどに接続しても認識されないので使用することは出来ません。コンピュータに認識されるためには、そのコンピュータで使われているBIOS(Basic Input/Output System)やOS(Operating System)で認識できる状態になっている(フォーマットされている)ことが必要なのです。BIOSに認識されるためには、「物理フォーマット(ローレベルフォーマット)」が完了した状態。OSに認識されるためには、「論理フォーマット」が完了した状態になっていることが必要です。

では、HDDのデータを書き込まれる磁気円盤(プラッタ)の「物理フォーマット」や「論理フォーマット」とは、どのような順番で行われ、どの様になっているのでしょうか。

1.物理フォーマット/ローレベルフォーマット

HDDやFD(フロッピーディスク)のような磁気記録媒体に、“トラック”や“セクタ”などと呼ばれる管理区域を作成し、磁気記録装置として機能することが可能なように準備すること。

HDDでは、プラッタに「サーボライタ」と呼ばれる専用の装置や、「磁気転写」、「セルフライト」と呼ばれる技術を用いて、あらかじめプラッタに書き込まれた「サーボデータ」をヘッドで読み出し、そのサーボデータを元にヘッド(“トラック”)の位置を決定し、セクタを構成する「IDエリア」に“セクタID”やデータの書き込みや、読み出し時に「ライトウィンドウ」や「リードウィンドウ」の基準になる“システムクロック”をHDDの回転速度と厳密に一致(同期)させるための“Sync情報”などの情報と、データ書き込み開始/終了位置の誤差を吸収するための「ギャップ」や、実際のユーデータを記録する「データエリア」構成するために決められたダミーデータを書きこむことで“セクタ”を作成し、“セクタ”内部の磁性体の品質欠陥の有無の検査(バッドセクタの検出)を行い、バッドセクタを検出した場合は、そのセクタを別のセクタに振り替える“代替処理”を行い、セクタ総数や、トラック上のセクタ数、ゾーンなどの情報を“SA(システムエリア)”に書き込み(代替処理データはSA内の“P-List”に書き込む)完了します。

参考:世界的に有名なロシアの「データ復旧専用機器・装置」の製造販売を行っている企業とその日本代理店のWebサイトには「(その機器)があれば・・略・・クリーンルームやサーボライタその他の高価な装置も必要ないのです。・・略・・」と記載しています(2015年1月現在)が、データ復旧にサーボライタをどのように使用するのでしょうか。サーボライタを使うと、今まで使われていたサーボデータとは別の新しいサーボデータがプラッタ上に書き込まれてしまい、データの復旧は全く不可能になってしまいます。それにも関わらずこのような記載があるのは、元々この機器がデータ復旧用途ではなく、HDD製造業者の存在しない共産圏では、HDDは高価で入手困難なため、故障したHDDを再生使用するための装置として開発されたときの名残なのですが、それに気付かず流用を続けることは、その業者の技術力の不足を疑われることなります。

工場出荷後のHDDに対して購入者が専用のツール(ソフトウェア)を用いて行う「(通称)物理フォーマット」は、「全てのセクタに“00”などのダミーデータを書きこみ、セクタの品質チェックを行い、欠陥検出時はマークをつけたり、代替処理を行うこと」を指しているので、本当の「物理フォーマット」ではありません。また代替処理のデータをどのようにするのかは、ツールに依存していますので特定できません。記憶媒体が工場から出荷された後に、「(本来の)物理フォーマット」を行うことが出来るのは「FD(フロッピーディスク)」だけです。

参考:FDは、トラックの物理的な位置が規格化されていると共に、サーボ情報は存在せず、ドライブが規格に従った位置にヘッドを送り“トラック”や“セクタ”作成のためのデータを書き込むので、市販の“FD”は全く「フォーマット」されていない、「何も書き込まれていない円盤状の磁気フィルム」であったのですが、後にユーザがフォーマットする手間を省き使用できる「フォーマット済み」も販売されるようになったのです。

2.論理フォーマット

HDDなどの電子記憶媒体をコンピュータで使うために、そのコンピュータで使う(使っている)OSの要求するファイルシステムの規格に一致するように準備することで、“MBR”などと呼ばれ、その記憶媒体がどの様に使用されているか(パーティーションの有無や容量、ファイルシステムの種類など)を示す「区画構造情報」、“FAT”や“MFT”と呼ばれ、内部に書き込まれているファイルの名称、その情報の書きこまれている位置などを示す「ファイル構造情報」を作成すると共に、実際にユーザデータを書き込まれるデータエリアの品質検査を行い、使用不能な箇所が検出されると、データの書き込みが行われないようにマークが付けられます。

参考: クイックフォーマットは、論理ファーマットを既に実行された経歴のある電子記憶媒体に繰り返して行う場合に用いられる「簡易的に時間を掛けずに出来るフォーマットの方法」で、最近はHDDが大容量化して通常の論理フォーマットでは長時間必要となってしまったために、最近のOSでは「HDDのフォーマット」は「クイックフォーマットの実行」を意味するようになっていて、“FAT”や“MFT”と呼ばれる「ファイル構造情報」部分だけを消去して、「論理フォーマット」が実行されたように見せかけています。

3.HDDフォーマット後のプラッタ上のデータ(セクタ)の実際

このように、サーボデータを基準にセクタが作成され、ファイルシステムに適合するように「区画構造情報」、「ファイル構造情報」、「データエリア」が決定されデータを書き込むと、複数のステップを経ているために、プラッタ上のデータは下図のように、

A:理想状態で、サーボデータによって決定される中心線(センター)上にIDエリア、Dataエリアが書き込まれている。

B:フォーマット後の状態。ヘッドはトラッキングサーボによる位置制御を受けているが、実際には理想位置であることは稀であり、オフセット(ずれ)を持つ位置にデータが書き込まれている。

C:ユーザデータ書き込み後の状態。ユーザデータは、フォーマット後に別途に書き込まれるので、フォーマット時と異なるオフセットを持って書き込まれている。

と、理解することによってリードエラーの発生頻度が高い理由も納得できるのではないでしょうか。

参考:このような状態で、「IDエリア」のデータの読み出し時にエラーが発生すると、CRCエラーやシークエラー。「Dataエリア」の読み出し時にエラーが発生すると、リードエラーとなります。