JPH1011701A - 磁気ディスク装置及び同装置の故障予測方法 - Google Patents
磁気ディスク装置及び同装置の故障予測方法Info
- Publication number
- JPH1011701A JPH1011701A JP16578196A JP16578196A JPH1011701A JP H1011701 A JPH1011701 A JP H1011701A JP 16578196 A JP16578196 A JP 16578196A JP 16578196 A JP16578196 A JP 16578196A JP H1011701 A JPH1011701 A JP H1011701A
- Authority
- JP
- Japan
- Prior art keywords
- diagnosis
- failure
- function
- magnetic disk
- disk drive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Recording Or Reproducing By Magnetic Means (AREA)
Abstract
(57)【要約】
【課題】本発明はパフォーマンスを低下させることなく
正確な故障診断が行える磁気ディスク装置及び同装置の
故障予測方法を提供することを目的とする。 【解決手段】本発明は、通常時(非警戒モード時)にお
いてECCコレクション数による第1の診断を行ない、
この第1の診断結果に基づく故障警戒中はエラーレート
による第2の診断を行なう。これら第1および第2の診
断は、ROM10内にコード化され、メディア1、RA
M11、バッファRAM14等を制御するファームウェ
アにより実現される。
正確な故障診断が行える磁気ディスク装置及び同装置の
故障予測方法を提供することを目的とする。 【解決手段】本発明は、通常時(非警戒モード時)にお
いてECCコレクション数による第1の診断を行ない、
この第1の診断結果に基づく故障警戒中はエラーレート
による第2の診断を行なう。これら第1および第2の診
断は、ROM10内にコード化され、メディア1、RA
M11、バッファRAM14等を制御するファームウェ
アにより実現される。
Description
【0001】
【発明の属する技術分野】本発明は、回転する円盤状の
磁気ディスクに対し、磁気ヘッドがシーク動作すること
によりデータ記録(または読み出し)を行なう磁気ディ
スク装置、特に、故障診断機能を有する磁気ディスク装
置及び同装置の故障予測方法に関する。
磁気ディスクに対し、磁気ヘッドがシーク動作すること
によりデータ記録(または読み出し)を行なう磁気ディ
スク装置、特に、故障診断機能を有する磁気ディスク装
置及び同装置の故障予測方法に関する。
【0002】
【従来の技術】従来から知られているこの種の磁気ディ
スク装置は、コンピュータの外部記憶装置として広く普
及している。回転する円盤状の磁気ディスク(以下、メ
ディアと称する)に対し、磁気ヘッドがメディアの半径
方向にシーク動作することによりデータ記録(または読
み出し)を行なう磁気ディスク装置は、機械的な動作部
分を有しているため例えば半導体装置等に比べて故障率
が高い。したがって、例えばユーザが定期的にデータの
バックアップを取るといった人為的な故障対策が必要で
あった。
スク装置は、コンピュータの外部記憶装置として広く普
及している。回転する円盤状の磁気ディスク(以下、メ
ディアと称する)に対し、磁気ヘッドがメディアの半径
方向にシーク動作することによりデータ記録(または読
み出し)を行なう磁気ディスク装置は、機械的な動作部
分を有しているため例えば半導体装置等に比べて故障率
が高い。したがって、例えばユーザが定期的にデータの
バックアップを取るといった人為的な故障対策が必要で
あった。
【0003】このような事態をふまえて、装置自らが故
障を診断する機能を備えた磁気ディスク装置が製品化さ
れてきている。このような磁気ディスク装置における故
障の自己診断機能によれば、RAWエラーレート(生エ
ラーレート、以下単に「エラーレート」と称する)、C
SS(Contact Start Stop)回数、起動リトライ、シー
クパフォーマンス等、装置の故障につながる要因を示す
パラメータが定期的にチェックされ、故障の発生が予測
され得るような危険な状態にあるか否かが診断される。
そして危険な状態にあると診断された際には、ホストシ
ステムに対して事前に警告を出すことが行われる。ホス
トシステムに警告を出すタイミングとしては、あまり早
くても都合が悪く、遅ければ意味がない。
障を診断する機能を備えた磁気ディスク装置が製品化さ
れてきている。このような磁気ディスク装置における故
障の自己診断機能によれば、RAWエラーレート(生エ
ラーレート、以下単に「エラーレート」と称する)、C
SS(Contact Start Stop)回数、起動リトライ、シー
クパフォーマンス等、装置の故障につながる要因を示す
パラメータが定期的にチェックされ、故障の発生が予測
され得るような危険な状態にあるか否かが診断される。
そして危険な状態にあると診断された際には、ホストシ
ステムに対して事前に警告を出すことが行われる。ホス
トシステムに警告を出すタイミングとしては、あまり早
くても都合が悪く、遅ければ意味がない。
【0004】
【発明が解決しようとする課題】このような故障の自己
診断機能を有する磁気ディスク装置には次のような問題
がある。すなわち、多数のパラメータをチェックするよ
うにすれば、より正確な故障診断を行えるという反面、
磁気ディスク装置本来の機能であるところの、データの
読み書きに係るデータ転送能力(パフォーマンス)が低
下してしまうという問題がある。そこで、本発明は上記
の問題を解決するためになされたものであり、パフォー
マンスを低下させることなく正確な故障診断が行える磁
気ディスク装置及び同装置の故障予測方法を提供するこ
とを目的とする。
診断機能を有する磁気ディスク装置には次のような問題
がある。すなわち、多数のパラメータをチェックするよ
うにすれば、より正確な故障診断を行えるという反面、
磁気ディスク装置本来の機能であるところの、データの
読み書きに係るデータ転送能力(パフォーマンス)が低
下してしまうという問題がある。そこで、本発明は上記
の問題を解決するためになされたものであり、パフォー
マンスを低下させることなく正確な故障診断が行える磁
気ディスク装置及び同装置の故障予測方法を提供するこ
とを目的とする。
【0005】
【課題を解決するための手段】本発明の請求項1に係る
磁気ディスク装置は、故障の可能性が高いかどうかを診
断し得る第1の診断機能およびこの第1の診断機能より
も処理時間が短い第2の診断機能を有する診断手段と、
前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
決定手段と、を具備することを特徴とする。
磁気ディスク装置は、故障の可能性が高いかどうかを診
断し得る第1の診断機能およびこの第1の診断機能より
も処理時間が短い第2の診断機能を有する診断手段と、
前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
決定手段と、を具備することを特徴とする。
【0006】本発明の請求項4に係る磁気ディスク装置
は、故障の可能性が高いかどうかを診断し得る複数の診
断手段と、前記複数の診断手段のうち、幾つかの診断手
段による診断結果に基づいて、他の診断手段による診断
を選択する選択手段と、を具備することを特徴とする。
は、故障の可能性が高いかどうかを診断し得る複数の診
断手段と、前記複数の診断手段のうち、幾つかの診断手
段による診断結果に基づいて、他の診断手段による診断
を選択する選択手段と、を具備することを特徴とする。
【0007】本発明の請求項6に係る磁気ディスク装置
は、故障予測に関する自己診断機能を有する磁気ディス
ク装置において、前記自己診断機能による診断結果に基
づいて、当該自己診断機能による診断内容を変化させる
ことを特徴とする。
は、故障予測に関する自己診断機能を有する磁気ディス
ク装置において、前記自己診断機能による診断結果に基
づいて、当該自己診断機能による診断内容を変化させる
ことを特徴とする。
【0008】本発明の請求項7に係る磁気ディスク装置
の故障予測方法は、故障の可能性が高いかどうかを診断
し得る第1の診断機能およびこの第1の診断機能よりも
処理時間が短い第2の診断機能を有する診断手段を有
し、前記診断手段の第2の診断機能の診断結果に応じ
て、前記第1の診断機能による診断を行なうか否かを決
定することを特徴とする。
の故障予測方法は、故障の可能性が高いかどうかを診断
し得る第1の診断機能およびこの第1の診断機能よりも
処理時間が短い第2の診断機能を有する診断手段を有
し、前記診断手段の第2の診断機能の診断結果に応じ
て、前記第1の診断機能による診断を行なうか否かを決
定することを特徴とする。
【0009】本発明の請求項10に係る磁気ディスク装
置の故障予測方法は、故障の可能性が高いかどうかを診
断し得る複数の診断手段と、前記複数の診断手段のう
ち、幾つかの診断手段による診断結果に基づいて、他の
診断手段による診断を選択することを特徴とする。
置の故障予測方法は、故障の可能性が高いかどうかを診
断し得る複数の診断手段と、前記複数の診断手段のう
ち、幾つかの診断手段による診断結果に基づいて、他の
診断手段による診断を選択することを特徴とする。
【0010】本発明の請求項12に係る磁気ディスク装
置の故障予測方法は、故障予測に関する自己診断機能を
有する磁気ディスク装置において、前記自己診断機能に
よる診断結果に基づいて、当該自己診断機能による診断
内容を変化させることを特徴とする。
置の故障予測方法は、故障予測に関する自己診断機能を
有する磁気ディスク装置において、前記自己診断機能に
よる診断結果に基づいて、当該自己診断機能による診断
内容を変化させることを特徴とする。
【0011】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を説明する。 (第1実施形態)図1は、本発明の第1の実施形態に係
る磁気ディスク装置のハードウェア構成を示すブロック
図である。同図に示される磁気ディスク装置において
は、複数のメディア(ここでは二枚)1がスピンドルモ
ータ17により高速に回転運動可能な如く設けられてい
る。メディア1の各データ面には、対向する一対のヘッ
ド2が設けられている。メディア1が一枚の場合には、
二つのヘッド2がメディア1の両面に対向して設けられ
る。
の実施形態を説明する。 (第1実施形態)図1は、本発明の第1の実施形態に係
る磁気ディスク装置のハードウェア構成を示すブロック
図である。同図に示される磁気ディスク装置において
は、複数のメディア(ここでは二枚)1がスピンドルモ
ータ17により高速に回転運動可能な如く設けられてい
る。メディア1の各データ面には、対向する一対のヘッ
ド2が設けられている。メディア1が一枚の場合には、
二つのヘッド2がメディア1の両面に対向して設けられ
る。
【0012】ヘッド2は、キャリッジと称されるヘッド
移動機構3に取り付けられている。またヘッド2は、キ
ャリッジ3の動作によりメディア1の半径方向に移動可
能となっている。ヘッド2は、サーボ処理システム(ヘ
ッド位置決め制御機構)により、指定された目標シリン
ダ(目標トラック)上に位置決め制御される。通常はセ
クタ単位でデータのリード/ライトが行なわれる。
移動機構3に取り付けられている。またヘッド2は、キ
ャリッジ3の動作によりメディア1の半径方向に移動可
能となっている。ヘッド2は、サーボ処理システム(ヘ
ッド位置決め制御機構)により、指定された目標シリン
ダ(目標トラック)上に位置決め制御される。通常はセ
クタ単位でデータのリード/ライトが行なわれる。
【0013】キャリッジ3は、ボイスコイルモータ(V
CM)16により駆動され、VCM16はドライバ15
により駆動される。またスピンドルモータ17もドライ
バ15により駆動される。ドライバ15は、モータドラ
イバおよびVCMドライバ(ダブルドライバと称され
る)を構成するドライバIC(集積回路)である。
CM)16により駆動され、VCM16はドライバ15
により駆動される。またスピンドルモータ17もドライ
バ15により駆動される。ドライバ15は、モータドラ
イバおよびVCMドライバ(ダブルドライバと称され
る)を構成するドライバIC(集積回路)である。
【0014】リード/ライト回路8は、ヘッドアンプ4
により増幅されたヘッド2からのリード信号を入力し、
データ再生動作に必要な信号処理を行なう。また、リー
ド/ライト回路8は、データ記録動作に必要な信号処理
を行ない、ライトデータに応じたライト電流をヘッドア
ンプ4を介してヘッド2に供給する。
により増幅されたヘッド2からのリード信号を入力し、
データ再生動作に必要な信号処理を行なう。また、リー
ド/ライト回路8は、データ記録動作に必要な信号処理
を行ない、ライトデータに応じたライト電流をヘッドア
ンプ4を介してヘッド2に供給する。
【0015】リード/ライト回路8は、通常のユーザデ
ータの記録再生処理と共に、ヘッド位置決め制御のサー
ボ処理に必要なサーボデータの再生処理を実行する。サ
ーボデータには、ヘッド2の現在位置を示すシリンダア
ドレス及びシリンダ内の位置誤差を示すためのバースト
データ(バースト信号)が含まれている。サーボ回路5
は、サーボ処理に必要な信号処理を実行する回路であっ
て、リード/ライト回路8から出力されたデータパルス
からシリンダアドレスを抽出して保持する。また、サー
ボ回路5は、バースト信号を抽出するためのサンプルタ
イミング信号をパスル生成回路6に対し出力し、あるい
はセクタパルスの抽出処理を行なう。
ータの記録再生処理と共に、ヘッド位置決め制御のサー
ボ処理に必要なサーボデータの再生処理を実行する。サ
ーボデータには、ヘッド2の現在位置を示すシリンダア
ドレス及びシリンダ内の位置誤差を示すためのバースト
データ(バースト信号)が含まれている。サーボ回路5
は、サーボ処理に必要な信号処理を実行する回路であっ
て、リード/ライト回路8から出力されたデータパルス
からシリンダアドレスを抽出して保持する。また、サー
ボ回路5は、バースト信号を抽出するためのサンプルタ
イミング信号をパスル生成回路6に対し出力し、あるい
はセクタパルスの抽出処理を行なう。
【0016】CPU9は、サーボ回路5と共にヘッド位
置決め制御を実行するサーボ処理システムを構成する。
さらに、CPU9は、ヘッド位置決め制御以外に、リー
ド/ライトデータの転送制御を含む磁気ディスク装置の
各種駆動制御を実行する。CPU9は、ROM10に格
納された制御プログラムに基づいて各種駆動制御を実行
する。ROM10は、外部バスを介してCPU9に接続
されている。このROM10には、磁気ディスク装置の
故障診断のためのファームウェアが格納されている。ま
たROM10には、データの出力レベルの変動、繰返し
行われたリード処理の回数(リトライ回数)、ECC等
のエラー訂正機能によりデータが正確に読み出されたこ
と等の条件が記憶されている。
置決め制御を実行するサーボ処理システムを構成する。
さらに、CPU9は、ヘッド位置決め制御以外に、リー
ド/ライトデータの転送制御を含む磁気ディスク装置の
各種駆動制御を実行する。CPU9は、ROM10に格
納された制御プログラムに基づいて各種駆動制御を実行
する。ROM10は、外部バスを介してCPU9に接続
されている。このROM10には、磁気ディスク装置の
故障診断のためのファームウェアが格納されている。ま
たROM10には、データの出力レベルの変動、繰返し
行われたリード処理の回数(リトライ回数)、ECC等
のエラー訂正機能によりデータが正確に読み出されたこ
と等の条件が記憶されている。
【0017】CPU9はワンチップのマイクロプロセッ
サであり、入出力部としてA/DコンバータおよびD/
Aコンバータを内蔵し、更に、命令RAMと称する内部
リード/ライトメモリを有する。尚、同実施形態では、
CPU9は、A/Dコンバータを用い、供給されるバー
スト信号BSをディジタルデータに変換する。又、CP
U9はD/Aコンバータを用い、サーボ処理に必要な制
御量(ヘッド位置決め制御等に必要な制御量)をアナロ
グ信号に変換してドライバ15に出力する。
サであり、入出力部としてA/DコンバータおよびD/
Aコンバータを内蔵し、更に、命令RAMと称する内部
リード/ライトメモリを有する。尚、同実施形態では、
CPU9は、A/Dコンバータを用い、供給されるバー
スト信号BSをディジタルデータに変換する。又、CP
U9はD/Aコンバータを用い、サーボ処理に必要な制
御量(ヘッド位置決め制御等に必要な制御量)をアナロ
グ信号に変換してドライバ15に出力する。
【0018】HDC12は、磁気ディスク装置とホスト
システムとのインターフェースを構成し、主としてリー
ド/ライトデータの転送を行なうコントローラである。
HDC12は、メディア1から読出されたセクタ単位の
リードデータ及びメディア1に書き込むためのライトデ
ータをバッファーRAM14に一時的に格納する。HD
C12とCPU9はデータ転送制御を行なうシステムを
構成している。また、HDC12には、エラー検知回路
が設けられている。このエラー検知回路は、メディア1
から読み出されたデータに基づいてデータエラーを検知
するほか、所定の狭い領域であれば、エラーを回復する
機能、すなわちECC(Error Correction Code )機能
を有している。EEPROM7はCPU9に接続され、
各種のデータを記憶する。
システムとのインターフェースを構成し、主としてリー
ド/ライトデータの転送を行なうコントローラである。
HDC12は、メディア1から読出されたセクタ単位の
リードデータ及びメディア1に書き込むためのライトデ
ータをバッファーRAM14に一時的に格納する。HD
C12とCPU9はデータ転送制御を行なうシステムを
構成している。また、HDC12には、エラー検知回路
が設けられている。このエラー検知回路は、メディア1
から読み出されたデータに基づいてデータエラーを検知
するほか、所定の狭い領域であれば、エラーを回復する
機能、すなわちECC(Error Correction Code )機能
を有している。EEPROM7はCPU9に接続され、
各種のデータを記憶する。
【0019】以上のように構成された本実施形態にかか
る磁気ディスク装置の動作を説明する。図2は、本実施
形態に係る磁気ディスク装置の動作を示すフローチャー
トである。ここで説明する動作は、ROM10内に格納
されたファームウェアにより実現される。
る磁気ディスク装置の動作を説明する。図2は、本実施
形態に係る磁気ディスク装置の動作を示すフローチャー
トである。ここで説明する動作は、ROM10内に格納
されたファームウェアにより実現される。
【0020】まずステップS0において、初期化処理が
行われる。このステップS0は磁気ディスク装置の電源
投入直後に実行される。初期化処理では、HDC12、
リード/ライト回路8、警戒モードフラグ等が初期化
(リセット)される。そしてステップS2に移行する。
行われる。このステップS0は磁気ディスク装置の電源
投入直後に実行される。初期化処理では、HDC12、
リード/ライト回路8、警戒モードフラグ等が初期化
(リセット)される。そしてステップS2に移行する。
【0021】ステップS2はアイドルルーチンであっ
て、ホストシステムからのコマンドを待ち受ける処理で
ある。ホストシステムからコマンドを受領すると、コマ
ンドインタラプトが発行され、ステップS10(コマン
ド処理)に移行する。
て、ホストシステムからのコマンドを待ち受ける処理で
ある。ホストシステムからコマンドを受領すると、コマ
ンドインタラプトが発行され、ステップS10(コマン
ド処理)に移行する。
【0022】ステップS2のアイドル状態において、一
定時間以上(例えば5秒間)ホストシステムからコマン
ドが到来しない場合は、ステップS4に移行する。ステ
ップS4において、警戒モードフラグに基づき故障警戒
中であるか否かが判定される。警戒モードフラグはRA
M11内に記憶保持されるフラグである。故障警戒中で
ある場合は、ステップS6に移行する。ステップS6に
おいては、正確に故障の発生を予測し得るような高精度
の故障診断、ここではエラーレートの測定、が行われ
る。エラーレートは装置の故障につながる要因を示す有
効なパラメータとされているが、統計的手法を含むデー
タ計測であるため比較的長時間(数十秒以上)の測定時
間を要する。エラーレートの測定後は、パワーセーブモ
ードに係るパワーダウン処理に移行する。
定時間以上(例えば5秒間)ホストシステムからコマン
ドが到来しない場合は、ステップS4に移行する。ステ
ップS4において、警戒モードフラグに基づき故障警戒
中であるか否かが判定される。警戒モードフラグはRA
M11内に記憶保持されるフラグである。故障警戒中で
ある場合は、ステップS6に移行する。ステップS6に
おいては、正確に故障の発生を予測し得るような高精度
の故障診断、ここではエラーレートの測定、が行われ
る。エラーレートは装置の故障につながる要因を示す有
効なパラメータとされているが、統計的手法を含むデー
タ計測であるため比較的長時間(数十秒以上)の測定時
間を要する。エラーレートの測定後は、パワーセーブモ
ードに係るパワーダウン処理に移行する。
【0023】また、故障警戒中でない場合は、ステップ
S6を実行せず単にパワーダウン処理に移行する。これ
により故障警戒中でない正常な状態において上記エラー
レート測定を行なうことによるパフォーマンスの低下を
抑えることができる。パワーダウン処理については、こ
こでは説明を省略する。
S6を実行せず単にパワーダウン処理に移行する。これ
により故障警戒中でない正常な状態において上記エラー
レート測定を行なうことによるパフォーマンスの低下を
抑えることができる。パワーダウン処理については、こ
こでは説明を省略する。
【0024】なお、エラーレート測定中にホストシステ
ムからコマンドを受領した際は、測定を中断してコマン
ド実行を行なう場合と、測定が完了するまでコマンドの
実行を遅延させる場合とが考えられる。コマンドの実行
を遅延させることは、パフォーマンスの低下を招く。測
定を中断する場合でも、オーバーヘッドが生じるためパ
フォーマンスの低下を招く。したがって、当該エラーレ
ート測定は頻繁に実行するべきではない。
ムからコマンドを受領した際は、測定を中断してコマン
ド実行を行なう場合と、測定が完了するまでコマンドの
実行を遅延させる場合とが考えられる。コマンドの実行
を遅延させることは、パフォーマンスの低下を招く。測
定を中断する場合でも、オーバーヘッドが生じるためパ
フォーマンスの低下を招く。したがって、当該エラーレ
ート測定は頻繁に実行するべきではない。
【0025】ところが本実施形態は、特定の条件下(故
障警戒中)においてのみ上記エラーレート測定を行なう
ため好ましい。図3はコマンド処理(S10)を示すフ
ローチャート図である。
障警戒中)においてのみ上記エラーレート測定を行なう
ため好ましい。図3はコマンド処理(S10)を示すフ
ローチャート図である。
【0026】まずステップS11において、コマンドコ
ードに基づきコマンドの種類が判定される。次にステッ
プS12において、“リードコマンド”と判定された場
合は、ステップS20におけるリードコマンド処理に移
行する。
ードに基づきコマンドの種類が判定される。次にステッ
プS12において、“リードコマンド”と判定された場
合は、ステップS20におけるリードコマンド処理に移
行する。
【0027】また、ステップS13において、“ドライ
ブステータスリードコマンド”と判定された場合は、ス
テップS30におけるドライブステータスリード処理に
移行する。
ブステータスリードコマンド”と判定された場合は、ス
テップS30におけるドライブステータスリード処理に
移行する。
【0028】コマンド処理S10は、上記以外の“他の
コマンド”を処理するものとなっているがここでは説明
を省略する。図4は、リードコマンド処理(S20)を
示すフローチャート図である。
コマンド”を処理するものとなっているがここでは説明
を省略する。図4は、リードコマンド処理(S20)を
示すフローチャート図である。
【0029】まずステップS21において、ホストシス
テムから送られてきたコマンドに応じたリード/ライト
回路8およびHDC12等の動作によるリード処理が行
われる。
テムから送られてきたコマンドに応じたリード/ライト
回路8およびHDC12等の動作によるリード処理が行
われる。
【0030】次にステップS22において、磁気ディス
ク装置のパフォーマンスにそれほど影響を与えることが
なく、かつ上記エラーレートの変動特性に近似するよう
な診断、すなわちECCコレクション数の取得が行われ
る。このECCコレクション数は、HDC12によるE
CCコレクションがイネーブルの状態にある場合のリー
ド処理においてコレクションされたデータ(コレクテッ
ドデータ)数である。そしてステップS221に移行す
る。ステップS221においては、警戒モードに入って
から一定時間以上経過しているか否かが判定される。こ
こで、YESと判定された場合は、ステップS23に移
行し、警戒モードフラグがリセットされる。警戒モード
フラグはRAM11内に記憶保持される。
ク装置のパフォーマンスにそれほど影響を与えることが
なく、かつ上記エラーレートの変動特性に近似するよう
な診断、すなわちECCコレクション数の取得が行われ
る。このECCコレクション数は、HDC12によるE
CCコレクションがイネーブルの状態にある場合のリー
ド処理においてコレクションされたデータ(コレクテッ
ドデータ)数である。そしてステップS221に移行す
る。ステップS221においては、警戒モードに入って
から一定時間以上経過しているか否かが判定される。こ
こで、YESと判定された場合は、ステップS23に移
行し、警戒モードフラグがリセットされる。警戒モード
フラグはRAM11内に記憶保持される。
【0031】次にステップS24において、コレクテッ
ドデータ数(ECCコレクション数)が、所定のスレッ
ショルドよりも大きいか否かを判定する。ここで所定の
スレッショルドよりも大きい(具体的にはオンザフライ
コレクションが103 に一回の割合で行われた、等)場
合は、ステップS25において上記警戒モードフラグを
セットする。これにより、磁気ディスク装置は故障警戒
状態となる。
ドデータ数(ECCコレクション数)が、所定のスレッ
ショルドよりも大きいか否かを判定する。ここで所定の
スレッショルドよりも大きい(具体的にはオンザフライ
コレクションが103 に一回の割合で行われた、等)場
合は、ステップS25において上記警戒モードフラグを
セットする。これにより、磁気ディスク装置は故障警戒
状態となる。
【0032】図5は、ドライブステータスリードコマン
ド処理(S30)を示すフローチャートである。まずス
テップS31において、警戒モードフラグを調べること
により警戒モード(故障警戒中)であるか否かが判定さ
れる。警戒モードフラグはRAM11内に記憶保持され
ている。警戒モードである場合はステップS32に移行
する。また警戒モードでない場合はステップS34に移
行する。
ド処理(S30)を示すフローチャートである。まずス
テップS31において、警戒モードフラグを調べること
により警戒モード(故障警戒中)であるか否かが判定さ
れる。警戒モードフラグはRAM11内に記憶保持され
ている。警戒モードである場合はステップS32に移行
する。また警戒モードでない場合はステップS34に移
行する。
【0033】ステップS32においては、先のステップ
S6におけるエラーレートの測定結果に基づく故障診断
が行われる。続くステップS33において、上記エラー
レートが所定のスレッショルドよりも大きい場合(例え
ばエラーレートが10-3以上)は“異常”と判定され、
ステップS36に移行する。また上記エラーレートがス
レッショルドよりも小さい場合はステップS34に移行
する。
S6におけるエラーレートの測定結果に基づく故障診断
が行われる。続くステップS33において、上記エラー
レートが所定のスレッショルドよりも大きい場合(例え
ばエラーレートが10-3以上)は“異常”と判定され、
ステップS36に移行する。また上記エラーレートがス
レッショルドよりも小さい場合はステップS34に移行
する。
【0034】ステップS34においては、ECCコレク
ション数に基づく故障診断が行われる。続くステップS
35において、上記ECCコレクション数が所定のスレ
ッショルドよりも大きい場合(例えばオンザフライコレ
クションが103 に一回の割合で行われた)は“異常”
と判定され、ステップS36に移行する。また上記EC
Cコレクション数がスレッショルドよりも小さい場合は
ステップS37に移行する。
ション数に基づく故障診断が行われる。続くステップS
35において、上記ECCコレクション数が所定のスレ
ッショルドよりも大きい場合(例えばオンザフライコレ
クションが103 に一回の割合で行われた)は“異常”
と判定され、ステップS36に移行する。また上記EC
Cコレクション数がスレッショルドよりも小さい場合は
ステップS37に移行する。
【0035】ステップS36においては、ホストインタ
ーフェース13を介して、ホストシステムに対しドライ
ブステータスが異常である旨を報告する。また、ステッ
プS37においては、同インターフェース13を介して
ホストシステムに対しドライブステータスが正常である
旨を報告する。なお、ステップS34およびステップS
35におけるECCコレクション数による診断は、非故
障警戒モード中の場合、あるいはエラーレートを用いる
診断結果が“正常”である場合にも実行され得るが、場
合によっては省略しても構わない。
ーフェース13を介して、ホストシステムに対しドライ
ブステータスが異常である旨を報告する。また、ステッ
プS37においては、同インターフェース13を介して
ホストシステムに対しドライブステータスが正常である
旨を報告する。なお、ステップS34およびステップS
35におけるECCコレクション数による診断は、非故
障警戒モード中の場合、あるいはエラーレートを用いる
診断結果が“正常”である場合にも実行され得るが、場
合によっては省略しても構わない。
【0036】このような第1実施形態によれば、通常時
(非警戒モード時)においてECCコレクション数によ
る第1の診断を行ない、この第1の診断結果に基づく故
障警戒中、すなわちステップS25による警戒フラグの
セット中は、エラーレートによる第2の診断を行なうこ
とにより、必要最小限の診断処理によって的確な故障予
測を行なうことが可能となる。
(非警戒モード時)においてECCコレクション数によ
る第1の診断を行ない、この第1の診断結果に基づく故
障警戒中、すなわちステップS25による警戒フラグの
セット中は、エラーレートによる第2の診断を行なうこ
とにより、必要最小限の診断処理によって的確な故障予
測を行なうことが可能となる。
【0037】したがって、磁気ディスク装置が接続され
るホストシステムは、磁気ディスク装置の故障予測を適
切なタイミングでユーザに知らせることが可能となり、
これによりユーザは適切な故障対策を講じることができ
る。
るホストシステムは、磁気ディスク装置の故障予測を適
切なタイミングでユーザに知らせることが可能となり、
これによりユーザは適切な故障対策を講じることができ
る。
【0038】なお、上記第1の診断は、ECCコレクシ
ョン数による診断に限定されず、磁気ディスク装置のパ
フォーマンスにそれほど影響を与えず、かつエラーレー
トの変動特性に近似するような他のパラメータを用いて
も良い。
ョン数による診断に限定されず、磁気ディスク装置のパ
フォーマンスにそれほど影響を与えず、かつエラーレー
トの変動特性に近似するような他のパラメータを用いて
も良い。
【0039】また故障警戒中において故障を高精度に診
断する診断パラメータとしては、エラーレートの一種類
のみに限定されない。本実施形態では、エラーレートに
対しその近似特性を与えるECCコレクション数を組み
合わせることとしたが、例えば第1の診断をCSS起動
時間の測定、第2の診断をCSS起動電流値およびリト
ライ回数とするような他の診断パラメータの組み合わせ
に置き換えても良い。すなわち、第1実施形態の場合、
第1の診断は磁気ディスク装置のパフォーマンスにそれ
ほど影響がないような診断、第2の診断は正確に故障の
発生を予測し得るような高精度の診断、とすれば良い。
断する診断パラメータとしては、エラーレートの一種類
のみに限定されない。本実施形態では、エラーレートに
対しその近似特性を与えるECCコレクション数を組み
合わせることとしたが、例えば第1の診断をCSS起動
時間の測定、第2の診断をCSS起動電流値およびリト
ライ回数とするような他の診断パラメータの組み合わせ
に置き換えても良い。すなわち、第1実施形態の場合、
第1の診断は磁気ディスク装置のパフォーマンスにそれ
ほど影響がないような診断、第2の診断は正確に故障の
発生を予測し得るような高精度の診断、とすれば良い。
【0040】(第2実施形態)第2実施形態は、第1実
施形態の変形例に係り、第1実施形態と同様部分につい
ては説明を省略する。
施形態の変形例に係り、第1実施形態と同様部分につい
ては説明を省略する。
【0041】第1実施形態は、通常時(非警戒モード
時)においてECCコレクション数による第1の診断を
行ない、この第1の診断結果に基づく故障警戒中はエラ
ーレートによる第2の診断を行なうものであったが、第
2の実施形態は、第1の診断結果に応じて故障警戒のレ
ベル(故障警戒度)を定め、故障警戒中において、かか
るレベルに応じた種々の診断(第2の診断)を行なうも
のである。すなわち、第1実施形態においては故障警戒
レベルは1であってが、第2実施形態においては故障警
戒レベルを複数としている。言い替えれば第1の診断に
よる診断結果に基づいて第2の診断を選択可能となって
いる。
時)においてECCコレクション数による第1の診断を
行ない、この第1の診断結果に基づく故障警戒中はエラ
ーレートによる第2の診断を行なうものであったが、第
2の実施形態は、第1の診断結果に応じて故障警戒のレ
ベル(故障警戒度)を定め、故障警戒中において、かか
るレベルに応じた種々の診断(第2の診断)を行なうも
のである。すなわち、第1実施形態においては故障警戒
レベルは1であってが、第2実施形態においては故障警
戒レベルを複数としている。言い替えれば第1の診断に
よる診断結果に基づいて第2の診断を選択可能となって
いる。
【0042】このような第2実施形態の具体例によれ
ば、ECCコレクション数、すなわちHDC12による
ECCコレクションがイネーブルの状態にある場合のリ
ード処理においてコレクションされたデータ(コレクテ
ッドデータ)数を用いる第1の診断結果に基づいて、例
えば三段階の故障警戒レベルが決定される。故障警戒レ
ベル決定に係るステップは、図4のステップS24およ
びステップS25に対して置き換えられる。そして、故
障警戒レベル1においてはエラーレートによる診断、故
障警戒レベル2においてはエラーレートおよびCSS
(起動電流、リトライ回数)を用いる診断、そして故障
警戒レベル3においてはエラーレートおよびCSSおよ
びシークパフォーマンスを用いる診断、が行なわれる。
これらの診断処理に係るステップは、図2のステップS
4およびステップS6に置き換えられる。なお、故障警
戒レベル2および故障警戒レベル3における“異常”の
診断は、当該レベルにおいて何れか一のパラメータが異
常を示す場合、あるいは全てのパラメータが異常を示す
場合を意味する。
ば、ECCコレクション数、すなわちHDC12による
ECCコレクションがイネーブルの状態にある場合のリ
ード処理においてコレクションされたデータ(コレクテ
ッドデータ)数を用いる第1の診断結果に基づいて、例
えば三段階の故障警戒レベルが決定される。故障警戒レ
ベル決定に係るステップは、図4のステップS24およ
びステップS25に対して置き換えられる。そして、故
障警戒レベル1においてはエラーレートによる診断、故
障警戒レベル2においてはエラーレートおよびCSS
(起動電流、リトライ回数)を用いる診断、そして故障
警戒レベル3においてはエラーレートおよびCSSおよ
びシークパフォーマンスを用いる診断、が行なわれる。
これらの診断処理に係るステップは、図2のステップS
4およびステップS6に置き換えられる。なお、故障警
戒レベル2および故障警戒レベル3における“異常”の
診断は、当該レベルにおいて何れか一のパラメータが異
常を示す場合、あるいは全てのパラメータが異常を示す
場合を意味する。
【0043】なお第1の診断は、ECCコレクション数
による診断に限定されず、第1実施形態と同様に、磁気
ディスク装置のパフォーマンスにそれほど影響を与えな
いような診断、例えばCSS起動時間の測定等であって
も良い。また、第2の診断の故障警戒レベルは三段階に
限定されず何段階でも良い。また第2の診断の種類も上
記したものに限定されず、所要の診断精度が最低限得ら
れるような任意の診断を行なうようにしても良い。
による診断に限定されず、第1実施形態と同様に、磁気
ディスク装置のパフォーマンスにそれほど影響を与えな
いような診断、例えばCSS起動時間の測定等であって
も良い。また、第2の診断の故障警戒レベルは三段階に
限定されず何段階でも良い。また第2の診断の種類も上
記したものに限定されず、所要の診断精度が最低限得ら
れるような任意の診断を行なうようにしても良い。
【0044】このような第2実施形態によれば、第1実
施形態よりも柔軟かつ多様な故障診断を高精度に行える
という利点がある。本発明は上述した実施形態に限定さ
れず、例えば第1実施形態と第2実施形態とを組み合わ
せる等、種々変形して実施可能である。
施形態よりも柔軟かつ多様な故障診断を高精度に行える
という利点がある。本発明は上述した実施形態に限定さ
れず、例えば第1実施形態と第2実施形態とを組み合わ
せる等、種々変形して実施可能である。
【0045】
【発明の効果】本発明によれば、故障の兆候が認められ
ない初期の段階においては必要最小限の自己診断のみを
行ない、これによりパフォーマンス低下を抑制し、故障
の兆候が認められる警戒段階においては、危険度に応じ
て自己診断を拡張し、これにより精度良く診断を行なう
磁気ディスク装置及び同装置の故障予測方法を提供でき
る。
ない初期の段階においては必要最小限の自己診断のみを
行ない、これによりパフォーマンス低下を抑制し、故障
の兆候が認められる警戒段階においては、危険度に応じ
て自己診断を拡張し、これにより精度良く診断を行なう
磁気ディスク装置及び同装置の故障予測方法を提供でき
る。
【図1】本発明の第1実施形態に係る磁気ディスク装置
の概略構成を示すブロック図。
の概略構成を示すブロック図。
【図2】第1実施形態に係る磁気ディスク装置の動作を
示すフローチャート。
示すフローチャート。
【図3】第1実施形態に係る磁気ディスク装置のコマン
ド処理を示すフローチャート。
ド処理を示すフローチャート。
【図4】第1実施形態に係る磁気ディスク装置のリード
コマンド処理を示すフローチャート。
コマンド処理を示すフローチャート。
【図5】第1実施形態に係る磁気ディスク装置のドライ
ブステータスリードコマンド処理を示すフローチャー
ト。
ブステータスリードコマンド処理を示すフローチャー
ト。
1…メディア(磁気ディスク) 2…磁気ヘッド 3…キャリッジ 4…ヘッドアンプ 5…サーボ回路 6…パルス生成回路 7…EEPROM 8…リード/ライト回路 9…CPU 10…ROM 11…RAM 12…HDC 13…ホストインターフェース 14…バッファRAM 15…ドライバ 16…VCM 17…スピンドルモータ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G11B 20/18 572 G11B 20/18 572F
Claims (12)
- 【請求項1】 故障の可能性が高いかどうかを診断し得
る第1の診断機能およびこの第1の診断機能よりも処理
時間が短い第2の診断機能を有する診断手段と、 前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
決定手段と、 を具備することを特徴とする磁気ディスク装置。 - 【請求項2】 前記第1の診断機能は、エラーレートを
測定することにより故障の可能性を診断することを特徴
とする請求項1に記載の磁気ディスク装置。 - 【請求項3】 前記第1の診断機能による故障可能性の
診断は、前記第2の診断機能による故障可能性の診断よ
りも、診断精度が高いことを特徴とする請求項1に記載
の磁気ディスク装置。 - 【請求項4】 故障の可能性が高いかどうかを診断し得
る複数の診断手段と、 前記複数の診断手段のうち、幾つかの診断手段による診
断結果に基づいて、他の診断手段による診断を選択する
選択手段と、 を具備することを特徴とする磁気ディスク装置。 - 【請求項5】 前記選択手段は、診断手段の数を変化さ
せることで、診断精度を上げることを特徴とする請求項
4に記載の磁気ディスク装置。 - 【請求項6】 故障予測に関する自己診断機能を有する
磁気ディスク装置において、 前記自己診断機能による診断結果に基づいて、当該自己
診断機能による診断内容を変化させることを特徴とする
磁気ディスク装置。 - 【請求項7】 故障の可能性が高いかどうかを診断し得
る第1の診断機能およびこの第1の診断機能よりも処理
時間が短い第2の診断機能を有する診断手段を有し、 前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
ことを特徴とする磁気ディスク装置の故障予測方法。 - 【請求項8】 前記第1の診断機能は、エラーレートを
測定することにより故障の可能性を診断することを特徴
とする請求項7に記載の磁気ディスク装置の故障予測方
法。 - 【請求項9】 前記第1の診断機能による故障可能性の
診断は、前記第2の診断機能による故障可能性の診断よ
りも、診断精度が高いことを特徴とする請求項7に記載
の磁気ディスク装置の故障予測方法。 - 【請求項10】 故障の可能性が高いかどうかを診断し
得る複数の診断手段と、 前記複数の診断手段のうち、幾つかの診断手段による診
断結果に基づいて、他の診断手段による診断を選択する
ことを特徴とする磁気ディスク装置の故障予測方法。 - 【請求項11】 前記選択手段は、診断手段の数を変化
させることで、診断精度を上げることを特徴とする請求
項10に記載の磁気ディスク装置の故障予測方法。 - 【請求項12】 故障予測に関する自己診断機能を有す
る磁気ディスク装置において、 前記自己診断機能による診断結果に基づいて、当該自己
診断機能による診断内容を変化させることを特徴とする
磁気ディスク装置の故障予測方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16578196A JPH1011701A (ja) | 1996-06-26 | 1996-06-26 | 磁気ディスク装置及び同装置の故障予測方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16578196A JPH1011701A (ja) | 1996-06-26 | 1996-06-26 | 磁気ディスク装置及び同装置の故障予測方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1011701A true JPH1011701A (ja) | 1998-01-16 |
Family
ID=15818900
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP16578196A Pending JPH1011701A (ja) | 1996-06-26 | 1996-06-26 | 磁気ディスク装置及び同装置の故障予測方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1011701A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005081247A1 (ja) * | 2004-02-19 | 2005-09-01 | Ricoh Company, Ltd. | 欠陥管理情報設定方法、記録方法、欠陥管理方法、プログラム及び記録媒体、並びに情報記録装置 |
| JP2009170034A (ja) * | 2008-01-16 | 2009-07-30 | Sony Corp | 故障診断装置及び故障診断方法 |
-
1996
- 1996-06-26 JP JP16578196A patent/JPH1011701A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005081247A1 (ja) * | 2004-02-19 | 2005-09-01 | Ricoh Company, Ltd. | 欠陥管理情報設定方法、記録方法、欠陥管理方法、プログラム及び記録媒体、並びに情報記録装置 |
| JP2009170034A (ja) * | 2008-01-16 | 2009-07-30 | Sony Corp | 故障診断装置及び故障診断方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8327193B2 (en) | Data storage device including a failure diagnostic log | |
| US6219814B1 (en) | Method and apparatus for selectively varying error correcting code (ECC) power in a direct access storage device (DASD) | |
| US5751947A (en) | Magnetic disk apparatus having inspection function of recording medium and method of inspecting recording medium in magnetic disk apparatus | |
| US8259406B2 (en) | Head/disk contact determination | |
| US8151167B2 (en) | Program processing device and program processing method | |
| JP5521926B2 (ja) | 記憶システム、制御装置、および記憶装置 | |
| US20100202078A1 (en) | Read/write processing method for medium recording device and medium recording device | |
| US7141951B2 (en) | Data storage apparatus with compensation for vibration and control method thereof | |
| US5841260A (en) | Disk device with failure prediction function and motor start error prediction method in the device | |
| JP3887062B2 (ja) | ディスク装置及び同装置に適用されるスループット・パフォーマンス測定方法 | |
| US6263462B1 (en) | Testing method and tester | |
| JPH1011701A (ja) | 磁気ディスク装置及び同装置の故障予測方法 | |
| JP2003263703A5 (ja) | ||
| US20060212777A1 (en) | Medium storage device and write path diagnosis method | |
| JP3457602B2 (ja) | ディスク装置 | |
| JP5692577B2 (ja) | 磁気ディスク装置及び自己診断方法 | |
| JPH09245419A (ja) | 磁気ディスク装置 | |
| JPH10188451A (ja) | ディスク装置及び同装置におけるデフェクトに基づく故障予測方法 | |
| JP2002014778A (ja) | ディスクコントローラ、同コントローラを備えたディスク記憶装置、及び同装置に適用されるハングアップ発生時の処理方法 | |
| JPH06309118A (ja) | 情報処理装置 | |
| JP3150242B2 (ja) | ディスク装置 | |
| JP2003123419A (ja) | 非反復性ランアウト異常検出方法及びディスク装置 | |
| US7382559B2 (en) | Recovery processing method for device specific information of medium storage device and medium storage device | |
| KR100482352B1 (ko) | 하드디스크드라이브의성능테스트방법 | |
| JP2001307435A (ja) | 磁気ディスク装置および同装置の故障予知診断方法並びにそのプログラムを記録した記録媒体 |