2014年 秋期 応用情報技術者試験 問10
販売管理システムの問題管理に関する次の記述を読んで、設問1〜3に答えよ。
M社は、西日本の複数の地域で営業を展開している食品流通卸業者である。
M社は、基幹システムである販売管理システムを5年前に再構築した。取引量の多い食品スーパー数社との協業によるインターネット経由の共通EDIの導入をきっかけに、それまでの地域別の分散システムを、単一システムに統合した。その際にサーバや周辺機器も全面刷新し、食品スーパーからのPOSデータ連携を新たに始め、取扱いデータ量の大幅な増加に対応できるように、新規に多数のハードディスクドライブ(以下、ディスクという)を導入した。
再構築後の3年間は、目立った障害もなく安定して稼働したが、一昨年度と昨年度に1度ずつディスク障害が発生し、ディスクを交換した。今年度は、上半期に既に2度ディスクを交換している。
販売管理システムの運用及びサービスデスクは、情報システム部の運用課が担っている。先月から問題管理を担当することになったN君は、情報システム部長の指示を受けて、ディスク障害についての調査を開始した。
情報システム部長の今回の指示は、先日行われたシステム監査の報告会が契機となっている。システム監査において、販売管理システムのディスク障害の対応についてはインシデントの管理に終始しているので、予防処置について検討するようにとの指摘を受けていた。
【運用課の問題管理手順】
運用課では、これまでに発生した問題に関して、事象の詳細、問題を調査・分析してaを特定した経緯と結果、暫定的な解決策(以下、暫定策という)、恒久的な解決策(以下、恒久策という)などの項目を問題管理データベースに記録して、新たに問題が発生した際の調査及び診断に使用している。
N君はまず、運用課での問題管理手順を確認した。
-
問題の特定は、サービスデスクからの問題の通知によることが多いが、異常を示すシステムメッセージのメール通知など、サービスデスクを経由しない場合もある。特定した問題は、問題管理データベースに記録する。
-
記録した問題を分類し、緊急度と影響度を評価して優先度を割り当てる。
-
問題のaを特定するための調査及び診断を行う。初めに、問題管理データベースからbを参照して、過去に特定された問題でないか確認する。
-
調査及び診断の結果、問題に対する暫定策又は恒久策は、問題管理データベースに、bとして記録する。
-
問題の恒久策実施のために、何らかの変更が必要な場合、変更要求(RFC)を発行する。
-
問題の恒久策が有効で、再発防止を確認できたら、問題を終了する。
-
問題のうち重大なものは、将来に向けた学習のためのレビューを行う。
上述の内容をフロー図にまとめると図1のとおりとなる。
【ディスク障害の記録の確認】
N君は、問題管理データベースを参照し、これまでのディスク障害の記録を調査した。記録の内容はいずれも類似しており、障害の事象は、RAIDコントローラがディスクの書込み時のエラーを検出したというもので、分析の結果は、ディスクの経年不良となっていた。恒久策として、障害を起こしたディスクを交換すると記載され
ていた。交換後、データ再構築処理の完了を確認して、問題は終了とされていた。N君は、①ディスク障害の問題に対して、障害を起こしたディスクの交換は恒久策になら ないと考えた。
【ディスクの運用管理の確認】
続いてN君は、販売管理システムを中心に、M社でのディスクの運用管理について、運用課メンバへのヒアリングなどの調査を行い、次の情報を得た。
-
販売管理システムのディスク装置は、ホットスワップ対応機器によるRAID6構成を採っており、同一構成内で2台までのディスク障害であれば、システムを停止せずにディスクの交換が可能である。これまでに発生したディスク障害では、即座の対応を重視し、定期保守を待たず、日中、システムを停止せずにディスクを交換し、データ再構築処理を行っていた。なお、販売管理システムの定期保守は、週次に、システムを停止して実施している。
-
販売管理システム再構築時に多数導入したディスクは、M社がそれまで使用してきた、メインフレームにも用いられる高信頼性モデルではなく、PCなどにも使用される汎用のモデルであった。機器単体では、高信頼性モデルの半分程度の寿命と言われている。
-
N君は、これまでに確認した、機器メーカや利用者からの報告などから、販売管理システムのディスクのように、同一の製造ロットで、同じように使用されているディスクは、障害も同時期に起こす確率が高いという情報を得ていた。また、これまで障害回復として実施していた、RAID6構成でシステムを停止せずにディスク交換した場合のデータ再構築処理は、高頻度のディスクアクセスを伴うので、機器に対する負荷が高く、二次的な障害の危険性が増すという情報も得ていた。
-
N君が、販売管理システムのシステムメッセージを記録したログを調べると、ディスクの読取りエラーや書込みエラーの障害が発生したディスクに、障害の兆候を示す不良セクタの代替処理発生のメッセージが、障害発生の数日前から頻発していた。販売管理システムのメッセージ監視機能は、ディスクの読取りエラーと書込みエラーのエラーメッセージを検出すると問題管理担当者にメールで通知する設定になっているが、不良セクタの代替処理発生のメッセージを検出してもメールで通知する設定にはなっていなかった。
N君は、情報システム部長に、販売管理システムのディスクについては、これまでの、ディスク障害が発生してから交換するやり方を改め、②障害の兆候を検出して、障害が発生する前に交換する方式を提案しようと考えた。また、同時に、③障害の兆候を検出したディスクの交換の実施時期についての改善も必要と考えた。