2019年 秋期 応用情報技術者試験 問10

ITサービスマネジメントの改善

A社は,インターネットを使って航空券や宿泊施設などの予約サービスを提供する企業である。近年PCからの利用者に加え,スマートフォンからの利用者が増加しており,A社の事業を拡大する好機となっている。

A社の予約サービスは,A社のITサービス部門によって提供される。ITサービス部門は,予約サービスを企画し利用者への提供窓口となるサービス部,アプリケーションソフトウェア(以下,業務アプリという)を開発する開発部及びシステムを運用する運用部で組織されている。サービス部と運用部は,予約サービスのSLAに整合するように,運用レベル合意書(以下,OLAという)を定めて,運用部の行う作業内容や運用レベルの目標値(以下,OLA目標値という)を定義している。

予約サービスは航空券システムや国内宿泊システムなど,複数のシステムによって提供されている。運用部には複数のチームがあり,それぞれのチームは,異なったシステムの運用を担当している。国内宿泊システムの運用を担当するチームは,チームリーダと数名のオペレータで構成される。オペレータは,監視システムを利用してシステムの稼働状況を常時監視している。オペレータのスキルレベルに,個人差はない。

インシデントの対応状況

システムの運用中にインシデントを発見した場合,運用部はインシデント発生をサービス部に連絡する。サービス部は,インシデント解決の責任を負うインシデント解決者を割り当て,インシデントを定められた時間内で解決させる。インシデント解決者は,インシデントの診断及び解決のために,開発部や運用部に段階的取扱いを行う場合がある。その際,開発部と運用部は,OLAに従ってサービス部を支援する。

早期のインシデント解決の観点から,サービス部は運用部に対して,次のような事項を要求し,OLAの合意内容に含めている。

(i)インシデント発生から10分以内にサービス部にインシデント発生を連絡する。 (ii)インシデント解決者に指示されてから10分以内に開発部向けのシステムログ取得作業を完了する。

しかし,国内宿泊システムの運用では,項番(i),(ii)ともに合意を遵守できていない。

監視システムは,機器の稼働状況だけでなく,業務アプリが出力するメッセージも表示する。オペレータは,コンソール画面に表示されるメッセージを目視し,メッセージ切分け基準表を参照してインシデント発生を判断している。メッセージの中には,インシデント発生の判断に関係するメッセージと関係しないメッセージがある。インシデント発生の判断に関係するメッセージの中には,メッセージ切分け基準表で,インシデント発生と識別できるメッセージもあるが,人間が更に分析しないとインシデント発生の判断が難しいメッセージもある。オペレータはインシデント発生と判断した場合は,サービス部に連絡し,インシデント処理手順を開始する。このように人間が判断しているので,インシデント発生の連絡が遅延する場合や,インシデント発生を見落とす場合があって,項番(i)が遵守できていない。

一方,システムログの取得作業はシステム化されていて,パラメタを設定することで,数分以内にログ情報の取得が可能である。サービス部にインシデント発生の連絡をした後,インシデント解決者から指示があった場合に,連絡したオペレータがシステムログの取得作業を担当している。オペレータが繁忙などときは,システムログの取得作業着手が遅れてしまうことがあった。OLA目標値は,"作業指示から10分以内で取得作業を完了"であるが,現状は,最大で30分掛かってしまう場合があり,項番(ii)が遵守できていない。

A社の予約サービスの利用者は急増しており,インシデント解決の遅れは,多くの利用者に影響が及びかねない状況になってきていた。現状の運用の実態と,OLA目標値とのギャップを是正する改善計画が必要となっていた。

改善計画の策定

このような状況を踏まえて,サービス部で予約サービスを担当するサービスマネージャのS主任が,インシデントの対応状況の問題点について分析し,改善計画を策定することとなった。改善計画の内容は次のとおりである。

(1)インシデント発生の連絡遅れについて まず,S主任は,メッセージ切分け基準表を使ってオペレータがインシデント発生の判断をしていることに着目した。S主任は,システムの運用に必要な作業,コンソール画面表示に基づいて実施する作業など,①オペレータ一人当たりの作業量を調査し分析した。また,調査の過程で数人のオペレータから"そもそも,出力されるメッセージの数が多い。インシデント発生の判断に関係しないメッセージを出力する業務アプリがあり,インシデント発生の判断に関係するメッセージを見落とすおそれがある。"との意見があった。運用部が調査したところ,業務アプリが出力するメッセージのうち約半数はインシデント発生の判断に関係しないことが判明した。そこで,S主任は,開発部に依頼して,インシデント発生の判断に関係しないメッセージを削減するよう該当する業務アプリを改修することを計画した。

次に,S主任は,監視システムを改修して対応できないか検討した。具体的には,インシデント発生の判断に関係するメッセージのうち,メッセージ切分け基準表で,インシデント発生と識別できるメッセージについては監視システムに登録し,監視システムが自動的にメッセージを識別して,インシデント発生を判断できるようにする。インシデント発生と判断した場合は,画面表示だけでなく,オペレータに分かるようにランプを点滅させ,警告音を鳴らすよう監視システムを改修することを計画した。

(2)システムログの取得作業の遅れについて S主任は,国内宿泊システムの運用を担当するチームのチームリーダと検討し,インシデントが発生した場合は,②チームリーダが窓口となってサービス部からの指示に対応することを計画した。システムログの取得作業の指示があった場合は,チームリーダが担当するオペレータを指名して作業する手順に変更する。

S主任は実際にインシデントが発生した場面でOLA目標値が達成できるか検証する方法をチームリーダと検討し,インシデントが発生したときの手順を変更して,1か月間検証した。検証の結果,OLA目標値を達成することが確認できたので,改善計画の改善内容として採用することにした。

S主任が策定した改善計画の詳細を表1に示す。

表1 改善計画の詳細
項番改善内容a目標値備考
1業務アプリを改修し,インシデント発生の判断に関係しないメッセージを削減する。不要なメッセージの削減率100%OLAの(i)に対応
2監視システムを改修し,自動的にインシデント発生を判断する。メッセージ識別の自動化率70%OLAの(i)に対応
3チームリーダにインシデント対応窓口を一本化し,適切なオペレータに作業を実施させる。チームリーダの対応率100%OLAの(ii)に対応
注1)目標値は,aに対する目標値のことである。

S主任は,体制,スケジュールなどをまとめた上で,サービス部,運用部及び開発部の各部長に改善計画を説明し,承認を得た。

なお,改善計画を実施するに当たって,"aの達成状況をサービス部,運用部及び開発部の各部長がレビューするので,定期的に報告会を開催すること。"との指示があった。

その後,この計画に従って改善活動を進めた結果,国内宿泊システムの運用を担当するチームではOLA目標値を達成できた。

運用部における継続的な改善活動の取組

運用部は,日常の運用を優先する傾向があり,国内宿泊システムの運用を担当するチーム以外でも,S主任が計画したような改善活動は実施されない状況が続いていた。

運用部のB部長は,運用部が主体となった継続的な改善活動の必要性があると判断し,S主任に対して,"S主任から運用部のチームリーダたちに今回の改善活動の事例を紹介し,改善への取組機運を高めてほしい。"と依頼した。S主任は,運用部のチームリーダたちに対して,今回サービス部が中心となり実施した改善活動と効果を説明し,運用部としても自ら改善活動を実施してほしい旨を提案した。しかし,チームリーダたちは,提案主旨には同意したが,改善活動の実施に踏み切れないでいた。

このような状況を鑑みて,B部長は,サービス部長の了承を得て,③S主任をサービス部から運用部に異動させた。B部長は継続的な改善活動に関わるサービスマネジメントの方針を作成し,方針に従って改善されることを確実にするためのb及びcをS主任に割り当てた。B部長からS主任に,"サービス部での経験を基に運用部に改善活動が根付くように推進してほしい。当社の今後の事業を支えていくには,運用部が実施している業務とプロセスを見直していく必要がある。S主任の取組が部全体に浸透するように,推進してほしい。"との指示があった。S主任は,早速,費用対効果の目安などの改善の評価基準を明確にしてB部長に提案した。

B部長は,部員全員に,"サービスマネジメントの方針,改善の評価基準,S主任のbc"を周知した。しばらくして,④運用部の部員は改善活動について提案するようになり,継続的に改善活動を行うようになった。

出典:令和元年度 秋期 応用情報技術者試験 午後問題 問10