2023年 春期 応用情報技術者試験 問10
クラウドサービスのサービス可用性管理
L社は、大手の自動車部品製造販売会社である。2023年4月現在、全国に八つの製造拠点をもち、L社の製造部は、昼勤と夜勤の2交替制で部品を製造している。L社の経理部は、基本的に昼勤で経理業務を行っている。L社のシステム部では、基幹系業務システムを、L社本社の設備を使って、オンプレミスで運用している。また、会計系業務システムは、2023年1月に、オンプレミスでの運用からクラウド事業者M社の提供するSaaS(以下、Sサービスという)に移行した。L社の現在の業務システムの概要を表1に示す。
項番 | 業務システム名称 | 業務システムの運用形態 |
---|---|---|
1 | 基幹系1) | 自社開発のアプリケーションソフトウェアをオンプレミスで運用 |
2 | 会計系2) | Sサービスを利用 |
注記2) 対象は、財務会計、管理会計、債権債務管理、手形管理、給与計算などの会計業務
【L社のITサービスの現状】
システム部は、L社内の利用者を対象に、業務システムをITサービスとして提供し、サービス可用性やサービス継続性を管理している。
システム部では、ITILを参考にして、サービス可用性として異なる3種の特性及び指標を表2のとおり定めている。
特性 | 説明 | 指標 |
---|---|---|
可用性 | あらかじめ合意された期間にわたって、要求された機能を実行するITサービスの能力 | サービス稼働率 |
a性 | ITサービスを中断なしに、合意された機能を実行できる能力 | MTBF |
保守性 | ITサービスに障害が発生した後、通常の稼働状態に戻す能力 | MTRS |
基幹系業務のITサービスは、生産管理など事業が成功を収めるために不可欠な重要事業機能を支援しており、高可用性の確保が必要である。基幹系業務システムでは、L社本社建屋内にシステムを2系統用意しており、本番系システムのサーバの故障や定期保守などの場合は、予備系のサーバに切り替えてITサービスの提供を継続できるシステム構成を採っている。また、ストレージに保存されているユーザーデータファイルがマルウェアによって破壊されるリスクに備え、定期的にユーザーデータファイルのフルバックアップを磁気テープに取得している。バックアップを取得する磁気テープは2組で、1組は本社建屋内に保存し、もう1組は災害に対する脆弱性を考える必要があるので、遠隔地に保管している。
【Sサービスのサービス可用性】
システム部のX氏は、会計系業務システムにSサービスを利用する検討を行った際、M社のサービスカタログを基にサービス可用性に関する調査を行い、その後、L社とM社との間でSLAに合意し、2023年1月からSサービスの利用を開始した。M社が案内しているSサービスのサービスカタログ(抜粋)を表3に、L社とM社との間で合意したSLAのサービスレベル目標を表4に示す。
サービスレベル項目 | 説明 | サービスレベル目標 |
---|---|---|
サービス時間 | サービスを提供する時間 | 24時間365日(計画停止時間を除く) |
サービス稼働率 | (サービス時間-サービス停止時間1)) ÷サービス時間×100(%) | 月間目標値 99.5%以上 |
計画停止時間 | 定期的なソフトウェアのバージョンアップや保守作業のために設ける時間。サービスは停止される。 | 毎月1回 年前2時間~年前5時 |
サービスレベル項目 | 合意したSLAのサービスレベル目標 |
---|---|
サービス時間 | L社の営業日の年前6時~翌日年前2時(1日20時間) |
サービス稼働率 | 月間目標値 99.5%以上 |
計画停止時間 | なし |
2023年1月は、Sサービスでインシデントが発生してサービス停止した日が3日あったが、サービス停止の時間帯は3日とも表4のサービス時間の外だった。よって、表4のサービス稼働率は100%である。仮に、サービス停止の時間帯が3日とも表4のサービス時間の内の場合、サービス停止の月間合計時間がb分以下であれば、表4のサービス稼働率のサービスレベル目標を達成する。ここで、1月のL社の営業日の日数を30とする。
3月は、表4のサービス時間の内でSサービスでインシデントが発生した日が1日あった。復旧作業に時間が掛かったので、表4のサービス時間の内で90分間サービス停止した。3月のL社の営業日の日数を30とすると、サービス稼働率は99.75%となり、3月も表4のサービスレベル目標を達成した。しかし、このインシデントは月末繁忙期の日中に発生したので、L社の取引先への支払業務に支障を来した。
X氏は、サービス停止しないことはもちろんだが、サービス停止した場合に迅速に対応して回復させることも重要だと考えた。そこで、X氏はM社の責に帰するインシデントが発生してサービス停止したときのサービスレベル項目を表4に追加できないか、M社と調整することにした。
また、今後、経理部では、勤務時間を製造部に合わせて、交替制で夜勤を行う勤務体制を採って経理業務を行うことで、業務のスピードアップを図ることを計画している。この場合、会計系業務システムのサービス時間を見直す必要がある。そこで、X氏は、表4のサービスレベル目標の見直しが必要と考え、表3のサービスカタログを念頭に、②経理部との調整を開始することにした。
【基幹系業務システムのクラウドサービス移行】
2023年1月に、L社はBCPの検討を開始し、システム部は地震が発生して基幹系業務システムが被災した場合でもサービスを継続できるようにする対策が必要になった。X氏が担当になって、クラウドサービスを利用してBCPを実現する検討を開始した。
X氏は、まずM社が提供するパブリッククラウドのIaaS(以下、Iサービスという)を調査した。Iサービスのサービスカタログでは、サービスレベル項目としてサービス時間及びサービス稼働率の二つが挙げられていて、サービスレベル目標は、それぞれ24時間365日及び月間目標値99.99%以上になっていた。Iサービスでは、物理サーバ、ストレージシステム、ネットワーク機器などのIT基盤のコンポーネント(以下、物理基盤という)は、それぞれが冗長化されて可用性の対策が採られている。また、ハイパーバイザ型の仮想化ソフト(以下、仮想化基盤という)を使って、1台の物理サーバで複数の仮想マシン環境を実現している。
次に、X氏は、Iサービスを利用した災害対策サービスについて、M社に確認した。災害対策サービスの概要は次のとおりである。
・M社のデータセンター(DC)は、同時に被災しないように東日本と西日本に一つずつある。通常時は、L社向けのIサービスは東日本のDCでサービスを運営する。
東日本が被災して東日本のDCが使用できなくなった場合は、西日本のDCでIサービスの継続される。
・西日本のDCのIサービスにもユーザーデータファイルを保存し、東日本のDCのIサービスのユーザーデータファイルと常時同期させる。東日本のDCの仮想マシン環境のシステムイメージは、システム変更の都度、西日本のDCにバックアップを保管しておく。
M社の説明を受け、X氏は次のように考えた。
・地震や台風といった広範囲に影響を及ぼす自然災害に対して有効である。
・災害対策だけでなく、物理サーバに機器障害が発生した場合でも業務を継続できる。
・西日本のDCのIサービスのユーザーデータファイルは、東日本のDCのIサービスのユーザーデータファイルと常時同期しているので、現在行っているユーザーデータファイルのバックアップの遠隔地保管を廃止できる。
X氏は、上司にM社の災害対策サービスを採用することで効果的にサービス可用性を高められる旨を報告した。しかし、上司から、③X氏の考えの中には見直すべき点があると指摘されたので、X氏は修正した。
さらに、上司はX氏に、M社に一任せずに、M社と協議して実質的な改善を継続していくことが重要だと話した。そこで、X氏は、サービス可用性管理として、サービスカタログに記載されているサービスレベル項目のほかに、④可用性に関するKPIを設定することにした。また、基幹系業務システムの災害対策を実現するに当たって、コストの予算化が必要になる。X氏は、災害時のサービス可用性確保の観点でサービス継続性を確保するコストは必要だが、コストの上昇を抑えるために災害時に基幹系業務システムを一部縮退できないか検討した。そして、事業の視点から捉えた機能ごとの⑤判断基準に基づいて継続する機能を決める必要があると考えた。