サービスデザインは、ITILに基づく「サービス戦略」の具現化プロセスです。顧客満足度、費用対効果、運用性(4つのP:人材、プロセス、プロダクト、パートナー)を包括的に設計し、サービス管理へとスムーズに移行する重要領域です。

画像参照:https://www.fake.inc/blog/service-design
ポイント
- ITIL v3/2011の「サービスデザイン」:戦略を運用レベルに落とし込むフェーズ。ITサービス、プロセス、ツール、パートナー(サプライヤ)の設計が含まれる。
- 4つのP(4Ps of Service Design):
- People:人材(スキル、役割)。
- Process:サービスを提供するプロセス。
- Product:技術、ツール、サービスそのもの。
- Partner:ベンダー、メーカー、サプライヤ。
- ITIL 4の追加要素:「情報」と「バリューストリーム」が重要視されている。
- 試験の方向性:技術的側面(プロダクト)だけでなく、経営視点や管理・運用体制(People, Process, Partner)とのバランスを問う。
バリューストリーム
顧客に製品やサービスを届けるために必要な「一連のプロセス(モノと情報の流れ)」を可視化したものです。顧客の注文(依頼)から納品(価値提供)までの全ステップを分析し、ムダやボトルネックを特定して全体の「価値」を最大化する手法です。
応用情報では、単なるシステム開発技術だけでなく、ビジネス戦略と連動したITサービスの設計・運用能力が求められます。
サービスレベル管理
サービスレベル管理(SLM:Service Level Management)とは、ITサービスにおいて、あらかじめ定めた品質目標(SLA)を達成・維持し、向上させるため、監視・レビュー・改善を行う継続的なプロセスです。顧客と提供者間で合意した「稼働率99.9%」や「障害時の対応時間」といった具体的な指標に基づき、サービス全体の信頼性を担保します。
主な利用例(適用範囲)
- IT・クラウドサービス: クラウドサーバーの稼働率(可用性)保証。
- 運用・サポート: 障害発生時の復旧時間や問い合わせの対応時間(レスポンスタイム)の管理。
- システム運用: データのバックアップ完了時間、バッチ処理の終了時間。
- 外部委託先管理: ベンダーとの間でのサービス水準の監視。
関連用語・類語
- SLA (Service Level Agreement): サービスレベル合意書(契約そのもの)
- SLO (Service Level Objective): サービスレベル目標(具体的な数値目標)
- SLI (Service Level Indicator): サービスレベル指標(測定する具体的な項目)
- サービスマネジメント: ITILなどに準拠した運用管理全般
メリット
サービスレベルを可視化・合意することで、提供側は運用の責任範囲が明確になり、利用者側はサービス品質の安定を得られ、双方で「期待値のずれ」を防ぐことができます。
キャパシティ管理
キャパシティ管理とは、ITサービスに必要なCPU、メモリ、ストレージ、ネットワークなどのリソース容量(キャパシティ)を予測・監視・分析し、コスト効率を最適化しつつ安定稼働を維持するプロセスです。需要と供給のバランスを保ち、将来のサービス低下や停止を未然に防ぐ重要なITIL活動です。
主な特徴・ポイント
- 目的: SLA(サービスレベル合意)に基づいたサービス安定稼働とコストの最適化。
- 3つのレベル: 事業(ビジネス需要)、サービス(提供サービス)、コンポーネント(個別のハードウェア)の視点で管理する。
- 主なプロセス: 監視(モニタリング)、分析、計画、実装(チューニング)の繰り返し。
使用例・具体例
- キャンペーン時の負荷予測: 大規模なWebキャンペーン開催前にアクセス数を予測し、サーバーのスペックを一時的に増強する。
- リソース監視: ストレージ容量が残り10%以下になったらアラートを出し、ストレージ追加を計画する。
- クラウド利用: データベースのCPU利用率が一定時間50%を超えたら、自動でノードを増やして処理能力を拡張する。
- 人的リソース管理: プロジェクト管理にて、メンバーの稼働率を把握し、最適な人員配置を計画する。
類語・関連用語
- リソース管理: 既存リソースを有効活用して業務効率を向上させること(効率重視)。
- キャパシティプランニング: 将来の需要に基づいた計画立案(「管理」全体の一部)。
- パフォーマンス管理: システムの処理速度や応答時間に焦点を当てて調整すること。
キャパシティ管理を怠ると、リソース不足によるサービス遅延や、過剰投資によるコスト高を招くリスクがあります。
ITサービス継続性管理
ITサービス継続性管理(ITSCM)は、大規模災害やテロなど、事業に甚大な影響を与えるITサービスの停止リスクを管理し、合意された時間内にサービスを復旧・継続させるための計画・運営プロセスです。事業継続計画(BCP) の一部として、事前対策(バックアップ、冗長化)や緊急時の対応手順を定めます。
主なポイント:
- 目的: ITサービス停止時、短時間で復旧し、事業への損害を最小限に抑える。
- 対象リスク: 地震、火災、洪水、サイバー攻撃など、通常の可用性管理では対応しきれない壊滅的な事態。
- 実施内容: ビジネスインパクト分析(BIA) による影響評価、リスク分析、バックアップサイトの確保、復旧訓練の実施。
- 可用性管理との違い: 可用性管理は機器の故障など日々の安定稼働が目的、継続性管理は災害後の事業継続が目的。
具体的な対策手法:
- ホットスタンバイ: データセンターを二重化し、瞬時に切り替え可能。
- コールドスタンバイ: 代替設備を確保し、必要に応じて復旧させる。
- 手作業のワークアラウンド: システムを使わない代替手順。
定期的な教育や訓練を実施し、計画を最新の状態に維持することが不可欠です。
事業継続計画(BCP)
BCP(事業継続計画)とは、自然災害、感染症、サイバー攻撃等の緊急事態において、企業が損害を最小限に留め、重要業務を中断させない、または早期復旧させるための計画です。人命・資産・信用を守り、取引先流出を防ぐ「経営戦略」として、事前に対応策を定めておくことが重要です。
主な特徴と目的
- 中核事業の特定と目標復旧時間: 最優先で復旧させる業務と、いつまでに再開するかを定めます。
- リスクへの予防・対応策: 代替拠点の確保、データのバックアップ、人財の確保などを具体的に準備します。
- 対外信用と競争力: 災害時でも供給を維持することで、取引先からの信頼を獲得し、他社との差別化を図ります。
- 全従業員への周知: 計画を作成するだけでなく、教育・訓練を通じて具体的に実行できるようにします。
策定の基本的な流れ
- 基本方針の立案・体制確立: 誰が、どのように判断・行動するかを決める。
- 重要業務の特定: 中断すると経営に致命的な影響が出る業務を選ぶ。
- リスク想定と影響分析: 自然災害や感染症の発生頻度・影響度を分析。
- 対策の策定と教育・訓練: 具体的な行動計画(安否確認、代替拠点など)を決定・訓練する。
- 定期的な見直し: 状況の変化に合わせて計画を更新。
関連・類似用語
- BCM(事業継続マネジメント): BCPを管理・運用する組織的な仕組みのこと。
- 事業継続力強化計画 : 中小企業が防災・減災に取り組む計画を国が認定する制度。
※介護事業所など、特定の業界ではBCP策定が義務化されています。
復旧オプション
ITILにおける復旧オプションは、災害時のITサービス継続性管理(ITSCM)で重要度と予算に応じ選択する6つの戦略です。低コスト・長時間復旧のコールドスタンバイから、高コスト・即時復旧のホットスタンバイ、相互協定、手作業まで、許容停止時間(RTO)に合わせて使い分けます。
主要な復旧オプション
一般的に以下の通り分類されます。
- 段階的復旧(コールド・スタンバイ)
- 場所だけ確保。災害時に機器搬入・セットアップ・データ復元を行う。時間と手間がかかるが低コスト。
- 中間的復旧(ウォーム・スタンバイ)
- 機器を一部または全部設置済み。データやプログラムを搬入し、システムを立ち上げて復旧。
- 高速復旧(ホット・スタンバイ)
- 同等機器と最新データを常時用意。災害時に切り替えて復旧。
- 即時的復旧(ホット・スタンバイ)
- 2つの拠点で同時稼働。片方が止まってもサービスを止めず、自動的に継続。コストは非常に高い。
- 相互協定
- 他社と相互利用協定を結び、緊急時に相手のリソースを利用する。
- 手作業のワークアラウンド
- ITサービスが復旧するまでの期間、紙ベースなど手作業で業務を継続する緊急措置。
復旧オプションの選定基準
以下の要素を総合的に判断して決定します。
- 目標復旧時間 (RTO): どのくらいの時間で復旧する必要があるか。
- 目標復旧時点 (RPO): どの時点のデータまで復旧する必要があるか。
- コスト: 復旧のスピードとコストのバランス(高コストなほど迅速)。
これらはインシデント管理や変更管理とは異なり、災害などの重大な中断に対処する計画となります。
バックアップ方式
バックアップ方式は、主に「フル」「差分」「増分」「永久増分」の4種類があり、データ量、時間、保存容量のバランスで選定します。全データを保存する「フル」は復元が容易ですが時間がかかり、変更点のみを保存する「増分」「差分」は高速で容量を節約できますが、復元が複雑になります。
主なバックアップ方式の種類と特徴
- フルバックアップ :
- 特徴: 指定したデータをすべてバックアップ。
- メリット: 復元が最も簡単。
- デメリット: 時間と容量がかかる。
- 増分バックアップ :
- 特徴: 前回バックアップした時点からの変更分のみをバックアップ。
- メリット: バックアップ時間・保存容量が最も少ない。
- デメリット: 復元時にフル+各増分が必要となり、時間がかかる。
- 差分バックアップ :
- 特徴: 初回フルバックアップ以降の変更分のみをまとめてバックアップ。
- メリット: 増分より復元が短時間(フル+最新差分)。
- デメリット: 差分が次第に増え、容量を圧迫する。
- 永久増分バックアップ :
- 特徴: 初回フル後、増分のみを継続。最新の「仮想フル」を常に作成。
- メリット: 高速、小容量、フルバックアップの再取得が不要。
- デメリット: 複雑な管理技術が必要。
使い分けの目安
- データ容量が小・中規模: フルバックアップ。
- データ容量が大規模・時間短縮したい: 増分/差分バックアップ。
※システム全体をそのまま保存する「イメージバックアップ」や、稼働中に取得する「オンラインバックアップ」といった方法もあります。
可用性管理
可用性管理とは、ITサービスやシステムが必要な時に問題なく利用できる状態(稼働率)を維持・向上させる活動です。ITILに基づき、SLA(サービスレベル合意)で定めた目標を達成するため、冗長化、監視、定期的な性能分析、復旧計画の策定を行い、事業の安定継続を担保するプロセスです。
概要と重要性
- 目的: システム障害による停止時間を最小化し、利用者が必要とする時にサービスを使える状態にすること。
- 対象: ネットワーク、サーバー、アプリケーション、データなど、サービスを構成する全要素。
- 関連プロセス: サービスレベル管理(SLM)、ITIL v4、キャパシティ管理。
構成する4つの要素(信頼性・保守性)
可用性管理では、単に「動いているか」だけでなく、以下の要素を管理します。
- 可用性 : システムが稼働している能力。
- 信頼性 : 故障せずに稼働し続ける能力(MTBF:平均故障間隔で測定)。
- 保守性 : 故障時に迅速に復旧する能力(MTRS:平均サービス回復時間で測定)。
- サービス性 : 外部サプライヤがサポートを提供する能力。
主な活動とKPI(指標)
- 冗長化: コンポーネントを二重化し、単一障害点(SPOF)を排除する。
- 監視: リアルタイムでシステムの正常性を常時監視する。
- 計画と改善: 障害対策の策定、定期的なバックアップと復旧テスト。
- 評価指標 (KPI):
- 稼働率: 目標値の達成度。
- MTBF : 平均故障間隔。
- MTRS : 平均復旧時間。
可用性管理のプロセス
- 要件特定: 事業への影響度から必要な可用性レベル(稼働率99.9%など)を決定。
- 設計・実装: 冗長化や監視ツールの導入。
- 監視・報告: SLAに基づく稼働状況のモニタリング。
- 分析・改善: 障害原因の特定と恒久対策の実施。
可用性を高める技術
UPS(無停電電源装置)
UPS(無停電電源装置)は、停電や電圧低下などの電力障害時に、バッテリから電力を供給し続けてコンピュータや精密機器を正常にシャットダウンさせ、データ損失や故障を防ぐ装置です。主な給電方式には常時インバータ、常時商用、ラインインタラクティブがあり、機器の安定性やコストに応じて選択されます。
主な詳細
- 目的と役割: 停電発生時に瞬時にバックアップ電源に切り替え、サーバーや医療機器などを安全に保護する。
- 主な給電方式:
- 常時インバータ給電(オンライン): 最も安定した高品質な電源を供給。常にインバータを通すため、電圧変動に強い。
- 常時商用給電: 低コストで小型。平常時は商用電源をそのまま流し、停電時のみバッテリに切り替わる。
- ラインインタラクティブ: 常時商用と常時インバータの中間的な性能。
- 構成要素: バッテリ(蓄電池)と電力変換回路(インバータ・コンバータ)で構成される。
- 用途: データセンター、病院の医療機器、オフィスのパソコン、防災設備など。
商用電源
電力会社から一般家庭や工場へ供給される送電・配電網を通じた交流電力(AC)のことです。
ミラーリング
ミラーリング(特にRAID 1やDBミラーリング)は、データを同時に複数のストレージへ書き込むことで冗長性を確保し、ハードウェア故障時にシステムを止めずに稼働し続ける「可用性」を高める技術です。1台が故障しても即座に代替え機が動作するため、ビジネス継続性向上に直結します。
可用性向上の詳細
- 特徴: データ保護とダウンタイム最小化。1つのドライブが故障しても、もう片方が動作するため、データ損失を最小限に抑え、サービスを継続できる。
- 適用例: データベース、重要データ、サーバー環境。
- メリット:
- 高可用性: 故障時にデータを復元する必要がなく、稼働を維持できる。
- 高速な読み込み: 2台のドライブから並列でデータを読み込める場合がある。
- デメリット/注意点:
- コスト高: 同じデータを2倍のストレージに保存するため、容量コストが2倍かかる。
- 故障確率: 物理的なドライブ数は増えるため、故障自体は2倍になる。
- 論理エラー: ファイルの誤削除やウイルス感染によるデータ破損は、そのままミラー側に反映される。
ミラーリングは、バックアップ(過去のデータ復元)とは異なり、主に「現在稼働しているシステムの継続性(可用性)」を担保するための機能です。
デュプレキシング
デュプレキシングは、主にディスクの信頼性を高めるために、1つのディスク制御装置に2台のハードディスクを接続し、同じデータを同時に別々のディスクへ書き込む方式です。一方が故障してももう片方で運用を継続できる耐障害性向上の技術です。
詳細と特徴
- 構造: デュプレキシングは、1つのインターフェースボードから2台の記憶装置へデータを個別に書き込む仕組みです。
- メリット: ミラーリング(1つの制御装置で2台のディスクを共有)とは異なり、ディスク制御装置の故障時にも、別の制御装置(対になるもう一つのセット)を用いてデータを保護できるため、より高機能な冗長化技術とされます。
- 主な用途: データベースのデータやログなど、絶対にデータを失いたくない重要なデータの管理に用いられます。

コメント