クラウドの監視と保守とは?業務の違いも解説

公開日:2021年12月24日最終更新日: 2021年12月24日

クラウドでシステムやWEBサービスを導入、設置した後は「監視・保守」が必須です。システムなどの安定稼働を目指すためは、導入して放置するのではなく監視や保守に移行しなければなりません。

しかし、残念ながら「監視・保守」の概要が理解できていない人や重要性を理解できていない人が多くいます。今回はこれらの概要から重要性、監視と保守の違いなどについて解説します。

なぜクラウドの「監視・保守」が重要なのか?

クラウドの「監視・保守」が重要な理由は、クラウドで発生したトラブルの影響を最小限に抑えるためです。どのようなクラウドにおいても、「クラウド自体の障害」「設置したシステムやWEBサービスの障害」をゼロにはできません。

障害をゼロにできない以上、サービスなどの提供者は障害に備える必要があります。これは障害による「業務効率の低下」「クライアントからの機会損失」「ブランドイメージのダウン」「問い合わせの増加」などを防ぎたいからです。

まずはクラウドで障害が起きると、会社にとって多かれ少なかれマイナスの影響があることを認識しなければなりません。

会社にとってマイナスの影響があると認識できれば、監視・保守の重要性も認識できるはずです。今まで監視・保守の重要性を理解できていない、蔑ろにしてきたなどの状態であった人は、今すぐに認識を改めましょう。

クラウドの監視と保守の違い

クラウドを安定稼働するための「監視」とは

監視はクラウドで構築したシステムやWEBサービスが「稼働しているか・ネットワークには問題ないか」を24時間365日途絶えることなく評価します。事前に定めておいた仕組みを利用して、死活監視や障害監視などを行う、クラウドでシステムやWEBサービスを提供するにあたり最も重要な業務です。

例えばクラウドのサーバー監視業務では、以下の観点からシステムやWEBサービスを監視します。

  • システムやネットワークは動作しているか
  • CPUやメモリの使用率に異常はないか
  • ストレージ容量に異常はないか
  • ミドルウェアは正常に動作しているか
  • SSL証明書の有効期限に問題はないか

これらの監視項目はシステムやWEBサービスの安定稼働に必須なものです。皆さんもこれらの項目に異常(障害)が発生すると、安定稼働を揺るがすとイメージできるでしょう。異常の発生時はシステムやWEBサービスが利用できなくなる可能性があることは言うまでもありません。

もし、このような障害の発生に気づけなかったり気づくのが遅くなるとどうなるでしょうか。これは遅くなれば遅くなるほど大損失に繋がります。社内システムであれば業務効率を下げてしまいますし、社外向けECサイトであれば売上などの機会損失に繋がります。また、クライアントから引き受けているシステムならばクレームや損害賠償に繋がりかねません。

障害による損失を防ぐためには「いち早く障害の発生に気づく」ことが大切です。これを実現するためには、常にクラウドサーバーを監視して検知できなければなりません。可能な限り専門の担当者をおいて、障害が起きればスグにでも行動できるようにすべきです。

ただ、システムやWEBサービスの提供者が自分で24時間365日の監視をするのは現実的ではありません。監視をする体制を組むと莫大なコストが生じてしまいます。監視業務は専門スタッフが常駐できるジードの監視サービスへご相談ください。監視項目や障害発生時のフローなど、必要な事項をご提案させていただきます。

大切なシステムやWEBサービスを365日24時間監視します

クラウドの障害発生時に必須の「保守」とは

保守はクラウドで障害が発生した場合、その原因がクラウドにあるのか構築に利用したプログラムなどにあるのかを調査します。また、クラウドで構築したシステムやWEBサービスを安定稼働させるために、改修や不具合の修正などを行う業務です(ジードでは改修や不具合の修正を「運用」と呼んでおります)。

障害に関連する業務であることから、保守は監視と強いつながりがあります。

例えばクラウドで障害が発生した場合、保守担当者は「クラウドの障害」「システムやWEBサービスの障害」「外部からの攻撃」のいずれであるかの切り分けが必要です。担当者は切り分けを行い、その結果に応じて適切な対応を行います。

まず、原因がクラウドの障害であった場合は、サーバーやプロセスなどの再起動を行い復旧を目指さなければなりません。監視業務によりいち早く障害を検知して、短時間での復旧を実現する役割を負うのです。

ただ、状況によっては再起動などでは復旧できず、脆弱性対応のアップデートなどが必要になります。そのような場合は、速やかに必要なアップデートなどを洗い出し、復旧に向けて適用作業を行います。

また、原因がシステムやWEBサービスの場合、これらの管理者と連携を取り、保守担当者が主体となった調査が必要です。状況によっては開発ベンダーなどとも連携を取りながら調査を進め、可能な限り早い復旧に向けて作業を行います。

他にも、外部からの無差別攻撃が原因となる場合もあります。このような攻撃を検知した場合は、ネットワークの遮断など必要な措置を講じなければなりません。この状態で、復旧に向けて対策の立案・実行を進めます。

どの原因であっても、速やかな対応が求められます。つまり、24時間365日体制で保守・運用担当者は必要となるのです。

しかし、監視と同様にシステムやWEBサービスの提供者が保守担当者を用意するのは現実的ではありません。確実な保守を実現するためにも保守・運用業務はジードにお任せください。専門スタッフが24時間365日体制でシステムの保守・運用を行い、スムーズな対応やご連絡を実現します。

クラウドの安定稼働には、障害時の素早い対応が大切です

監視と保守は密接につながりつつも、全く違う業務

監視と保守は大きく異なる業務です。これらの違いを理解して、適切な体制でシステムやWEBサービスの提供をしなければなりません。

まず、監視はご説明の通り「システムやWEBサービスに異常がないかを監視する業務」です。クラウドに構築されたシステムやWEBサービスは、運用後いつ障害が起きてしまうか予想できません。運用してからのトラブルに備えるために “24時間365日システムの状態をチェックする” のが監視です。

続いて、保守・運用は「運用しているシステムやWEBサービスの障害対応や改修をする業務」です。システムやWEBサービスは運用後にトラブルが発生したり新しい要望が出たりします。また、監視した結果として障害が発生した場合はこれにも対応します。

上記のとおり監視と保守は「障害を検知する役割かどうか」との観点で大きな違いがあります。監視の担当者は障害を検知しますが、保守の担当者はそうではありません。監視の担当者からの情報提供を受けて対応します。

また、監視担当者は手順書に沿って行動するのが一般的です。事前に障害のパターンは想定されていて、そのパターンに当てはめた対応が求められます。しかし、保守は監視とは違いパターンなどは厳密にはなく、その都度適切な対応が求められます。

まとめ

クラウドで構築したシステムやWEBサービスの監視や保守の重要性についてご説明しました。これらの重要性が理解できておらずないがしろにしている会社が見られますが、障害が発生するリスクを踏まえるとむしろ重要視しなければなりません。

基本的にはクラウドでシステムやWEBサービスを提供するならば、監視や保守・運用を前提とした設計をしなければなりません。設計もなく行き当たりばったりで進めようとすると、監視を行っても意味が薄れてしまう可能性があるのです。

ただ、専門的な知識を持たずに、監視や保守・運用を設計するのは難しいでしょう。そのため、クラウドの設計段階よりジードにお任せください。専門知識をもつスタッフが最適な運用設計を行い、実際の監視や保守・運用業務についても一貫してお引き受けいたします。

クラウドの運用代行は20年の実績をもつジードにお任せください

クラウドの監視・保守・運用

クラウドの運用代行や導入、開発は22年の実績をもつジードにご相談ください

  • クラウドの運用代行

    クラウドの監視・保守・運用の代行 お客様が運営するクラウドの監視・保守・運用業務を、ジードが代行いたします。

    サービスの詳細はこちら

  • クラウドの設計・構築

    クラウドの設計・構築 お客様のご要望に沿って、適切なクラウド選定から設計・構築までを行います。

    サービスの詳細はこちら

  • クラウド上でのシステム開発

    クラウドの設計・構築 Azure上で、AI + 機械学習、分析、ブロックチェーン、IoTを開発します。

    サービスの詳細はこちら

お問い合わせ・お見積もりのご依頼はお気軽に

Scroll to top