データインサイダー

サーバー監視とは? 

サーバー監視は、物理サーバーや仮想サーバーのアクティビティを可視化するプロセスです。サーバーは、デバイスを指すこともあれば、最近では「アプリケーション」を指すことも多くなりました。サーバーは、他のデバイスやアプリケーションに提供する情報、またはオンデマンドでユーザーに提供する情報を保存して処理します。1台のサーバーが数百、あるいは数千ものリクエストを同時に処理することもあり、組織内の全サーバーが期待どおり動作しているか監視していくことは、ITインフラ管理においてきわめて重要です。

ただし、サーバーには非常に多くの種類があり、「サーバーの監視」と一口に言っても実際はそれほど単純ではありません。Webサーバーは物理デバイスであることもありますが、最近では仮想サーバーが増えています。仮想サーバーは多数のクライアントが共用する物理マシンに収容されており、そこでそれぞれのクライアントが独立したWebサーバーシステムを運用しています。メールサーバー、プリントサーバー、データベースサーバーは、多種多様なサーバーデバイスやソフトウェアのほんの一部です。

このように多様なサーバーについて、問題を監視してアラートをあげるには、それぞれに応じた監視技術が必要であり、一般的に使用されているような既製のサーバー監視ツールですべてに対応することは難しいでしょう。この記事では、各種サーバー監視ツールや監視サービスがどのように動作し、どのような価値を企業にもたらすか、そして組織にとって最も適したシステムを選択する方法について説明していきます。

サーバー監視の概要

サーバー監視が重要である理由

サーバーはITインフラにおいて最も重要な要素の1つです。IT環境の健全性を確保するには、サーバーのパフォーマンスとアップタイムを監視することが欠かせません。Webサーバーが障害やパフォーマンスの問題を起こし、オフラインになったり、動作が遅くなると、顧客が別のサイトへ移動してしまう可能性があります。また、社内のファイルサーバーにエラーがあると、会計ファイルや顧客記録などの重要なビジネスデータが破損しかねません。

サーバー監視は、システムを監視してシステムの稼動状況に関する複数の重要なメトリクスをIT管理者に提供するように設計されています。一般的に、サーバー監視ツールはアクセス性(サーバーが稼動しており、アクセス可能かどうか)をテストし、応答時間(ユーザーの期待に沿った速度が出ているか)を測定して、エラー(ファイルの損失や破損、セキュリティ違反、その他の問題)を知らせます。さらに、十分なディスク容量が残っているか、メモリやCPUの使用率が高く、逼迫しそうかなどについての予測も行います。サーバー監視はおもにリアルタイムのデータ処理に使用されますが、履歴データを評価するという観点でも価値があります。過去数週間または数カ月分のデータを分析することでサーバーのパフォーマンスの劣化状況を判断し、場合によっては完全にクラッシュする時期を予測できることもあります。

サーバー管理の画面

サーバー管理とは?サーバーの管理が難しい理由

サーバー管理とは、サーバーのアップタイムと信頼性を確保して高パフォーマンスかつエラーのない稼動を維持していくための、継続的なサーバー運用プロセスです。より具体的には、サーバーを管理して稼動させ続けるために日々行うアクティビティを指し、常にサーバーを利用可能な状態に保って最適なユーザーエクスペリエンスを提供することを主な目的としています。

サーバー管理は組織やそのIT構成、運用しているサーバーの種類や数に応じて、さまざまな機能から構成されます。一般的な組織の場合、サーバー管理には毎日の監視、ソフトウェアアップデートのインストール、新しい機器のインストールと設定、トラブルシューティングと優先順位付けが含まれます。また、組織のニーズに合った十分なシステムリソースを確保するためのプロビジョニングやキャパシティプランニングが含まれることもあります。たとえば、ある企業のWebサーバーで、10,000人の同時接続ユーザーをサポートし、かつ12,000ユーザーまでのバーストを許容する必要がある場合、サーバー管理者はこのキャパシティをオンデマンドで確保しようとするでしょう。

仮想環境のサーバー管理では、サーバーに問題がないか実際にそのハードウェアまで行って確認するということができないため、特有の課題が生じます。とはいえ、サーバーが物理的なハードウェアデバイスである場合にも、やはり別の課題があります。いずれの環境であっても、スペース、電力、ネットワーク帯域幅、そしてそれらに対応する冷却能力という要素がある以上、サーバーはソフトウェアとハードウェアの両観点から管理していく必要があります。

サーバー管理の画面

仮想サーバーとは?

仮想サーバーとは、一般に、サーバーハードウェアの機能をエミュレートする共有ソフトウェア環境を指します。

仮想サーバーが普及したのは、物理サーバーのキャパシティが十分に活用されていないという認識が広まり始めたころです。キャパシティの10~20%程度しか使用しないのであれば、不要な処理能力に無駄な経費をかけていることになります。さらに、物理サーバーの場合、各サーバーについてかなりの量のメンテナンスが必要で、サーバーの管理、セキュリティ管理、その他の費用がかさむ監視作業も必要となります。そのため、サーバーを仮想環境へ移行することは、経費節約とROIという観点で賢明な選択肢であると言えるでしょう。

一般に、仮想サーバーは専門のプロバイダーから提供されますが、こうしたプロバイダーは、世界中のデータセンターに設置された膨大な数の物理サーバーから構成されるインフラを運用しています。サーバーのレンタル、プロビジョニング、管理は、洗練されたWebベースのインターフェイスを通じて、完全にオンラインで行うことができます。また、仮想サーバーは設定により構成でき、一元的に管理できるため、突然のアクティビティ増加に合わせてスケールアップしたり、ニーズに合わせてスケールダウンすることが可能です。さらに、ほとんどの仮想化ベンダーは使用した容量にのみ課金するため、物理サーバーに比べて仮想サーバーのコストは低くなります。

サーバー管理システムとは?使用する理由

サーバー管理システムは、ITプロフェッショナルが(多くの場合、複数台の)サーバーを管理するためのソフトウェアツールで、通常、運用データ(CPU使用率、メモリ、ディスク領域などのディスク使用のメトリクス、ログファイル、OS監視の統計情報、ユーザーアクセスおよびセキュリティ情報など)を収集し、それを管理ダッシュボードにリアルタイムで表示します。また、履歴データの収集も可能で、IT管理者はこれらのメトリクスの推移を監視できます。

仮想環境では、サーバー管理システムとハイパーバイザー(仮想マシンモニターとも呼ばれます)を区別する必要があります。ハイパーバイザーは仮想マシン(または仮想サーバー)の作成と運用を行うシステムで、その役割は複数の仮想マシンを運用者の仕様に従って稼動し続けることにあり、必ずしもパフォーマンス情報を監視するわけではありません。

 

サーバーパフォーマンス監視とは?

「サーバー監視」が広くサーバーの状態全体を対象とする用語であるのに対し、「サーバーパフォーマンス監視」はサーバーのパフォーマンスメトリクスのみを対象とします。物理サーバーでは、メモリとCPUの使用率、ディスクI/O、ネットワークパフォーマンスが基本的なメトリクスです。仮想サーバーでは、サーバーの種類にもよりますが、データベースやWebサーバーの応答時間、ネットワーク帯域幅の使用率、リソース使用率に関する各種の測定値がパフォーマンスメトリクスとなる可能性があります。

サーバーパフォーマンス監視は、さまざまな理由から重要です。第一に、速度の低下やその他のパフォーマンスの問題が、発生しつつある障害を特定する手がかりになるといったように、予測として機能することがよくあります。ボトルネックの特定はどのコンポーネントやサービスのアップグレードが必要かを知るために役立ち、キャパシティ管理ツールは新しいアプリケーションやその他の新規ワークロードをサポートするために必要なリソースを見積もる際に利用することができます。

さらに、サーバーパフォーマンス監視の情報が有用となるもう1つの要素として「契約の遵守」があります。多くの企業では一定レベルのアップタイムやパフォーマンスの提供を保障していますが、金融取引、SaaSサービス、ストリーミングメディアなどの負荷の高い環境では、保障されたアップタイムやパフォーマンスの維持が重大な意味をもちます。パフォーマンスが一定レベルを下回った場合、非常に厳しいペナルティが科されることさえあります。

オープンソース監視とは?

オープンソース監視とは、監視システムのコアとなるテクノロジーがオープンソースソフトウェアで構成されていることを意味し、Linuxなどのオープンソースツールを使用してITインフラやサーバーインフラ(ベンダー系サーバーかLinuxサーバーかを問わず)を監視します。必ずとは言えませんが、サーバー監視がオープンソース監視システムの主要コンポーネントである場合が多くあります。

オープンソースソフトウェアとは、コードが一般公開されていて、ユーザーがアクセスし、変更や配布を行うことができるソフトウェアのことで、Linuxはその一例です。オープンソースのツールは市販のソフトウェアツールと同等の機能を備えていることがありますが、ユーザーの多くはインストールが簡単で運用しやすいという理由から市販のツールを好みます。市販のサーバー監視ツール(特にクラウド上でサービスとして実行されるツール)には、そのまますぐに使用でき、操作が簡単で、より優れたユーザーエクスペリエンスを提供するソリューションが数多くあります。

一般的な監視システム

サーバー監視システムは、オンプレミス/従来型のソフトウェアベースシステム、クラウドベース/SaaSシステム、モバイルシステムの3つの基本タイプに分かれます。さらに、オンプレミスとクラウドの技術を組み合わせて独自のカスタムソリューションを提供するハイブリッドシステムもあります。各アプローチの長所と短所は以下のとおりです。

オンプレミス/従来型のソフトウェアベースシステムは、自社所有の社内ハードウェアにインストールされたソフトウェアを中心に構築されます。これは従来型のソフトウェアモデルであり、一般に初期費用が高額で、ベンダーから継続的なサポートを受けるための保守プランにも費用がかさみます。加えて、インストール環境がそれぞれに異なるため、オンプレミスのソフトウェアインストールは複雑で時間がかかり、トラブルが起こりがちです。とはいえ、オンプレミスのソフトウェアはカスタマイズオプションが豊富であり、また、データの保管場所についても制御しやすいことが多く、規制機関への報告時に便利です。しかしながら、一般的にオンプレミスのソフトウェアはクラウドベースと比較して高額です。

クラウド/SaaSシステムは、インストールと管理をすべてWeb経由で行う監視システムです。ユーザーのインフラ内にソフトウェアをインストールする必要がないため、システムの導入と立ち上げが迅速で、わずか数時間で済むことさえあります。クラウドサービスは柔軟性に富んでいますが、多くの場合、カスタマイズやパーソナライズを直接制御できません。クラウドベースの監視ソフトウェアはサブスクリプションとして販売されており、クラウド監視プロバイダーの多くは長期契約を必要としないため、オンプレミスのソリューションに比べて導入が簡単で、リスクも低く抑えることができます。

モバイルシステムはサーバー監視システムとしては主流ではありませんが、多くのオンプレミスやクラウドのプロバイダーがオプションとしてモバイル版システムもサポートしています。その名が示すとおりスマートフォンやタブレット上で実行され、移動中でもサーバー監視データにアクセスできます。ただし、PC版のシステムに比べ、モバイル版では機能が限られている場合があります。モバイル監視オプションはほとんどのクラウドベースシステムで提供されており、オンプレミスシステムの一部でも提供されています。

導入方法

サーバー監視のベストプラクティス

それぞれ環境が異なる場合でも、サーバー監視ソリューションへの投資から最大限の効果を得るために役立つ基本的なベストプラクティスがあります。

  • ハードウェアの運用を適切な許容範囲内に維持する:ファイルサーバーは動作限界まで酷使されることが多く、休む間もなく24時間365日稼動しており、ダウンタイムは許されません。そのため、すべてのサーバーが常に最高の物理パフォーマンスで稼動するよう、主要なメトリクス(CPU温度、CPUとRAMの使用率、ストレージ容量の使用率など)を注意深く監視する必要があります。これらのチェックは「ハートビート」チェックと呼ばれ、一定間隔で行うように設定します。
  • ソフトウェアの障害をプロアクティブに監視する:サーバー監視ツールを使用してソフトウェアとハードウェアに問題がないか監視します。たとえば、データベースが壊れた場合やセキュリティイベントによって重要なサービスが無効化された場合、またはバックアップが失敗した場合などに、サーバー監視ツールでエラーに関するアラートをあげることができます。
  • 履歴情報を活用する:何もないところから突然サーバーの問題が発生することは、まずありません。メトリクスの推移(通常は30日か90日)をグラフ化して、発生した問題の背景を検討することができます。たとえば、過去数日でCPU温度が急上昇している場合、サーバーのファンの故障を示唆している可能性があります。
  • アラートを常に監視する:アラートが発生したらすぐに優先順位を付けて、解決のためにアナリストに割り当てられるように、アラートはリアルタイムで監視する必要があります。ほとんどの場合、アナリストはこの方法によってシステムで起きている問題を判断します。ノイズにまぎれた重要なアラートを特定し、優先的に対応していくために、信頼性の高い方法を見つける必要があります。また、インシデントをエスカレーションする際には、チームがより効果的にコラボレーションできるように、必ず適切な担当者に適切なタイミングで行います。
  • クラウドの短期的なキャパシティプランニングにサーバー監視データを活用する:仮想サーバーを使用している場合、各時点で必要となる処理能力を見積もるためにサーバー監視システムが役立ちます。サービスの速度低下や、その他のパフォーマンス上の問題が起こり始めたら、サーバー監視ツールを使って状況を評価して速やかにリソースを追加したり、反対に需要が低い場合は一部のリソースをオフラインにすることができます。
  • 将来を見越したキャパシティプランニングを行う:データセンターのワークロードは過去5年間で約2倍になり、必然的にサーバーのワークロードもこれに追随しました。サーバー稼動率の傾向を長期的に監視することで、将来的なサーバーニーズ(オンライン、オフラインの両方について)に備えることができます。
  • 資産の管理と追跡を強化する:システムの寿命が近づいていたり、(多くの場合、故障または盗難により)ネットワークから資産が消失するような場合、サーバー監視によって手がかりを得ることができます。社内の物理ハードウェアの追跡は、スプレッドシートに頼るよりも、サーバー監視ツールを活用すべきです。

最適なサーバー監視ツールの特定

サーバー監視ツールを検討する際には、以下のような主要なサーバー監視機能を評価することをおすすめします。

  • 対応範囲:自社で使用しているすべてのタイプのサーバー(ハードウェアとソフトウェア、オンプレミスとクラウド)をサポートしているツールかどうか検討します。また、今後導入する可能性のあるサーバータイプに対応しているかどうかも重要です。
  • インテリジェントなアラート管理:トリガーとなるしきい値を構成するだけでアラートを簡単に設定できるか、アラートの配信方法はどのようなものか、モバイルユーザーは考慮されているかなどを評価します。
  • 根本原因調査のためのインテリジェンス:何らかの異常が発生した場合、問題の発生を単に知らせるだけではなく、ツールに含まれるロジックやAIアルゴリズムに基づいて問題発生の原因を判断するための情報を提供できるかどうか、確認します。
  • 使いやすさ:ダッシュボードが直感的に使用でき、イベントの監視、選別、問題への迅速な対応が容易でしょうか?
  • サポートのポリシー:困ったときにテクニカルサポートに簡単に連絡できるかどうかは、重要な要素です。

サーバー監視の結論

あらゆるIT運用においてサーバー監視機能は不可欠

サーバーは企業にとって必須の技術であり、最大限のサーバーパフォーマンスを得るためにIT管理者があらゆる手を尽くすのも、当然と言えます。そして、それを可能にするための鍵となるのが、優れたサーバー監視および管理システムです。ここで忘れてはならないのは、問題が発生した後にその問題を知らせるだけのツールは、最高のサーバー監視ツールとは言えないということです。優れたツールとは、潜在的な問題を、それが重大な障害を引き起こす前に知らせ、事前に解決策を講じることを可能にするようなツールです。

 

参考リソース