ストレージ監視とは、物理ストレージまたは仮想ストレージデバイスのパフォーマンス、可用性、全体的な健全性を監視することを表し、「ストレージパフォーマンス監視」とも呼ばれます。データストレージは、スプレッドシートの操作からメールのチェック、インターネットを使用したXboxでのビデオゲームのプレイまで、あらゆるタイプのコンピューター処理を支え、Dell社、EMC社、Microsoft社をはじめとする多数のベンダーが提供しています。実際、主なコンピューター処理の中で、ストレージへのアクセスを一切必要としないものは存在しないといっても過言ではありません。
ストレージは、ITインフラに欠かせないテクノロジーコンポーネントである一方で、問題の原因にもなりがちです。たとえば、ネットワークストレージは、コンピューターやサーバーの処理の中で最も低速で、使用されているハードウェア技術によっては重大なボトルネックになることもあります。特に、多数のユーザーが同じデータに同時にアクセスしようとするときにその傾向が顕著で、こうした過負荷はDDoS(分散型サービス妨害)攻撃でよく悪用されます。ストレージデバイス、特に昔から使われているハードディスクドライブは、部品の消耗が故障につながり、障害が発生しやすいという性質があります。また、ディスクがいっぱいになれば拡張やアップグレードが必要になり、データが増え続ける限り拡張やアップグレードを続けていかなければなりません。つまり、コンピューティング環境に常に高いパフォーマンスと可用性が求められる中で、ストレージ監視ソフトウェアやツールの導入は、それを実現するためのベストプラクティスの1つと言えます。
また、今日の企業ではストレージの仮想化が進み、クラウドプラットフォームによってデータの物理的な場所がユーザーから離れた場所に抽象化されていることにも注意が必要です。仮想ストレージは、データのアーカイブやバックアップ、Webサービスやアプリケーションサービス、そして最近ではWebベースのメールサービスやオフィススイート(Googleドキュメントなど)によく使用されます。
この記事では、さまざまなタイプの企業向けストレージ、ストレージ監視の仕組み、ストレージ監視ソリューションを選ぶときのポイントについて説明します。
ストレージ監視とは:目次
NAS (Network-Attached Storage)とSAN (Storage Area Network)は、いずれもオンプレミスの代表的なネットワーク接続ストレージです。名前が似ていて混同されがちですが、2つは異なる技術です。
NASは、組織のLANに接続するハードウェアデバイスです。一般的にNASデバイスは、Ethernetなどの有線接続を使用し、設定が簡単でコスト効果が高いのが特徴です。ストレージの空き領域が少なくなったときは、新しいNASデバイスを調達してネットワークに接続するだけで、すぐに組織内で利用できるようになります。NASデバイスには、複数のドライブベイを搭載してミラーリングやRAIDなどのフェイルオーバーを実現できるものから、家庭でも使えるシンプルなものまであります。
SANは、単一のデバイスではなく、ストレージデバイスで構成されるネットワークを指します。SANに含まれるデバイスは、組織のEthernet LANから切り離された専用ネットワークに、通常はストレージ用のファイバーチャネルを介して接続し、クライアントコンピューターにデータを提供します。SANはNASに比べて高価で複雑であるため、低遅延とダウンタイムゼロが求められる用途でのみ使用するのが一般的です。たとえば動画編集や監視カメラの録画では、転送されるデータが大量であると同時に高スループットと低遅延が求められるため、SANがよく使用されます。また、SANではデータが独自のプライベートネットワーク内で転送されるため、LANでの輻輳を避け、高速で安定したデータ転送を維持できます。
要約すると、SANは高速で拡張性が高く、ハイエンドな用途に適していますが、コストが高く、プライベートファイバーチャネルネットワークも含めて管理に高度な専門知識が必要です。一方、NASは、コストが低くシンプルで、LANに接続するPCから簡単に設定できます。
AWSストレージ監視などのクラウドストレージ監視とは、クラウドインフラ内のストレージシステムを観察、調査、管理することです。一般的には自動化された監視ソフトウェアによって1カ所からクラウドインフラにアクセスしてインフラ全体を制御します。自動パフォーマンス監視では、ユーザーの数とタイプ、データベースのパフォーマンス、サーバーの応答時間、リソースの使用量、システムやプロセスのパフォーマンス、セキュリティやその他の問題などに関するメトリクスを追跡して、可用性を測定し、パフォーマンスを分析できます。管理者は、クラウドのサーバーやコンポーネントの運用状況と健全性を確認し、システムの問題や不審なアクティビティを調査できます。これらのメトリクスを継続的に評価すれば、ストレージシステムの問題や脆弱性が大きな問題に発展して損害をもたらす前に、その兆候を捉えることができます。
ストレージのパフォーマンスを評価するときは、ストレージデバイスの実行状況、ネットワークのパフォーマンス、その他のパフォーマンスの問題について確認すべき重要なポイントがいくつかあります。たとえば、以下のようなポイントがあります。
ストレージのパフォーマンスを監視するときは、上記のポイントを確認するためのメトリクスを使用します。ストレージで監視すべき主なパフォーマンスメトリクスには以下のものがあります。
これらのメトリクスはいずれもリアルタイムでサンプリングされ、特定の時間枠(過去1時間など)の平均値が分析されて、長期的な変化がグラフで表示されます。ITチームはこれらの統計を監視し、大きな問題の兆候と考えられる変化を注視します。既存の管理ソフトウェアスイートに、注意が必要な状況を自動的に判断してアナリストに通知するような優れたストレージ監視ソフトウェアが含まれていれば、監視を効率化できます。
IT環境のストレージ監視に関する一般的なベストプラクティスには以下のものがあります。
近年、ストレージ監視ツールは成熟し、特に企業向けのツールは幅広い機能を備えています。一般的にはいずれの製品も以下のカテゴリの1つまたは複数に該当します。
ストレージ監視ソリューションを適切に活用すれば、数多くのメリットが得られます。主なメリットには以下のものがあります。
複雑な環境ではストレージ監視も複雑になりがちです。ハードドライブが十分な性能を発揮し、空き領域に余裕があることを確認するだけでは十分ではありません。ストレージ監視で直面する可能性のある課題には以下のものがあります。
IT環境で保存するデータの急増を削減および最小限に抑えるには、以下の方法があります。
重要なストレージ監視パラメーターは、前述のストレージ監視メトリクスと同じで、遅延、スループット、IOPS、使用率、キューの長さ、使用可能な容量などが特に重要です。ストレージインフラには、ストレージアレイ、ストレージプール、ボリューム、LUN (論理ユニット)、ディスクなど、さまざまなレベルがあり、一般的に監視パラメーターはこのレベルごとに測定します。ここに示した5つのレベルはストレージシステムの粒度の大きい順に並んでおり、ストレージアレイが最も単位が大きく広範で、単一ディスクが最も小さく限定的です。
ストレージ環境を監視するときは、これらのレベルの運用パラメーターを個別に確認する必要があります。たとえば、ストレージアレイレベルのメトリクスではアレイ全体が適切に動作していることを示していても、ディスクレベルで詳細を調べると、特定のディスクが過負荷状態で、対応が必要である場合があります。
ストレージインフラの監視を始めるには、以下の手順でストレージ監視ソリューションを導入します。
ストレージは、組織のITインフラの中で最も重要であると同時に最も信頼性の低いコンポーネントです。そして、そこには不変の真理があります。それは、ストレージの重要性は組織によってさまざまでも、今日のビジネス環境とビジネスユーザーにとって、信頼できるストレージにアクセスできることが必要不可欠だということです。信頼できるストレージがなければ、いかなるレベルのデジタル処理も実現できません。ストレージ監視は、他のITシステムの管理ほど複雑ではありませんが、その重要性は同じです。ストレージでエラー、障害、ダウンタイムの発生は避けられません。問題は、それらがいつ発生するかです。ビジネスを危険にさらさないためには、適切なストレージ監視ソリューションに投資することが何よりも大切です。