2023年12月6日水曜日

データセンター障害によるビジネスへの影響を未然に防ぐには? ー センサーが不可欠な理由

データセンターでオーバーヒートが発生したら何が起きるでしょうか。実例として、2023年10月、シンガポールの大手銀行DBSとCitibankにおいて数時間にわたり停電が発生しました。影響を受けたサービスには、オンラインバンキング、クレジットカード、デジタル決済、複数箇所に設置されているDBSのATMなどが含まれます。

また、「Data Center Dynamics」「Channel NewsAsia」によると、東南アジア、インド、アラブ首長国連邦、モルディブなどにおいて、Facebook、WhatsApp、Instagramのほか、「Call of Duty」のサーバーへのアクセス障害も発生していました。

これらの障害はすべて、前述のビジネスをサポートしているデータセンター内のホールがオーバーヒートしたことに起因しています。データセンター事業者であるEquinixは、請負業者側のミスが水冷システムの技術的問題を引き起こした、と言及しました。

Uptime Instituteが発表した「Annual Outage Analysis 2023」によると、近年、停電発生件数は減少傾向にあるものの、発生した場合にかかるコストは上昇しており、全体の3分の2以上が10万ドル以上にのぼるとされています。

今回の場合、影響を受けたビジネスに対する報道の多さや否定的な世論を考えると、そのコストは10万ドルと同等もしくはそれ以上に及ぶでしょう。

環境センサーによる予防的危機管理

データセンター管理者は、どのようにしたら過冷却や温度関連の障害を未然に防ぐことができるのでしょうか。

その答えは、環境センサーを適切に配置することです。なぜなら、計測できないものを管理することなど不可能だからです。

暑すぎ?寒すぎ?正確な温度を知る

まずは温度モニタリングについて説明します。コンピュータ室の空調(CRAC)だけで温度を確認するよりも、温度センサーをラックレベルに設置したほうが、データセンターの温度をより正確にリアルタイムで表示することができます。さらに、温度センサーにより温度傾向を把握できるようになるので、データセンター管理者は潜在的な問題箇所(ホットスポット)に事前に対応できます。

温度(および湿度)センサーを設置する際は、1つのラックに1つのセンサーを設置しただけで安心しないことも重要です。ASHRAEが公表しているセンサーの配置に関するガイドラインを参考にしながら、ダッシュボードがラックの上部、中間部、最下部からの計測も行っているようにしてください。必要な投資を懸念されるかもしれません。しかし、正確な温度データを得ることで、これらのセンサーを設置した直後から運用コストを大幅に削減できる可能性があるのです。

空気に関する考慮事項:エアフロー、品質、圧力

温度センサー以外にも、エアフローセンサーの設置も大切です。エアフローセンサーは、ラックでの冷気の流れや暖気の戻りを監視し、冷却システムが正しく機能し、エアフローがラック全体の温度を適切に保っているかを確認できます。

ホットアイルまたはコールドアイルのコンテインメントも重要な役割を担います。空気差圧センサーは、アイル内の仕切りからの空気漏れのサインとなる空気圧のブレを検知します。

施設が床下に冷却システムを導入している場合、差圧センサーも床下に設置することが重要です。これは、コンピューター室エアハンドリングユニット(CRAH)、CRAC、または床下の圧力設定値に合わせるためにファン速度を調整する建物管理システムにフィードバックを送るためです。

さらには、煙センサー、炎センサー、空気品質センサーも忘れてはなりません。これらのセンサーは、煙、汚染物質、火災の兆候を検知し、アラームを発信することで早急な対応を可能にし、データセンター内の他の場所への影響を最小限に抑えます。

適切な水管理:湿気と漏水

水を活用した冷却システムをのぞいて、通常、湿気はデータセンターの厄介者とされていますが、熱帯地域は非常に高湿度です。

湿度センサーは、湿度レベルのバランスが適切に保たれているかを監視するのに役立ちます。これにより、施設管理者は静電気放電(湿度不十分の場合)や結露の発生(高湿度の場合)を防ぐことができます。

空気中の湿気のほかに、上部と床付近に漏水センサーを設置することで、天井設備からの漏水や水冷システムラックのパイプからの漏水などを検知できます。50%のグリコール混合物が検知され、管理者にアラートが発信される場合もありますが、これは確実にシステム漏れが発生したことを表しています。

適切なソリューションを使い、センサーを補完

適切なセンサーへの投資以外に、それらのセンサーがデータセンターに既存のモニタリングシステムや管理システムに対応しているかを考慮してください。

データセンターにおいてセンサーデバイスと既存システムが連携できない場合、対処のためにインテリジェントセンサーハブやラックPDUを投入しなければならないことがあります。これらのコンポーネントは、センサー、既存システム、データセンターインフラストラクチャ管理(DCIM)ソリューション間における中心的な接続ポイントとしての役割を担います。これにより、センサーデータを適切に保管、収集、アクセスすることが可能になります。

センサーをインフラストラクチャの他の部分に接続するデバイスは、サードパーティ製センサーに対応しているものが理想的です。また、ラックやエリアでの運用をなるべく中断させないよう、迅速なインストールが可能であることが求められます。

データセンターの建設や増築の場合、例えばラリタンのPX3/PX4 PDUについては、業界トップのXerusテクノロジープラットフォームを基盤とした内蔵コントローラーを搭載しています。これは、オープンAPIを介して多岐にわたるセンサータイプとの互換運用やサードパーティとのシステム統合を可能とします。

ラリタンのスマートラックコントローラーは、既存の環境で柔軟な取り付けが可能です。こちらもXerusテクノロジープラットフォームを搭載しており、さまざまなセンサータイプ(サードパーティ製も含む)に対応しています。

[インテリジェントな制御の効果についてはこちらの記事をお読みください。「台湾のTelco、Raritan SRCを使用して5G基地局の監視を強化」]

戦略的な設計と管理のためのデータを提供

適切な有線接続または無線接続、戦略的なポイントに設置された環境センサー一式、適切なモニタリングツールにより、環境データを利用したりトレンドを特定したりできるようになります。また、IT機器周辺の運用状況に変化が発生した場合、アラートを受信することも可能です。

リアルタイムによるデータモニタリングと計測は、在宅勤務を容易にするだけでなく、手間になりがちなタスクをセンサーに任せることで、現場スタッフを削減できます。また、取得データのグラフ化が可能になり、過去から現在に至る傾向的なデータに基づくレポート作成や、問題解決のための調査が容易になります。

さらに、予知保全が可能になるため、ダウンタイムを最低限に抑え、緊急メンテナンスや修復にかかる運用コストを削減できます。

今回は、データセンターの環境条件や環境変化の監視における環境センサーの重要性についてお伝えしました。環境管理が徹底されていないと、アップタイムに影響したり、先日シンガポールで起きたような停電が引き起こされたりする恐れがあることがおわかりいただけたかと思います。

当社の革新的なデータセンターソリューションを自社のデータセンターにどのように活用できるかについてご興味のある方は、sales.japan@raritan.comにお問合せください。

0 件のコメント:

コメントを投稿