2021年9月7日火曜日

火事と氷:データセンターの環境モニタリング

今回のラリタンのブログでは、データセンターの火災検知と防止のためのデータセンターの環境モニタリングとスマートセンサーの役割について取り上げます。 

データセンター業界にとって、この春は例年になく厳しいシーズンとなりました。この数ヶ月の間に、注目すべき大規模なデータセンターが停止する障害がいくつか発生しています。2月には極寒の気候と猛烈な氷嵐により、米国南部の多くの地域が停止し、その後ニュースになるようなデータセンターの火災がいくつか発生しました。3月には、フランスのホスティング企業であるOVHが、SBG2施設で大規模な火災に見舞われました。 動画が撮影されていますのでご覧ください。その後、バッテリーに関連する事故が発生し、SBG1施設で大量の煙が充満したため、2週間も経たないうちに修復不可能と判断されました。  

データセンターの災害対策には、火災対策が必須です。 

Uptime Instituteのアンディ・ローレンスによると、今回のOVHの事故は彼らが監視している最近の10件のデータセンター火災のうちの1件に過ぎません。OVHの火災の原因については複数の専門家が推測していますが、共通しているのはデータセンターの設計の問題です。この種の事件は、「the best laid plans of mice and men」(=誰もが最善の計画を立てたにも関わらず、実際にはうまくいかない事がある)を思い出させてくれますし、慎重に設計された施設にも脆弱性があることを教えてくれます。皮肉なことに、ほとんどのデータセンターの火災は、災害時に電力を供給するために設計されたシステムが原因となっています。  

OVHの2つの事件の場合、原因はUPSとバッテリーシステムでした。実際SBG1で発生した2件目の火災は、使用されずに保管されていたバッテリーが原因とされています。また最近では、4月上旬にユタ州のWebNX社の施設で、停電時に施設を支えていた非常用発電機が壊滅的な故障を起こしました。  

予防のための1オンス 

現在、業界では耐火・防火といった安全確保を高めることに重点が置かれていますが、ほとんどのラックPDUメーカーではデータセンターの環境センサーを提供していることを覚えておく必要があります。サーバ入口のラック空気温度、湿度、気流、振動、煙、水、気圧などを測定するセンサなどです。ラックマウントPDUの中には、あらかじめセンサーが取り付けられているものもあれば、オプションでプラグイン式の外部センサー用のコネクタが用意されているものもあります。   

ラックベースのセンサーは障害発生前、発生中、発生後のいずれにおいても重要な役割を果たします。  

  • 発生前:センサーや検知器をラックごとに設置することで、データセンターの中で最も脆弱な部分であるIT機器の周囲にセキュリティの層を設けることができます。  
  • 障害発生時:ラックレベルの検出器からのフィードバックにより、オペレータは問題の広がりをリアルタイムで把握し、施設内のどこでどのように障害が広がっているかを正確に特定することができます。  
  • 発生後:ラックベースの検出器から保存されたデータは、企業、関連当局、捜査官に事象についての判断材料となる分析に重要な情報となります。  

環境センサーは、データセンターや施設内で被害が拡大する前に、早期に警告を受け、火災を抑え、可能な限り迅速に消火することを可能にします。  

スマートセンサの詳しい情報やデータセンターの監視ニーズへの対応について、ラリタンにお問い合わせください。

0 件のコメント:

コメントを投稿