サーバダウンはなぜ起きる? AWSやMicrosoftでも発生、原因と対策は
クラウド最大手の米Amazon Web Services(AWS)や「Microsoft 365」では6月、サーバがダウンしてサービスが一時的に使えなくなる障害が発生した。AmazonやMicrosoftのような最先端企業でさえも防ぎ切れないサーバダウンは、なぜ起きるのか。
今回のAWS障害は米東部時間6月13日にUSイースト1リージョンで発生。原因は「AWS Lambdaの容量管理を担うサブシステムの問題」だったと説明している。
AWSでは同リージョンで2022年12月にも「複数のネットワークデバイスの障害」が発生した他、過去にもソフトウェアの問題や人為ミスを原因とするサーバ障害に見舞われたことがある。そのたびにAWSを利用する顧客のサービスやWebサイトがつながりにくくなったりダウンしたりする被害が広がり、クラウドサービスの障害が及ぼす影響の大きさを見せつけた。
サーバ障害の原因とは?
システム障害については金融庁が毎年、金融機関で起きた事例に関する分析レポートをまとめている。21、22年のレポートによれば、サーバの障害は主にシステム統合や更改、プログラム更新、普段と異なる特殊作業、日常の運用・保守などの過程の中で発生しているという。
原因については「作業に起因してどのような障害が発生し得るのか想定できていないなど、適切にリスクを認識するに至っていない」「リスクマネジメントプランの整備が不十分なまま作業が実施された」などと分析。また、本番環境のシステムで行った作業の誤り、委託先での作業の誤り、設定の不備といった人為ミスや知見不足に起因する障害も多いと指摘する。
自社で未然に防止することが困難なクラウドサービスの障害も増えていることから「障害を想定した代替手段の確保やサードパーティーとの不断の情報連携などの取り組みが必要」とレポートでは解説している。
続き
https://www.itmedia.co.jp/news/spv/2306/28/news070.html