FYI(For Your Information.) --- AWS東京リージョンの障害から考えるDisaster Recoveryについて

弊社社内での話ではありますが、FYI(For Your Information.)な情報のやりとり、少しのぞいてみてください。

f:id:shugensha2018:20190603234550p:plain


 

 

 

2019年8月23日、AWS東京リージョンで発生したAmazon EC2Amazon EBS障害が発生。その際のFYIされたコメントです

 

(参考)東京リージョン (AP-NORTHEAST-1) で発生した Amazon EC2Amazon EBS の事象概要

aws.amazon.com

 

AWS障害があったのでマルチリージョンを含むDR(Disaster Recovery)の考え方を復習。

AWS Black Belt Online Seminar AWSで実現するDisaster Recovery
https://www.slideshare.net/AmazonWebServicesJapan/aws-black-belt-online-seminar-awsdisaster-recovery
AWS内でマルチリージョンするのは楽でいいけど、広範囲なソフトウェア障害やNW障害も想定すると、マルチクラウドベンダーになっちゃうかな。。
いずれにしてもコストが莫大にかかりますが。

ちなみに余談ですが、Netfilixの「カオスエンジニアリング」のうちの「Chaos Kong」というツールはリージョンを丸ごと落とすので、リージョンダウン耐性も確保しています。
(今回このおかげでNetflixに影響がなかったかどうかは知らないですが、少なくとも障害のニュースは目にしていません)

それに引き換え、以下は日経新聞の記事ですが、

クラウド集中にもろさ アマゾン「AWS」大規模障害
https://www.nikkei.com/article/DGXMZO48956120T20C19A8EA1000/

クラウドは利便性やコスト面のメリットがある半面、業務に一時停止を招くリスクをはらんでいる。クラウドの利用を検討する企業は、どのような用途に使うのか慎重な見極めも求められる。」と結んでいて、見識の無さにがっかりする。
オンプレでも普通に障害は起きるんですけど。。

クラウドだから悪いのではなくて、クラウドを使いこなせるかどうか、という問題なのよね。。

日本の場合、責任追及と責任逃れが大好きなので、「AWS、みんなで障害だから、怖くない」みたいなところはきっとありますね。

 

 

 

今後もこんな小話 聞いてください。