#author("2023-02-10T06:46:39+00:00","default:admin","admin") #author("2023-02-13T08:28:46+00:00","default:admin","admin") [[AWS Health Dashboard:https://health.aws.amazon.com/health/status]] -[[AWS Healthを活用し障害検知しよう:https://blog.serverworks.co.jp/2021/09/03/090000]] -[[インスタンス障害の原因が基盤障害かどうかの確認方法:https://dev.classmethod.jp/articles/ec2-statuscheck-failed-system/]] -[[AWSの障害情報をチェックする(2022/7/25更新):https://qiita.com/moritalous/items/5a48006b60ee6ddad420]] -[[【小ネタ】AWSで過去に発生した障害の履歴を確認する方法:https://dev.classmethod.jp/articles/service-health-status-history/]] -[[【保存版】東京リージョンの AWS 障害発生時にクラスメソッドのテクニカルサポートチームがやっていること:https://dev.classmethod.jp/articles/technical-support-aws-failure-launch01/]] -[[AWSを利用する際に知っておきたい障害対策:https://www.stylez.co.jp/columns/obstacle_measure/]] -[[【AWSの障害対策】5つの事例から起きうる障害を学び対策を考える:https://business.ntt-east.co.jp/content/cloudsolution/column-40.html]] *[[耐障害性:https://docs.aws.amazon.com/ja_jp/awssupport/latest/user/fault-tolerance-checks.html]] [#h0bfebbe] -[[AWSクラウドの耐障害性、可用性を高めるための前提知識:https://future-architect.github.io/articles/20211006b/]] -[[Elastic Beanstalk の耐障害性:https://docs.aws.amazon.com/ja_jp/elasticbeanstalk/latest/dg/disaster-recovery-resiliency.html]] -[[AWS Lambda での耐障害性:https://docs.aws.amazon.com/ja_jp/lambda/latest/dg/security-resilience.html]] -[[Amazon Lightsail での耐障害性:https://lightsail.aws.amazon.com/ls/docs/ja_jp/articles/disaster-recovery-resiliency]] -[[Amazon S3 の耐障害性:https://docs.aws.amazon.com/ja_jp/AmazonS3/latest/userguide/disaster-recovery-resiliency.html]] -[[Amazon SNS の耐障害性:https://docs.aws.amazon.com/ja_jp/sns/latest/dg/sns-resilience.html]] *障害対策 [#n7e5a38a] -[[AWSで障害に強いシステムを構築する方法:https://qiita.com/nasuvitz/items/1b474ca9a76695f1663e]] -[[3分でわかる!AWSにおける障害対策【前編】~もしものトラブルでもサービスを継続するために~:https://www.fujitsu.com/jp/products/software/resources/feature-stories/cloud-operation/aws-troubleshoot-firstvolume/]] -[[3分でわかる!AWSにおける障害対策【後編】~もしものトラブルでもサービスを継続するために~:https://www.fujitsu.com/jp/products/software/resources/feature-stories/cloud-operation/aws-troubleshoot-secondvolume/]] -[[クラウド障害とは?事例一覧や企業がとるべき対策を紹介:https://www.cybersolutions.co.jp/blog/cloud-failure/]] *障害対応の自動化 [#z4e3366c] -[[大規模システムにおけるインスタンス基盤障害の対応自動化に関して[DeNA インフラ SRE]:https://engineering.dena.com/blog/2022/06/about-auto-recovery-failed-instances/]] *災害対策 [#d4be4605] -[[AWSでやる“ミニマム”DR対策「最低限なにをすればいいか?」を考える:https://biz.nuro.jp/column/aws-mama-060/?gclid=CjwKCAiA3KefBhByEiwAi2LDHAVSjnB02_SjGMDjnPNs8QLGpr7Tha8UkVfOGe71P3xutGVtRTIbShoCzBMQAvD_BwE]] *障害履歴 [#p9bc7af5] -[[AWS Post-Event Summaries:https://aws.amazon.com/jp/premiumsupport/technology/pes/]] ... 大規模障害の履歴 **2022 [#v306ef9d] ***2022/5/27 [#w4aa2502] -障害が発生したのは AWS ではないが、AWSにアクセスできない事態が発生した -[[Route53で障害!DNSが原因?AWSアクセスができない!:https://www.koregasiritai.com/route53-dns-aws/]] --Route53で障害が発生しているわけではなく、正確には「third-party DNS provider outside AWS」という公式発表のとおり、AWS自体に障害が起きているわけではありません。 --差し当たって、DNS設定で「8.8.8.8」を参照することで解消されるとのこと。 -[[Amazon Route53でシステム障害発生「Githubも死んでる」 ユーザーの声まとめ:https://matomedane.jp/page/104695]] **2021 [#nfdba84f] ***2021/9/2 [#a5fe5354] -[[9月2日木曜日に発生したAWS東京リージョンの大規模障害、原因はネットワークデバイスの新プロトコル処理に潜在的なバグがあったこと。AWSが報告書を公開:https://www.publickey1.jp/blog/21/92awsaws.html]] --障害が発生したのは、企業のデータセンターなどからAWSへ専用線で接続するためのネットワーク接続サービス「AWS Direct Connect」 --障害は午後12時30分に復旧しはじめ、午後1時42分に解消しました -[[2021年9月2日のAWS東京リージョン障害についてざっくり。:https://qiita.com/tsukamoto/items/dec0e9f14e2b2f894010]] ***2021/2/19 [#reec721b] -[[【復旧済み】2021年2月19日23時50分頃に発生したAWS障害について(2月20日7:00更新):https://classmethod.jp/news/info_20210220_failure/]] -[[AWS障害は冷却システムの電力喪失が原因、コインチェックは全サービス停止:https://xtech.nikkei.com/atcl/nxt/news/18/09704/]] -[[AWSの東京リージョンで障害、気象庁のHPが一時閲覧できず:https://xtech.nikkei.com/atcl/nxt/news/18/09703/]] -[[AWS障害、5時間でほぼ復旧 気象庁Webサイトなどに影響【各サービス復旧状況を追記】:https://www.msn.com/ja-jp/news/techandscience/aws%E9%9A%9C%E5%AE%B3-5%E6%99%82%E9%96%93%E3%81%A7%E3%81%BB%E3%81%BC%E5%BE%A9%E6%97%A7-%E6%B0%97%E8%B1%A1%E5%BA%81web%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AA%E3%81%A9%E3%81%AB%E5%BD%B1%E9%9F%BF%E3%81%8B/ar-BB1dQehz]] **2020 [#e1395071] ***2020/4/20 [#j48e6714] -[[【復旧済み】2020年4月20日に発生したAWS障害について:https://classmethod.jp/news/200420-aws-incident/]] --対象サービス ---Amazon SQS ---Lambda ---CloudWatch ---CloudFormation ---Fargate ? --障害時間帯:2020/4/20 19:30 - 23:30 **2019 [#y7f3ce13] ***2019/8/23 [#xd727bb2] -[[AWS、東京リージョン23日午後の大規模障害について詳細を報告。冷却システムにバグ、フェイルセーフに失敗、手動操作に切り替えるも反応せず:https://www.itmedia.co.jp/news/articles/1908/26/news059.html]] -[[AWS障害で本当に知っておくべきことと考慮すべきこと:https://hisa-tech.site/2019/08/3399/]] **2017 [#qcd6f8c2] ***2017/2/28 [#q959f109] -[[米国東部(バージニア北部、US-EAST-1)リージョンで発生した Amazon S3 サービス障害について:https://aws.amazon.com/jp/message/41926/]] -[[ネットが死にかけたAmazon S3の障害は1個の打ちまつがいが原因:https://www.gizmodo.jp/2017/03/amazon-s3-one-engineers-simple-mistake.html]]