昨日のcloudflareの障害、設定ミスが原因だった模様 [262417205]
■ このスレッドは過去ログ倉庫に格納されています
Cloudflareが昨日(2022年6月21日)の障害原因はBGPの設定ミスと報告。東京データセンターを含む19の主要データセンターが一時オフラインに
https://www.publickey1.jp/blog/22/cloudflare2022621bgp19.html
以下、時系列で説明します。
午後3時27分、設定がMCP対応の場所に到達し、MCPに対して設定が反映されると、プレフィックスが削除された影響で19カ所のデータセンターがオフラインになり、障害が発生。
午後3時32分、障害を検知し、Cloudflare社内部でインシデントが宣言される。
午後3時51分、原因を確認するため、ルータ設定の変更を試行。
午後3時58分、原因を確認。設定を元に戻す作業を開始。
午後4時42分、設定を元に戻す作業が完了。作業に時間がかかってしまった要因として、あるネットワークエンジニアが元に戻した設定を、別のエンジニアが気づかずさらに元に戻す作業をして障害状態に復帰してしまう、といったことが散発したため。
午後6時、インシデント終了。
この作業は、障害によって通常のネットワークでは影響を受けたデータセンターに到達できなくなったため、障害対応のために用意されたバックアップ手段によって行われたとのことです。 あるネットワークエンジニアが元に戻した設定を、別のエンジニアが気づかずさらに元に戻す作業をして障害状態に復帰してしまう、といったことが散発したため。
おもろいな ずびばぜん😭😭
クラウドフレアの株を持ってる僕は助かりますか?😢 ネットワークエンジニアだけど昼勤で切り分けとかやらないルーチンワークの仕事ない? マジそこらじゅうアクセスできなくて笑ったわ
依存しすぎだろ
そして俺たちのパンダが最強なのがまた証明された 試験する環境なしで設定投入してんのかな
影響考えると滅茶苦茶怖いな だからか
軒並みRAWサイト繋がらなくてとうとう…と思ってたけど Cloudflareって妙に障害多い気がするけど気のせいか? >>12
プロビかプリセールス位じゃないか
基地局の免許申請なんかも免許さえあればエンジニア知識不要 >>22
マジ?それ楽にできる?
一時期L2スイッチのランプ全部つくかとか何色で光ってるかとか見る仕事やってたけど天国だったこれより楽かな? >>24
免許申請は顧客情報扱うし資料作らなきゃならないから細かい仕事好きな奴向き 取るのに暗記力居る資格も必須だけど募集は少ない
プロビも細かい記入ミス無いか見つつ転記したり設定入れるだけ 募集はやっぱり多くない上に雑務もあるかも
プリセールスは商材とトーク力と知識によるとしか
ランプ見るだけの仕事が一番楽だよ 常日勤の募集はほぼないし給料も低いけど >>25
ランプ見るの探すわ…コンビニより給料よけりゃいいわ
show run取るとかできるしどっか採用してくれるだろう… ■ このスレッドは過去ログ倉庫に格納されています