公開日

Code Red - データセンターの物語

著者

"VNG のデータセンターが崩壊し、一部の顧客が完全に麻痺したことを機に、Cloudflare に起こった Code Orange 事件のストーリーを次のようにお話ししましょう。 VNG や他のベンダーも同様のことを始めてくれることを願っています。

Cloudflareのシステム規模はVNGよりもはるかに大きいです。 11 月 2 日、電気システムが発火し、完全に電源が失われ、システムが麻痺するという珍しい事件が発生しました。

9:00-> 14:00: 完全な停電、システムが麻痺。

14:00: 断続的に電気が流れます。システム全体が壊れており、再構築する必要があることが判明しました。各自己修復システムには約 3 時間かかり、システムは約 20 あり、合計で 60 時間かかります。

標準99999のシステム付き!それならこれは不可能です。

14.00 -> 18.00: すべての計算をフルスピードで並列実行してビルドします。機能していません。

夜 23:00: いくつかのサーバーの実行が再開されましたが、サービスは起動していません。

11月4日午前4時25分に復旧を開始した。

サービスの総復旧時間: 43 時間。

コードオレンジのミッション:

何が起こったのか、重要なことは、この事件の後、Cloudflare がコード「Code Orange」で緊急タスクを設定したということです。ミッションが結果を決定します。あのようなことは二度と起こらないはずです。 『コード・オレンジ』のデザインが始まる。

5 か月後、同じことが起こりました。データセンター全体が再び崩壊しました。 14時58分、データセンター全体がシャットダウンした。コードオレンジはすぐに起動します。システム全体がただちに自己修復モードに入ります。

奇跡的に、わずか 7 分後に、Code Orange は不良データセンターをシステムから削除し、まったく中断することなく奇跡的にサービス全体を再構築しました。以前は 48 時間のサービス停止が発生していましたが、現在はわずかなちらつきがあるだけで、完全に通常の 7 分間に変わりました。 Code Orange は完全に自動的に実行され、誰もそれに触れる必要はありません。合計治癒時間: 7 分。

願わくば、VNG が Code Orange に対しても同様の計画を立ててくれることを願っています (そして、うまくいけば、さらに悪いシナリオには Code Red も)。"

日本語版は Ai 支援を使用しているため、小さな間違いが存在する可能性があることをご了承ください。 Code Red - データセンターの物語

著者

Ai Base Network (ABN), ABN ASIAは、アカデミアに深く関わり、アメリカ、オランダ、ハンガリー、日本、韓国、シンガポール、ベトナムでの仕事経験を持つ人々によって設立されました。ABN ASIAは、学問とテクノロジーが機会と出会う場所です。最先端のソリューションと優れたソフトウェア開発サービスにより、ビジネスがレベルアップし、グローバルシーンに挑戦できるよう支援しています。 私たちの取り組み: より速く。 より良い。 より信頼性が高くなります。 ほとんどの場合、価格も安くなります。

いつでも、ITサービス、デジタルコンサルティング、既製のソフトウェアソリューション、または提案依頼書(RFP)をお探しの際は、お気軽にお問い合わせください。お問い合わせ先は[email protected]です。お客様のテクノロジーに関するニーズにお応えします。

ABNAsia.org

© ABN ASIA