5月15日(金) 14:30 - 15:00 SRE Track
SRE 初級者
〜備えあれば憂いなし〜 とりあえず障害訓練やろ? デジタル/フィジカル横断プロダクトを24365で維持するための戦略
# 概要
障害訓練やってますか? やりたいですか?
やりましょう。メリットしかないです。
弊社ではHWを扱ったプロダクトを提供している関係で、障害発生時のトラブルシューティングは困難を極めます。
どれだけ時間をかけて設計しても穴はあります。想定外のことは発生します。
メンバーのスキル差は様々です。いつ何時なにが発生するかわかりません。
物理からクラウド、そして人災まで、あらゆる障害や問題に対処するための訓練を日頃から行っています。
まだまだ試行錯誤の最中ではありますが、おおむね1年以上の運用における現在の整理とこれからについてご紹介します。
# 対象者
・複数のプロダクト/複数カテゴリにまたがるサービスを提供しているスタートアップのエンジニア
・Opsを意識し出したエンジニア
# ざっくり内容
・ビットキーでなぜ障害訓練が必要であったか / そのキッカケや理由
・障害訓練とは? 障害訓練の効能
・ビットキーにおける障害訓練の運用例
・便利なツール群 / なぜ我々はそれを使わなかったか