ファーストサーバ障害 part2
データ消失障害のファーストサーバが中間報告、「データは復旧不可能」
具体的には、今回の障害前に作成した更新プログラムに「ファイル削除コマンドを停止させるための記述漏れ」というバグがあった。この更新プログラムを検証環境で実行するという手順を踏んだにもかかわらず、バグに気づかないまま本番環境で実行された。この結果、意図しないファイル削除が実行されてしまいデータが消失した。
一般にはこの時点でも、定時バックアップを取得してさえいれば、最新のデータは消失するものの、一定のデータは復旧できるはずだ。実際に、ファーストサーバでも毎朝6時にバックアップを取得していた。
取って付けたような説明でステキ
ファーストサーバ、データ喪失におけるなんたらってリリースの時にデータ復旧会社を交えて〜って一文があったと思うのよね。
ぶっちゃけた話、ファイルを誤って消したくらいの論理復旧なら、カンタンにやってくれるよ。
金に糸目付けなければ。
書き込みは殆ど発生しないと思われるバックアップ側を復旧できないってあり得んわ。
バックアップは実際取ってなかった。ストレージスナップショットをバックアップ代わりに使ってて、ディスクアレイコントローラが故障ってオチの気がしてならんわ
真っ当な運用してたら、バックアップって最低2系列あるはずなので、完全にデータ喪失って可能性は極めて低い。
普通は奇数日用バックアップ先、偶数日用バックアップ先(小の月と大の月があるから、正しく言うと1日置きに使えるセット)を準備して置くもんだ。
バックアップ中って作業は極めて危険性が高い
バックアップ中にシステムが停止した場合、どこにも正しいデータが残っていない可能性がある。
実際にだけど、バックアップ中、バックアップ先は更新中だから、バックアップが完了するまでの間バックアップ先は不整合状態になるのでバックアップとして成り立たない。
なので、バックアップ先が複数用意できないなら、バックアップ先もスナップショットを併用するとか色々するんだよ
サーバ屋さんにしてはお粗末すぎるわ