2019年10月4日、Doorkeeperで10分間のシステムダウンが発生しました
2019-10-04(金)
2019年10月4日(金)、Doorkeeperで3度のシステムダウンが発生し、以下の時刻において合計で10分間にわたり機能が停止しました。
- 9:37から9:47
- 9:48から9:51
- 9:59から10:04
(以上、いずれの時刻も日本標準時)
Doorkeeperチームは問題発生後即時に通知を受け、速やかに調査を行いました。その後、10:08までには問題の原因を突き止め、修正をしました。
このダウンタイムにより生じた混乱とご不便に対して、心からお詫び申し上げます。申し訳ございませんでした。
今後、同じような問題が発生した場合には、よりよく対処できるよう問題の処理方法について社内で見直す予定です。
ダウンタイムを引き起こした原因
同日9:10、HTTPへのトラフィックをHTTPSにリダイレクトするためにDoorkeeperのアプリケーションが使用していた方法を変更しました。両者は同じ方法であると認識していましたが、実際には異なっていました。
これにより、それまではリダイレクトされなかったHTTPリクエストが、DoorkeeperのアプリケーションによりHTTPSにリダイレクトされうるかを確認する動作が実行されました。
この確認動作が失敗し、Doorkeeperのアプリケーションプロセスが再起動されました。
このプロセスの再起動が継続的に発生したことが、Doorkeeperのダウンタイムの原因となりました。
発生直後にこの原因を確認した時点で、HTTPSへのリダイレクト処理方法を再度変更し、問題は解決されました。