首页 ›存档› 技术 › 查看内容

Gitlab.com 因疲劳误删数据导致宕机超24小时，现已恢复

2018-3-30 13:00 |来自: 互联网 361 0

摘要: 新年快乐国内时间 1 月 31 日晚上 11 点左右 Gitlab.com 平台因为其运维人员误删了数据导致整个网站下线。根据最新消息，其整个数据恢复过程在2日凌晨1点左右已经恢复，目前网站可以正常访问。恢复期间 Gitlab ...

新

年

快

乐

国内时间 1 月 31 日晚上 11 点左右 Gitlab.com 平台因为其运维人员误删了数据导致整个网站下线。根据最新消息，其整个数据恢复过程在2日凌晨1点左右已经恢复，目前网站可以正常访问。

恢复期间 Gitlab 在 Youtube 上直播了整个数据恢复过程（小编想说：Gitlab 心真大，可能其是为了挽回一点在技术人员心中的印象吧）。根据官方对整个事情的描述大概可以推断 Gitlab 使用的是故障发生前6个小时的备份数据。因此就算恢复了整个平台，这6个小时时间内的数据还是丢失了。

下面一起回顾一下本次故障过程：

2 月 1 日GitLab.com 官方网站发布声明称由于其产品数据库问题导致的网站无法正常访问。据国外媒体报道称 Gitlab 网站疲惫的系统管理员深夜在进行数据库维护时，使用 rm -rf 删了300 GB 生产环境数据。等到清醒过来紧急按下ctrl c，只有4.5GB保留下来。然后恢复备份失败，网站已经宕了10个小时还没恢复。

目前可以确认的是 Gitlab 的数据备份是无效的。报告称此次数据丢失并非仓库的数据，而是仓库相关的 issue 以及合并请求操作。

GitLab.com 号称有五重备份机制：

● 常规备份（24小时做一次）

●自动同步

●LVM快照（24小时做一次）

●Azure备份（只对 NFS 启用，对数据库无效）

●S3备份。

这次事故发生时，所有备份全部无效！为了纪念这个事件，已经有人提议，将2月1日定为“世界备份日”

编译自：https://www.theregister.co.uk/2017/02/01/gitlab_data_loss/

Gitlab.com 因疲劳误删数据导致宕机超24小时，现已恢复

相关分类