Sai lầm nhỏ, Thảm họa lớn - GitLab sẽ ngoại tuyến trong một ngày
GitLab, một công ty khởi nghiệp thay thế cho GitHub rất phổ biến, gần đây đã có một ngày khá khó khăn lỗi của con người khiến toàn bộ trang web ngừng hoạt động cả ngày.
Vấn đề của GitLab bắt đầu khi trang web đã gặp sự cố thời gian tải và ổn định. Trang web đã được đưa ra ngoại tuyến để khắc phục các vấn đề. Tuy nhiên, trong quá trình bảo trì, ai đó đã vô tình phạm sai lầm khi vô tình xóa một thư mục chứa 300GB dữ liệu sản xuất trực tiếp.
May mắn thay cho GitLab, nội dung chỉ bị xóa vấn đề bị ảnh hưởng và yêu cầu sáp nhập. Các kho lưu trữ và wiki không bị ảnh hưởng bởi sai lầm này, có nghĩa là thiệt hại do sai lầm này không nghiêm trọng như nó có thể đã được
Khi thư mục bị xóa, nhân viên GitLab lập tức chuyển sang sao lưu. Thật không may cho họ, GitLab đã gặp phải một vấn đề khác. Theo tệp Google Doc liên tục được cập nhật khi GitLab đấu tranh để trực tuyến trở lại, tất cả 5 bản sao lưu / sao chép các kỹ thuật mà trang web triển khai không hoạt động đáng tin cậy, và trong một số trường hợp là không bao giờ thiết lập ở nơi đầu tiên.
Lấy các tệp bị mất này từ đám mây không phải là một lựa chọn cho GitLab vì startup đã quyết định vào cuối năm ngoái thay vào đó, kết xuất đám mây để xây dựng và vận hành các cụm Ceph của riêng mình. Không cần phải nói, GitLab hiện đang xem xét lại lập trường của họ về chủ đề cụ thể đó.
@TheRegister @gitlab sẽ làm việc để ứng dụng trở nên hiệu quả hơn và khám phá các nhà cung cấp dịch vụ lưu trữ đám mây thay thế.
- Connor Shea (@connorjshea) ngày 1 tháng 2 năm 2017
Mặc dù ngày hỗn loạn mà GitLab đã có, trang web hiện đang hoạt động như bình thường. Trong khi trang web báo cáo rằng một số dữ liệu đã bị mất trong một cửa sổ sáu giờ, Git kho lưu trữ không bị tổn hại trong toàn bộ thử thách. Một bản ghi sự cố đầy đủ của toàn bộ sự kiện có thể được xem tại đây.
Trong khi nhiều bài học có thể học được từ sai lầm nhỏ của GitLab (chủ yếu là sự kiêu ngạo), phương pháp xử lý khủng hoảng của GitLab khá đáng ngưỡng mộ như khởi động rõ ràng và minh bạch với người dùng. Đây là hy vọng rằng GitLab học được từ sai lầm này. Nếu không, cơ sở người dùng của nó có lẽ sẽ ít tha thứ hơn nếu lịch sử lặp lại.
Nguồn: Đăng ký