Các trang web lớn ngừng hoạt động khi Cloudflare gặp sự cố kỹ thuật đột ngột
Phần lớn Internet đã rơi vào tình trạng hỗn loạn vào thứ Ba khi Cloudflare, một trong những nhà cung cấp cơ sở hạ tầng web được sử dụng rộng rãi nhất thế giới, gặp phải sự cố bất ngờ và nhanh chóng.
Những người truy cập vào các nền tảng như X, ChatGPT, Letterboxd, Shopify, Indeed và thậm chí cả công cụ theo dõi sự cố Downdetector đều gặp phải các trang lỗi đổ lỗi cho mạng của Cloudflare.
Đối với nhiều người, Internet dường như bị dừng đột ngột mà không báo trước.
Một lỗi duy nhất có thể đánh sập rất nhiều trang web
Cloudflare xác nhận họ đang điều tra một sự cố "có khả năng ảnh hưởng đến nhiều khách hàng", sau đó mô tả sự cố này là "sự cố ngừng hoạt động đáng kể".
Sự gián đoạn này bắt nguồn từ một tệp cấu hình được tạo tự động dùng để lọc lưu lượng đe dọa.
Công ty cho biết tệp đó "đã vượt quá kích thước mục nhập dự kiến", gây ra sự cố trong lớp phần mềm quản lý lưu lượng truy cập trên nhiều dịch vụ Cloudflare.
Vấn đề bắt đầu vào khoảng 5:20 sáng giờ miền Đông, khi các kỹ sư nhận thấy lưu lượng giao thông tăng đột biến bất thường.
Khi hệ thống gặp trục trặc, các trang web dựa vào mạng của Cloudflare bắt đầu gặp sự cố liên tiếp.
Nhiều người dùng đã thấy tin nhắn nhắc đến "lỗi máy chủ nội bộ trên mạng của Cloudflare", trong khi ChatGPT yêu cầu khách truy cập: "vui lòng bỏ chặn thử thách cloudflare.com để tiếp tục".
Cloudflare nhấn mạnh rằng sự cố này không phải do bất kỳ sự xâm nhập bên ngoài nào gây ra.
“Vấn đề này không phải do tấn công mạng hoặc bất kỳ hoạt động độc hại nào gây ra, trực tiếp hay gián tiếp.”
Tại sao nhiều ứng dụng phổ biến lại bị ngừng phát triển?
Một danh sách dài các dịch vụ đã ngừng hoạt động hoặc hoạt động chậm lại.
X hiển thị cảnh báo rằng trang chủ không thể tải được do "lỗi" đến từ Cloudflare.
Grindr, Zoom, Canva, các dịch vụ kỹ thuật số của NJ Transit và thậm chí cả chatbot Claude của Anthropic đều bị ảnh hưởng.
Downdetector, thường là cổng đầu tiên tiếp nhận báo cáo sự cố ngừng hoạt động, đã tạm thời không hoạt động do cùng một lỗi liên quan đến Cloudflare.
Khi có thể truy cập, nó cho thấy số lượng báo cáo sự cố tăng đột biến ngay sau 11:30 GMT.
Alp Toker, giám đốc của đài quan sát internet NetBlocks, cho biết quy mô gián đoạn "cho thấy sự gián đoạn thảm khốc đối với cơ sở hạ tầng của Cloudflare".
Ông lưu ý rằng ngày càng có nhiều trang web "ẩn sau cơ sở hạ tầng Cloudflare để tránh các cuộc tấn công từ chối dịch vụ", điều này đã biến công ty này thành "một trong những điểm lỗi đơn lẻ lớn nhất trên internet".
Cloudflare phản hồi và cố gắng ổn định web
Đến cuối buổi sáng, công ty cho biết họ đã thực hiện bản sửa lỗi.
Cloudflare đã viết trên trang trạng thái của mình,
“Chúng tôi đang tiếp tục theo dõi các lỗi để đảm bảo mọi dịch vụ trở lại bình thường.”
Công ty cảnh báo một số khách hàng vẫn có thể gặp sự cố khi hệ thống ổn định.
Nguồn: Trang trạng thái của Cloudflare
Cloudflare đã thêm:
“Do tầm quan trọng của các dịch vụ Cloudflare, bất kỳ sự cố gián đoạn nào cũng không thể chấp nhận được. Chúng tôi xin lỗi khách hàng và Internet nói chung vì đã làm quý khách thất vọng hôm nay.”
Công ty bảo vệ và quản lý lưu lượng truy cập cho khoảng 20% trang web toàn cầu đã chứng kiến cổ phiếu của mình giảm hơn 2% ngay sau sự cố.
Những sự cố mất điện này có xảy ra thường xuyên hơn không?
Sự cố này xảy ra sau một loạt sự cố hỗn loạn trên các nhà cung cấp dịch vụ đám mây lớn nhất thế giới.
Trong những tuần gần đây, Amazon Web Services đã phải chịu sự gián đoạn kéo dài cả ngày khiến hơn 1.000 ứng dụng và trang web bị vô hiệu hóa.
Nền tảng Azure và 365 của Microsoft cũng gặp phải sự gián đoạn trên toàn cầu.
Jake Moore, cố vấn an ninh mạng toàn cầu tại ESET, cho biết các sự kiện này nhấn mạnh việc các công ty "thường buộc phải phụ thuộc rất nhiều vào các công ty như Cloudflare, Microsoft và Amazon để lưu trữ trang web và dịch vụ của họ vì không có nhiều lựa chọn khác".
Và lần thứ hai trong vòng chưa đầy một năm, thế giới mạng lại được nhắc nhở về việc một lỗi cấu hình đơn lẻ - dù là ở Cloudflare, Amazon, Microsoft hay thậm chí là công ty an ninh mạng CrowdStrike, với bản cập nhật lỗi vào tháng 7 năm 2024 khiến các chuyến bay phải hủy bỏ và các thủ tục tại bệnh viện bị trì hoãn - có thể lan truyền ngay lập tức trên toàn thế giới trực tuyến.