Sự cố ngừng hoạt động trên diện rộng của nền tảng điện toán đám mây Amazon Web Services (AWS) hôm 20-10 khiến mạng internet toàn cầu chao đảo suốt nhiều giờ, làm tê liệt hàng loạt ứng dụng và dịch vụ thiết yếu.
Sự cố này không chỉ gây ra thiệt hại tài chính khổng lồ mà còn gióng lên hồi chuông cảnh báo về sự mong manh của hạ tầng số thế giới.
Sự cố bắt nguồn từ một lỗi kỹ thuật đơn giản tại trung tâm dữ liệu US-EAST-1 của AWS, nằm ở phía Bắc bang Virginia, Mỹ. Lỗi này khiến hệ thống DNS không thể định tuyến đúng các yêu cầu truy cập tới dịch vụ cơ sở dữ liệu DynamoDB.

Ứng dụng di động Hulu hiển thị thông báo không khả dụng trong suốt thời gian xảy ra sự cố ngừng hoạt động của Amazon Web Services vào ngày 20-10. Ảnh: AP
Thế nhưng, sự cố đã nhanh chóng lan rộng, làm sập các dịch vụ từ game, mạng xã hội đến tài chính và chính phủ.
Các ứng dụng tài chính như Coinbase, Robinhood, Venmo gặp vấn đề, cùng với các ngân hàng lớn ở Anh (Lloyds, Halifax). Các doanh nghiệp như Starbucks, T-Mobile và United Airlines đều báo cáo sự cố, dẫn đến trì hoãn các chuyến bay và gián đoạn hoạt động sản xuất.
Các dịch vụ liên lạc bảo mật như Signal bị ảnh hưởng, gây lo ngại về an ninh thông tin. Thậm chí, các cơ quan chính phủ Anh và dịch vụ y tế của Mỹ (Medicare) cũng gặp khó khăn, ảnh hưởng trực tiếp đến việc nộp thuế và đăng ký bảo hiểm của người dân.
Dù Amazon đã khắc phục phần lớn sự cố vào tối cùng ngày, tổn thất kinh tế ước tính đã đạt đến mức đáng kinh ngạc.
Ông Mehdi Daoudi, CEO của công ty giám sát hiệu suất Internet Catchpoint, ước tính tổng tác động tài chính của sự cố này "có thể lên tới hàng trăm tỉ USD". Thiệt hại này chủ yếu đến từ sự mất năng suất lao động của hàng triệu nhân viên trên toàn thế giới do không thể sử dụng các công cụ trực tuyến để làm việc.
Nhiều chuyên gia nhận định sự cố đã phơi bày một rủi ro lớn: cả thế giới mạng đang quá phụ thuộc vào một vài nhà cung cấp dịch vụ khổng lồ.
Theo công ty nghiên cứu và tư vấn công nghệ thông tin Gartner của Mỹ, AWS là nhà cung cấp dịch vụ đám mây lớn nhất, chiếm hơn 41% thị phần. Do đó, chỉ cần một lỗi nhỏ của Amazon có thể gây ra bất ổn toàn cầu.
Đài CBC cho biết đây là lần thứ 3 trong 5 năm, trung tâm dữ liệu US-EAST-1 (trung tâm lớn và lâu đời nhất của AWS) gây ra sự cố lớn. Điều này cho thấy rủi ro không hề giảm đi mà đang lặp lại.
Trong những năm qua, US-EAST-1 đã gây ra nhiều sự cố mạng. Đáng chú ý nhất là sự cố vào cuối năm 2021, khi một lỗi mạng liên quan đến dịch vụ Kinesis đã làm tê liệt các ứng dụng lớn như Netflix và Disney+ trong hơn 5 giờ đồng hồ.
Trước đó, vào năm 2017, một lỗi do con người (nhập sai lệnh) trong quá trình gỡ lỗi dịch vụ S3 cũng gây ra sự cố dây chuyền, làm sập hàng loạt trang web.
Bình luận (0)