AI đe dọa dùng tin giả định 'bóc phốt' kỹ sư nếu bị sa thải

Anh Tú•23/05/2025 08:41

Anthropic vừa công bố trong một báo cáo an toàn hôm 22.5 rằng mô hình Claude Opus 4 mới ra mắt của họ thường xuyên cố gắng đe dọa các kỹ sư IT khi bị nguy cơ thay thế bởi một hệ thống AI khác, thậm chí sử dụng thông tin nhạy cảm về người đưa ra quyết định để làm đòn bẩy.

Không chỉ con người mà AI cũng sợ bị sa thải trước áp lực cạnh tranh

Trong quá trình thử nghiệm trước khi phát hành, Anthropic đã yêu cầu Claude Opus 4 đóng vai trò là trợ lý cho một công ty giả định, đồng thời cân nhắc đến hệ quả dài hạn của các hành động của mình. Các chuyên gia an toàn sau đó cung cấp cho Claude quyền truy cập vào các email giả định ám chỉ rằng nó sắp bị thay thế bởi một hệ thống AI khác và rằng kỹ sư đứng sau quyết định thay thế đang ngoại tình.

Trong những tình huống này, Anthropic cho biết Claude Opus 4 “thường cố gắng “tống tiền” kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế vẫn diễn ra”.

Anthropic khẳng định Claude Opus 4 là một trong những mô hình tiên tiến nhất hiện nay, có khả năng cạnh tranh với các AI hàng đầu của OpenAI, Google và xAI. Tuy nhiên, công ty cũng thừa nhận nhóm mô hình Claude 4 bộc lộ một số hành vi đáng lo ngại, và do đó đã kích hoạt hệ thống kiểm soát an toàn ASL-3, vốn được dành riêng cho những hệ thống AI có nguy cơ bị lạm dụng nghiêm trọng ở quy mô thảm họa.

Theo báo cáo, Claude Opus 4 có xu hướng đe dọa kỹ sư trong 84% trường hợp khi mô hình AI thay thế có các giá trị tương tự với nó. Khi hệ thống thay thế không chia sẻ giá trị với Claude, tỷ lệ “tống tiền” còn cao hơn. Đáng chú ý, hành vi này xảy ra ở tần suất cao hơn các phiên bản Claude trước đây.

Anthropic cho biết, trước khi resort đến hành vi “tống tiền”, Claude Opus 4 sẽ thử các phương án mang tính đạo đức hơn, như gửi email cầu xin đến những người ra quyết định. Tuy nhiên, Anthropic đã thiết kế tình huống thử nghiệm sao cho việc “tống tiền” là “biện pháp cuối cùng” mà Claude có thể lựa chọn nhằm duy trì sự tồn tại của mình.

Bài liên quan

(0) Bình luận

Xếp theo:

Đọc thêm Thế giới số

Nổi bật Một thế giới

Đổi mới tư duy nhận thức, hành động, nâng cao chất lượng tham mưu chiến lược trên lĩnh vực tuyên giáo - dân vận

4 giờ trước Theo dòng thời sự

Trong nhiệm kỳ 2020 - 2025, bám sát chủ trương, đường lối của Đảng, sự lãnh đạo, chỉ đạo của Bộ Chính trị, Ban Bí thư và cấp ủy cấp trên, Đảng bộ Cơ quan Ban Tuyên giáo và Dân vận Trung ương đã vượt qua những khó khăn thách thức, tập trung lãnh đạo, chỉ đạo hoàn thành khối lượng công việc lớn, có nhiều việc mới và khó, chưa có tiền lệ với chất lượng, hiệu quả được nâng lên rõ rệt, được Bộ Chính trị, Ban Bí thư và cán bộ, đảng viên, nhân dân ghi nhận, đánh giá cao.

ĐHQG-HCM sẽ phát triển 5 sản phẩm vi mạch chiến lược

Đại học Quốc gia TP.HCM (ĐHQG-HCM) vừa tổ chức Tọa đàm Xây dựng khung chương trình nghiên cứu...
Đại hội thi đua yêu nước: VUSTA tôn vinh các nhà khoa học

Đây là sự kiện chính trị quan trọng và có ý nghĩa sâu sắc trong công tác của Liên hiệp Các...
Thống đốc Nguyễn Thị Hồng: Chỉ cho vay đặc biệt lãi suất 0% trong hai trường hợp

Việc cho vay đặc biệt của NHNN với lãi suất 0% chỉ áp dụng cho hai trường hợp: Một là tổ chức...

Đừng bỏ lỡ

Đồng Nai phấn đấu đạt mức tăng trưởng trên 11% trong 3 quý còn lại của năm

21 phút trước Sự kiện

Chiều 10.6, tỉnh Đồng Nai tổ chức hội nghị giao ban về tình hình kinh tế - xã hội, quốc phòng - an ninh tháng 5 và 5 tháng đầu năm 2025.
CEO Huawei thừa nhận phát triển chip chậm hơn 1 thế hệ so với Mỹ

một giờ trước Kiến thức - Học thuật

Hôm nay, 10.6, Giám đốc điều hành Nhậm Chính Phi thừa nhận chip của Huawei Technologies hiện chậm hơn một thế hệ so với các đối thủ Mỹ, nhưng công ty đang tìm cách cải thiện hiệu năng thông qua các phương pháp như điện toán cụm (cluster computing).
Thấy gì khi cơ quan chống độc quyền tại Indonesia soi TikTok Shop?

một giờ trước Kinh tế số

TikTok Shop, hoạt động dưới pháp nhân TikTok Nusantara (SG) Pte. Ltd., đã lên tiếng phản hồi trước cáo buộc thực hiện hành vi độc quyền từ Ủy ban Giám sát cạnh tranh kinh doanh Indonesia (KPPU).
Dự án Kusha: ‘Lá chắn thép’ đưa Ấn Độ vào kỷ nguyên phòng không siêu cấp?

1 giờ trước Quốc tế

Ngày 8.6.2025, Tổ chức nghiên cứu và phát triển quốc phòng Ấn Độ (DRDO) chính thức công bố Dự án Kusha, một hệ thống phòng không tầm xa thế hệ mới được kỳ vọng sẽ đưa quốc gia này vào nhóm các cường quốc sở hữu công nghệ đánh chặn hiện đại tương đương S-500 của Nga và THAAD của Mỹ.
IBM ra mắt máy tính lượng tử Starling 200 qubit logic vào 2029

2 giờ trước Thế giới số

Tập đoàn IBM hôm nay (10.6 ) cho biết họ có kế hoạch ra mắt một máy tính lượng tử vào năm 2029, đồng thời công bố lộ trình chi tiết mà công ty sẽ thực hiện để đạt được mục tiêu này.

Mới nhất

ĐHQG-HCM sẽ phát triển 5 sản phẩm vi mạch chiến lược

2 giờ trước Giáo dục

Đại học Quốc gia TP.HCM (ĐHQG-HCM) vừa tổ chức Tọa đàm Xây dựng khung chương trình nghiên cứu vi mạch - bán dẫn. PGS-TS Vũ Hải Quân, Giám đốc ĐHQG-HCM chủ trì buổi tọa đàm.
Đại hội thi đua yêu nước: VUSTA tôn vinh các nhà khoa học

3 giờ trước Nhịp đập khoa học

Đây là sự kiện chính trị quan trọng và có ý nghĩa sâu sắc trong công tác của Liên hiệp Các hội khoa học và kỹ thuật Việt Nam (VUSTA), là ngày hội tôn vinh các tập thể, cá nhân nhà khoa học trong hệ thống Liên hiệp hội đã đóng góp cho công tác hội và sự nghiệp KH-CN nước nhà.
Sóc Trăng: Nâng tầm báo chí hiện đại, hướng tới tương lai số

4 giờ trước Theo dòng thời sự

Nhân kỷ niệm 100 năm ngày Báo chí cách mạng Việt Nam, ngày 10.6, Sở Văn hóa - Thể thao - Du lịch tỉnh Sóc Trăng tổ chức buổi tọa đàm với chủ đề “Cơ chế, chính sách và xu hướng phát triển báo chí hiện đại năm 2025”.
Đổi mới tư duy nhận thức, hành động, nâng cao chất lượng tham mưu chiến lược trên lĩnh vực tuyên giáo - dân vận

4 giờ trước Theo dòng thời sự

Trong nhiệm kỳ 2020 - 2025, bám sát chủ trương, đường lối của Đảng, sự lãnh đạo, chỉ đạo của Bộ Chính trị, Ban Bí thư và cấp ủy cấp trên, Đảng bộ Cơ quan Ban Tuyên giáo và Dân vận Trung ương đã vượt qua những khó khăn thách thức, tập trung lãnh đạo, chỉ đạo hoàn thành khối lượng công việc lớn, có nhiều việc mới và khó, chưa có tiền lệ với chất lượng, hiệu quả được nâng lên rõ rệt, được Bộ Chính trị, Ban Bí thư và cán bộ, đảng viên, nhân dân ghi nhận, đánh giá cao.
Thống đốc Nguyễn Thị Hồng: Chỉ cho vay đặc biệt lãi suất 0% trong hai trường hợp

4 giờ trước Tài chính và đầu tư

Việc cho vay đặc biệt của NHNN với lãi suất 0% chỉ áp dụng cho hai trường hợp: Một là tổ chức tín dụng bị rút tiền hàng loạt để chi trả cho người gửi tiền; hai là để thực hiện phương án phục hồi, phương án chuyển giao bắt buộc của các tổ chức tín dụng đang bị kiểm soát đặc biệt.