Claude Fable 5 Gây Tranh Cãi Vì Cơ Chế Âm Thầm Giảm Chất Lượng Câu Trả Lời

Claude Fable 5 Gây Tranh Cãi Vì Cơ Chế Âm Thầm Giảm Chất Lượng Câu Trả Lời

Rạng sáng ngày 10/6, Anthropic chính thức giới thiệu Claude Fable 5 – mô hình AI mới nhất với hàng loạt kết quả benchmark ấn tượng. Tuy nhiên, điều khiến cộng đồng AI tranh luận sôi nổi nhất lại không nằm ở hiệu năng hay giá cả, mà là một chi tiết nhỏ được nhắc đến trong tài liệu kỹ thuật dài 319 trang đi kèm.

Theo đó, Anthropic thừa nhận Claude Fable 5 được trang bị một cơ chế đặc biệt có khả năng âm thầm làm giảm chất lượng phản hồi trong một số trường hợp nhất định mà người dùng không hề được thông báo.

Cơ Chế Bảo Vệ Gây Tranh Cãi


Claude Fable 5 ra mắt, lần đầu đưa mô hình Mythos đến người dùng phổ thông
Claude Fable 5

Claude Fable 5 được thiết kế với nhiều lớp bảo vệ nhằm ngăn chặn các hành vi sử dụng sai mục đích. Với những chủ đề nhạy cảm như an ninh mạng hoặc hóa học, hệ thống có thể chuyển yêu cầu sang một mô hình yếu hơn là Claude Opus 4.8 và thông báo rõ ràng cho người dùng.

Tuy nhiên, một lớp bảo vệ khác lại đang gây tranh cãi. Khi phát hiện người dùng có dấu hiệu sử dụng Claude để phát triển hoặc huấn luyện các mô hình AI cạnh tranh, hệ thống vẫn tiếp tục trả lời như bình thường nhưng chất lượng phản hồi có thể bị giảm đi thông qua các biện pháp kỹ thuật nội bộ.

Điều đáng chú ý là người dùng không nhận được bất kỳ cảnh báo hay thông báo nào cho biết câu trả lời họ nhận được đã bị tác động.

Vì Sao Anthropic Thực Hiện Biện Pháp Này?


Nguồn gốc của cơ chế này xuất phát từ những lo ngại liên quan đến hoạt động "chưng cất tri thức" (AI Distillation).

Anthropic kêu gọi ngừng phát triển AI trên toàn cầu
Anthropic

Vào tháng 2/2026, Anthropic từng cáo buộc ba công ty AI Trung Quốc gồm DeepSeek, Moonshot AI và MiniMax đã tổ chức các chiến dịch quy mô lớn nhằm khai thác dữ liệu từ Claude. Theo công ty, hơn 24.000 tài khoản được sử dụng để tạo ra khoảng 16 triệu cuộc hội thoại với mục tiêu thu thập dữ liệu huấn luyện.

Distillation là kỹ thuật cho phép một mô hình AI nhỏ học hỏi từ mô hình lớn thông qua việc liên tục đặt câu hỏi và sử dụng câu trả lời làm dữ liệu đào tạo. Điều này giúp tiết kiệm đáng kể chi phí nghiên cứu và phát triển, đồng thời có thể tạo ra những mô hình cạnh tranh dựa trên tri thức của hệ thống gốc.

Anthropic cho rằng hành vi này vi phạm điều khoản sử dụng dịch vụ. Thay vì chỉ khóa tài khoản, công ty lựa chọn phương án làm giảm giá trị của dữ liệu thu được nhằm hạn chế động cơ khai thác. Theo Anthropic, cơ chế này chỉ ảnh hưởng đến khoảng 0,03% tổng lưu lượng sử dụng trên toàn hệ thống.

Cộng Đồng AI Chia Rẽ Quan Điểm


Điểm gây tranh cãi không nằm ở việc Anthropic bảo vệ công nghệ của mình, mà ở câu hỏi liệu công ty có nên minh bạch hơn với khách hàng trả phí hay không.

Thử nghiệm gây chấn động giới AI | Znews.vn
Andrej Karpathy: Nhà nghiên cứu AI 

Nhiều chuyên gia cho rằng người dùng cần được biết khi chất lượng phản hồi bị thay đổi bởi các cơ chế kiểm soát nội bộ. Nhà nghiên cứu AI Andrej Karpathy đánh giá cao năng lực của Claude Fable 5 nhưng cho rằng các lớp bảo vệ hiện tại có thể đang được triển khai quá mức. Trong khi đó, nhà phân tích Dean W. Ball cảnh báo cách tiếp cận này có thể khiến Anthropic đối mặt với những câu hỏi liên quan đến cạnh tranh và chống độc quyền.

Một số ý kiến chỉ trích mạnh mẽ hơn cho rằng việc cố ý làm giảm chất lượng phản hồi mà không thông báo cho người dùng là hành vi thiếu minh bạch. Vấn đề được đặt ra là làm thế nào để người dùng biết liệu câu trả lời họ nhận được là năng lực thực sự của Claude Fable 5 hay đã bị can thiệp bởi các cơ chế kiểm soát phía sau.

Ngược lại, một số chuyên gia cho rằng Anthropic đang ưu tiên các mục tiêu an toàn AI và bảo vệ mô hình trước nguy cơ bị khai thác quy mô lớn. Một số khác nhận định đây đơn giản là chiến lược kinh doanh nhằm hạn chế việc đối thủ tận dụng năng lực AI hàng đầu của công ty.

Người Dùng Thông Thường Có Bị Ảnh Hưởng?


Câu trả lời ngắn gọn là gần như không. Anthropic cho biết cơ chế này chỉ nhắm đến các cá nhân hoặc tổ chức đang xây dựng mô hình AI, nghiên cứu hệ thống huấn luyện quy mô lớn hoặc có dấu hiệu sử dụng Claude để phát triển sản phẩm cạnh tranh. Đối với đa số người dùng thông thường – bao gồm nhân viên văn phòng, lập trình viên ứng dụng, người sáng tạo nội dung hay học sinh, sinh viên – trải nghiệm sử dụng Claude Fable 5 gần như không bị ảnh hưởng.

Tuy nhiên, vụ việc vẫn tạo ra một cuộc tranh luận đáng chú ý trong ngành AI: liệu các công ty công nghệ có nên được phép âm thầm thay đổi chất lượng phản hồi của hệ thống mà không thông báo cho khách hàng hay không? Đây có thể là một tiền lệ mới trong cuộc đua phát triển trí tuệ nhân tạo, nơi ranh giới giữa bảo vệ công nghệ và tính minh bạch với người dùng ngày càng trở nên khó xác định.

 - Trích nguồn: GenK

Viết bình luận của bạn
Gọi ngay: 0945029902
CÔNG TY TNHH DIGIVI