Hi ae, là một trong người làm việc với Claude từ lúc Opus ra mắt, mình cảm thấy rất wow về hiệu năng cũng như độ thông minh của nó. Nhưng, từ sau đợt ăn Tết nguyên đán (khoảng sau tháng 2), mình cảm giác nó bắt đầu ngu đi. Vậy điều đó có đúng?
Mới đây, giám đốc AI của AMD, Stella Laurenzo đã viết một issue cực chi tiết mổ xẻ việc giảm chất lượng của Claude.
Cụ thể, bà đã công bố một bản phân tích dữ liệu cực kỳ chi tiết dựa trên gần 7.000 phiên làm việc và hơn 230.000 lần gọi công cụ của Claude.
- Sự suy giảm hiệu suất: Phân tích chỉ ra rằng Claude hiện tại đọc source code ít hơn 3 lần trước khi sửa, nhưng lại có xu hướng ghi đè (rewrite) toàn bộ file cao gấp 2 lần thay vì sửa lỗi chính xác vào đúng vị trí.
- Nguyên nhân cốt lõi: Sự sụt giảm chất lượng bắt đầu từ đầu tháng 3/2026, trùng khớp chính xác với việc Anthropic triển khai tính năng ẩn nội dung suy nghĩ (thinking content redaction). Khi chiều sâu tư duy bị cắt giảm khoảng 70%, mô hình bắt đầu chuyển từ tư duy “nghiên cứu trước - sửa sau” sang “sửa bừa - ít nghiên cứu”.
- Các chỉ số cụ thể:
- Tỷ lệ Đọc:Sửa: Giảm từ 6.6 (đọc 6.6 file trước khi sửa 1 file) xuống còn 2.0.
- Thói quen “Lười biếng”: Xuất hiện tình trạng né tránh trách nhiệm, bỏ dở công việc giữa chừng, hoặc chọn giải pháp đơn giản nhất thay vì giải pháp đúng nhất.
- Lãng phí tài nguyên: Mặc dù hiệu quả giảm, nhưng số lượng request API tăng vọt (gấp 80 lần trong một số trường hợp) do mô hình phải thử sai nhiều lần.
Link issue của bà:
Tuy kĩ sư Borris Cherny của Anthropic đã close issue này rồi nhưng comment này nhận rất nhiều downvote của cộng đồng :)))
Phản ứng từ cộng đồng reddit:
- Sự xác nhận: Người dùng cảm thấy được minh oan vì trước đó họ đã cảm thấy Claude tệ đi nhưng không có số liệu chứng minh. Họ gọi đây là bằng chứng thép cho việc Anthropic âm thầm cắt giảm năng lực tính toán của mô hình.
Ý kiến của bạn thì sao? Thảo luận thêm về vấn đề này tại post của tác giả Nguyễn Minh Triết ở của group chúng mình
