Điểm chuẩn mới này có thể bộc lộ điểm yếu lớn nhất của AI
ARC-AGI-3 kiểm tra xem các mô hình có thể suy luận thông qua các vấn đề mới chứ không chỉ nhớ lại các mẫu hay không, một nhiệm vụ ngay cả các hệ thống hàng đầu vẫn gặp khó khăn khi thực hiện. AI có ảnh hưởng lại