Sentient, một phòng thí nghiệm AI mã nguồn mở, đã chính thức ra mắt Arena, một môi trường thời gian thực, đạt chuẩn sản xuất dành cho các nhà phát triển AI toàn cầu để kiểm tra khả năng chịu tải và cạnh tranh lặp lại các năng lực suy luận của các tác nhân AI cấp doanh nghiệp. Các đơn vị tham gia ban đầu bao gồm Founders Fund, Pantera, Franklin Templeton (với hơn 1,5 nghìn tỷ đô la tài sản được quản lý), alphaXiv, Fireworks, OpenHands và OpenRouter. Arena mô phỏng các kịch bản thực tế trong quy trình làm việc của doanh nghiệp, bao gồm thông tin không đầy đủ, ngữ cảnh chi tiết, hướng dẫn mơ hồ và nguồn thông tin mâu thuẫn, đồng thời ghi lại toàn bộ đường dẫn suy luận để giúp các nhóm kỹ thuật xác định lỗi. Thử thách đầu tiên tập trung vào suy luận tài liệu, yêu cầu các tác nhân AI phải suy luận và tính toán trên dữ liệu phức tạp, không có cấu trúc. Julian Love, Đối tác quản lý của Franklin Templeton Digital Assets, cho biết các môi trường có cấu trúc như Arena sẽ giúp ngành công nghiệp phân biệt giữa "những ý tưởng tiềm năng" và "các khả năng thực sự sẵn sàng cho sản xuất". Himanshu Tyagi, đồng sáng lập của Sentient, cho biết các doanh nghiệp cần xác thực tính ổn định và khả năng lặp lại của suy luận tác nhân trong môi trường sản xuất. Arena sẽ ra mắt trên toàn cầu, với kế hoạch tổ chức các sự kiện trực tiếp tại San Francisco bắt đầu từ tháng 3 năm 2026.