OpenAI công bố ra mắt o1, một mô hình trí tuệ nhân tạo có khả năng suy luận, có tên mã nội bộ là "Strawberry". OpenAI o1 có thể suy luận về các nhiệm vụ phức tạp và giải quyết các vấn đề khó hơn các mô hình khoa học, mã hóa và toán học trước đây.
Trong các thử nghiệm, OpenAI o1 thể hiện như một nghiên cứu sinh tiến sĩ khi thực hiện các nhiệm vụ tiêu chuẩn đầy thách thức về vật lý, hóa học và sinh học, đồng thời xuất sắc trong môn toán và mã hóa. Trong kỳ thi vòng loại Olympic Toán học quốc tế (IMO), GPT-4o chỉ giải đúng 13% số bài, trong khi mô hình suy luận đạt 83% và khả năng mã hóa của OpenAI o1 đạt phân vị thứ 89 trong cuộc thi Codeforces.
Mặc dù OpenAI o1, phiên bản đầu tiên, chưa có nhiều tính năng hữu ích của ChatGPT, chẳng hạn như duyệt web để tìm thông tin cũng như tải lên các tệp và hình ảnh, nhưng GPT-4o sẽ mạnh mẽ hơn trong thời gian ngắn. Nhưng đối với các nhiệm vụ suy luận phức tạp, đây là một bước tiến đáng kể và thể hiện một cấp độ mới về khả năng trí tuệ nhân tạo.
Vì lý do này, bộ đếm được đặt lại về 1 và chuỗi được đặt tên là OpenAI o1. Các nhà nghiên cứu chăm sóc sức khỏe có thể sử dụng o1 để chú thích dữ liệu giải trình tự tế bào, các nhà vật lý có thể sử dụng o1 để tạo ra các công thức toán học phức tạp cần thiết cho quang học lượng tử và các nhà phát triển trong mọi lĩnh vực có thể sử dụng o1 để xây dựng và thực hiện quy trình làm việc gồm nhiều bước.
OpenAI cũng phát hành OpenAI o1-mini, một mô hình suy luận hiệu quả về mặt chi phí. o1-mini vượt trội trong STEM, đặc biệt là toán và mã hóa – hoạt động gần như ngang bằng với OpenAI o1 trên các tiêu chuẩn đánh giá như AIME và Codeforces. OpenAI dự đoán rằng o1-mini sẽ là mô hình nhanh hơn, tiết kiệm chi phí hơn 80% so với o1-preview dành cho các ứng dụng yêu cầu suy luận mà không cần có kiến thức sâu rộng về thế giới. Người dùng ChatGPT Plus, Team, Enterprise và Edu có thể sử dụng o1-mini thay thế cho o1-preview với giới hạn tốc độ cao hơn và độ trễ thấp hơn.