Tác giả: Tristan Greene, CoinTelegraph; Người biên soạn: Tao Zhu, Golden Finance
Điểm chuẩn A cho Trí tuệ nhân tạo sáng tạo chúa tể mới đã xuất hiện trong lĩnh vực thử nghiệm và tên của nó là Gemini 1.5 Pro.
Nhà vô địch trước đó, ChatGPT-4o của OpenAI, cuối cùng đã bị vượt qua vào ngày 1 tháng 8, khi Google lặng lẽ tung ra phiên bản thử nghiệm của mẫu máy mới nhất của mình.
Bản cập nhật mới nhất của Gemini được phát hành mà không có nhiều sự phô trương và hiện được đánh dấu là thử nghiệm. Nhưng nó nhanh chóng thu hút sự chú ý của cộng đồng AI trên mạng xã hội trong bối cảnh có nhiều báo cáo cho rằng nó vượt trội so với các đối thủ về điểm chuẩn.
Điểm chuẩn trí tuệ nhân tạo
Kể từ khi phát hành GPT-3, ChatGPT của OpenAI đã dẫn đầu trong lĩnh vực sáng tạo Điểm chuẩn AI. Trong khoảng một năm qua, mẫu mới nhất của nó, GPT-4o và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã vượt xa hầu hết các mẫu khác trên hầu hết các tiêu chuẩn chung mà chúng hầu như không gặp phải đối thủ cạnh tranh nào.
Nguồn: Tổ chức hệ thống mô hình lớn.
Một trong những điểm chuẩn phổ biến nhất là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trong nhiều nhiệm vụ khác nhau và cho điểm khả năng tổng thể. GPT-4o đạt 1.286 điểm, trong khi Claude-3 đạt được 1.271 điểm đáng nể.
Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng một phiên bản thử nghiệm được phát hành vào ngày 1 tháng 8 (Gemini 1.5 Pro 0801) đã ghi được số điểm khổng lồ là 1.300.
Điều này cho thấy nhìn chung nó mạnh hơn đối thủ, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì một mô hình AI có thể và không thể làm.
Sự phấn khích của cộng đồng
Nếu không có sự so sánh sâu sắc hơn, chúng ta đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn khác nhau. Cuối cùng, người dùng quyết định mô hình AI nào phù hợp nhất với họ.
Phiên bản mới nhất của Gemini được đồn đại là sẽ gây ra một làn sóng phấn khích, được người dùng trên mạng xã hội gọi là "thực sự tốt". Một Redditor thậm chí còn viết rằng nó "hoàn toàn đập 4o".
Không rõ phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù nó vẫn có sẵn kể từ khi xuất bản bài viết này, nhưng thực tế là nó đang ở giai đoạn phát hành sớm hoặc beta cho thấy rằng mô hình này có thể bị rút hoặc thay đổi vì lý do bảo mật hoặc phối hợp.