Googlecông bốsự ra mắt của mô hình AI Gemini. Gemini là mô hình AI mạnh mẽ và linh hoạt nhất của Google cho đến nay, có khả năng hiểu, thao tác và kết hợp đồng thời các loại thông tin khác nhau như văn bản, mã, âm thanh, hình ảnh và video.
Hiệu suất tiên tiến
Mô hình AI đa phương thức gốc Gemini do Google đưa ra nhấn mạnh việc tạo ra một mô hình AI mô-đun ngay từ đầu. Tương tự như cách con người có năm giác quan, đồng thời nhận thức và cảm nhận thế giới, Song Tử cũng có thể hiểu, thao tác và kết hợp các loại thông tin khác nhau một cách toàn diện và liền mạch như văn bản, mã, âm thanh, hình ảnh và video.
Khả năng này vượt qua tính hiệu quả của các mẫu văn bản hoặc giọng nói được xây dựng riêng lẻ khác mà sau này được kết nối để tạo ra kết quả.
Google kiểm tra nghiêm ngặt mô hình Gemini và đánh giá hiệu suất của nó qua nhiều nhiệm vụ khác nhau. Từ khả năng hiểu hình ảnh, âm thanh và video tự nhiên đến lý luận toán học, hiệu suất của Gemini Ultra vượt qua các kết quả tiên tiến hiện tại ở 30 trên 32 điểm chuẩn học thuật được sử dụng rộng rãi để phát triển các mô hình ngôn ngữ lớn (LLM).
Ngoài nhân loại
Gemini Ultra cấp cao nhất đạt điểm cao tới 90,0%, khiến nó trở thành mô hình đầu tiên vượt qua các chuyên gia con người về MMLU (Hiểu ngôn ngữ đa tác vụ quy mô lớn).
Ba phiên bản
Gemini đại diện cho mô hình thích ứng nhất của chúng tôi cho đến nay, có khả năng chạy hiệu quả trên nhiều nền tảng khác nhau, từ trung tâm dữ liệu đến thiết bị di động. Các khả năng nâng cao của nó được thiết lập để cải thiện đáng kể các tùy chọn phát triển và khả năng mở rộng cho cả nhà phát triển và khách hàng doanh nghiệp tận dụng AI.
Google đã tối ưu hóa Gemini 1.0, phiên bản đầu tiên của họ, cho ba kích cỡ khác nhau:
-Gemini Ultra — mô hình lớn nhất và có khả năng nhất cho các nhiệm vụ có độ phức tạp cao.
-Gemini Pro — mô hình tốt nhất để mở rộng quy mô trên nhiều nhiệm vụ.
-Gemini Nano — model hiệu quả nhất cho các tác vụ trên thiết bị.
Sự tham gia của Bard
Chatbot AI Bard của Google đã bắt đầu sử dụng phiên bản tinh tế của Gemini Pro để thực hiện lý luận, lập kế hoạch, hiểu biết nâng cao và hơn thế nữa. Đây đánh dấu lần nâng cấp lớn nhất kể từ khi Bard ra mắt. Nó sẽ có sẵn bằng tiếng Anh trên hơn 170 quốc gia và khu vực, với kế hoạch mở rộng sang các chế độ khác nhau và hỗ trợ các ngôn ngữ và địa điểm mới trong tương lai gần.
Không cần Internet
Google cũng đã giới thiệu Gemini với Pixel. Pixel 8 Pro là điện thoại thông minh đầu tiên chạy Gemini Nano, hỗ trợ các tính năng mới như 'Tóm tắt' trong ứng dụng Ghi âm. Điều này không yêu cầu kết nối internet và cho phép tổ chức các bản tóm tắt cuộc họp từ các tệp được ghi bằng Gemini trên điện thoại. Bắt đầu với WhatsApp, họ sẽ ra mắt Trả lời thông minh trong Gboard và vào năm tới, họ sẽ giới thiệu nhiều ứng dụng hơn.
Giám đốc điều hành Google và Alphabet Sundar Pichai cho biết:
"Đó là điều khiến tôi phấn khích: cơ hội giúp AI trở nên hữu ích cho mọi người, ở mọi nơi trên thế giới"