Vào ngày 18 tháng 7, công ty trí tuệ nhân tạo (AI) có trụ sở tại Hoa Kỳ OpenAI đã công bố trong bài đăng trên blog của mình ra mắt mô hình AI tổng hợp mới, tiết kiệm chi phí có tên "GPT-4o mini."
Phiên bản thu nhỏ này được thiết kế để cho phép nhiều công ty và chương trình hơn tận dụng khả năng AI tiên tiến của nó.
Giới thiệu GPT-4o mini
Kiến thức của mô hình mini GPT-4o được cập nhật lần cuối vào tháng 10 năm ngoái, phù hợp với GPT-4o về loại ngôn ngữ và có cửa sổ ngữ cảnh gồm 128 nghìn mã thông báo.
Mô hình mới này hỗ trợ nhiều chức năng tương tự như phiên bản trước, hiện cung cấp các phương thức văn bản và hình ảnh thông qua API, đồng thời có kế hoạch mở rộng sang đầu vào/đầu ra video và âm thanh trong tương lai.
Mặc dù thang đo tham số chính xác không được tiết lộ, Bài đăng trên blog chính thức của OpenAI Những trạng thái:
“Đây là mô hình nhỏ tiết kiệm và tiết kiệm chi phí nhất của họ vào thời điểm hiện tại và việc tinh chỉnh sẽ sớm được cung cấp.”
Đáng chú ý, GPT-4o mini vượt trội hơn GPT-4 về tùy chọn trò chuyện trên bảng xếp hạng LMSYS và có thể so sánh với GPT-4 Turbo trong bảng xếp hạng tổng thể.
Trước khi phát hành, hơn 6.000 người dùng đã bình chọn cho phiên bản đầu tiên "upcoming-gpt-mini" nhưng kết quả đã bị xóa.
LMSYS đã thông báo trên X rằng họ đang thu thập phiếu bầu trở lại và sẽ sớm công bố kết quả cho mẫu xe chính thức.
Việc phát hành GPT-4o mini nhằm mở rộng đáng kể phạm vi ứng dụng AI.
Nó không chỉ có chi phí thấp và độ trễ thấp mà còn hỗ trợ nhiều tác vụ, bao gồm các ứng dụng xâu chuỗi hoặc song song nhiều mô hình (gọi nhiều API), chuyển ngữ cảnh mở rộng tới các mô hình (chẳng hạn như cơ sở mã đầy đủ hoặc lịch sử hội thoại) hoặc tương tác với khách hàng thông qua phản hồi văn bản nhanh chóng, theo thời gian thực (hỗ trợ chatbot).
Ngoài ra, nó xử lý các văn bản không phải tiếng Anh tiết kiệm chi phí hơn nhờ bộ mã thông báo cải tiến được chia sẻ với GPT-4o.
Về khả năng xử lý văn bản và lý luận đa phương thức, GPT-4o mini vượt trội hơn GPT-3.5 Turbo và các mẫu nhỏ khác, hỗ trợ tất cả các ngôn ngữ mà GPT-4o thực hiện.
Nó cũng thể hiện hiệu suất xử lý ngữ cảnh dài được cải thiện so với GPT-3.5 Turbo và hoạt động tốt trong các lệnh gọi hàm, giúp các nhà phát triển xây dựng ứng dụng thuận tiện hơn.
Hiện vẫn chưa rõ liệu mô hình mini có mang lại lợi ích môi trường nào so với các mô hình khác hay không.
OpenAI chưa cung cấp thông tin về phương pháp được sử dụng để giảm chi phí vận hành, cho thấy rằng lợi ích có thể không mở rộng sang việc tiết kiệm năng lượng thực tế mà thay vào đó có thể áp dụng cho việc tiết kiệm chi phí của người dùng cuối.
Theo OpenAI, sự cân bằng giữa sức mạnh và hiệu suất là rất nhỏ.
Mặc dù tiêu thụ năng lượng nhỏ hơn nhưng GPT mini dường như không hề thiếu hiệu suất.
Bài đăng trên blog của OpenAI nói rằng mô hình mới "có giá cả phải chăng hơn rất nhiều so với các mô hình biên giới trước đây". và "rẻ hơn 60% so với GPT-3.5 Turbo."
Công ty viết:
“GPT-4o mini vượt qua GPT-3.5 Turbo và các mẫu nhỏ khác về điểm chuẩn học thuật trên cả trí thông minh văn bản và lý luận đa phương thức, đồng thời hỗ trợ cùng một phạm vi ngôn ngữ như GPT-4o.”
GPT-4o mini có giá 15 xu cho mỗi 1 triệu đầu vào mã thông báo và 60 xu cho mỗi đầu ra 1 triệu mã thông báo.
Token 1 triệu tương đương với một cuốn sách 2.500 trang.
Model này được định vị là model có hiệu suất cao, chi phí thấp nhất, chỉ đứng sau Llama 3 8B.
Như có thể thấy trong bảng bên dưới, trong số tất cả các mẫu nhỏ hiện được các nhà sản xuất hàng đầu tung ra, GPT-4o mini vượt qua nhiều đối thủ cạnh tranh, chẳng hạn như Gemini 1.5 Flash, Llama 3 8B và Mistral 7B, khiến nó trở thành lựa chọn tiết kiệm chi phí nhất.
Godement, giám đốc sản phẩm tại OpenAI chịu trách nhiệm về mô hình mới, cho biết:
“Mục đích chung của OpenAI là xây dựng và phân phối AI một cách an toàn và làm cho nó có thể truy cập rộng rãi. Cung cấp thông tin tình báo với chi phí thấp hơn là một trong những cách hiệu quả nhất để chúng tôi làm điều đó.”
Godement giải thích rằng OpenAI đã phát triển một sản phẩm rẻ hơn bằng cách cải thiện kiến trúc mô hình cũng như tinh chỉnh dữ liệu và chế độ đào tạo.
Ông tuyên bố rằng GPT-4o mini vượt trội hơn các loại "nhỏ" khác. mô hình trên thị trường trong một số tiêu chuẩn chung.
Ông nhắc lại rằng GPT-4o mini thực sự thể hiện sứ mệnh của OpenAI là làm cho AI có thể tiếp cận rộng rãi hơn. Nếu muốn AI mang lại lợi ích cho mọi nơi trên thế giới, mọi ngành công nghiệp và mọi ứng dụng, thì nó phải có giá cả phải chăng hơn.
Anh lặp lại:
“Tôi nghĩ GPT-4o mini thực sự hiện thực hóa sứ mệnh của OpenAI – giúp mọi người có thể tiếp cận AI rộng rãi hơn. Nếu chúng ta muốn AI mang lại lợi ích cho mọi nơi trên thế giới, mọi ngành công nghiệp và mọi ứng dụng, chúng ta phải làm cho AI rẻ hơn.”
Ông thừa nhận rằng khách hàng; nhu cầu ngày càng phát triển:
“Những gì chúng tôi thấy ngày càng nhiều từ thị trường là các nhà phát triển và doanh nghiệp kết hợp các mô hình lớn và nhỏ để xây dựng trải nghiệm sản phẩm tốt nhất ở mức giá và độ trễ phù hợp với họ.”
Godement cho biết các dịch vụ đám mây của OpenAI cung cấp cho khách hàng những mô hình đã trải qua nhiều thử nghiệm bảo mật hơn so với các đối thủ cạnh tranh. Ông nói thêm rằng OpenAI cuối cùng có thể phát triển các mô hình mà khách hàng có thể chạy trên thiết bị của riêng họ.
Ông kết luận:
“Nếu chúng tôi thấy nhu cầu lớn, chúng tôi có thể mở cánh cửa đó.”
GPT-4o mini giống iPhoneSE của Apple?
GPT-4o mini là phiên bản tiết kiệm chi phí của sản phẩm chủ lực của OpenAI, ChatGPT.
So sánh với việc Apple thường xuyên phát hành iPhone — từ iPhone 3G đến iPhone 15 Pro Max mới nhất — OpenAI dường như đang áp dụng một chiến lược tương tự với ChatGPT.
Điều này đặt ra một câu hỏi thích hợp: liệu cách tiếp cận của OpenAI có dẫn đến việc tăng giá đáng kể trong khi cung cấp các bản nâng cấp tối thiểu hoặc dưới mức trung bình, giống như một số lời chỉ trích về các bản cập nhật gia tăng của iPhone không?
OpenAI liên tục giới thiệu các tính năng mới trong bối cảnh cạnh tranh
Sự ra mắt của GPT-4o mini trùng hợp với một loạt hoạt động từ OpenAI và nhiều hành động khác nhau nhằm vào công ty.
OpenAI được cho là đang phát triển một mô hình AI có tên "Strawberry" dự kiến sẽ thể hiện khả năng suy luận nâng cao ngoài GPT-4o, mang lại phản hồi giống con người hơn.
Mẫu xe mới này được đồn đại là một phần mở rộng của dự án Q* bí ẩn của công ty.
Ở một lưu ý khác, OpenAI có thể bị Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) giám sát sau khi người tố giác kêu gọi điều tra về hành vi sai trái tiềm ẩn liên quan đến việc sử dụng các thỏa thuận không tiết lộ của công ty.
OpenAI đã coi đây là một phần trong nỗ lực của mình nhằm làm cho AI "có thể truy cập rộng rãi nhất có thể". nhưng nó cũng nhấn mạnh sự cạnh tranh ngày càng gay gắt giữa các nhà cung cấp đám mây AI và mối quan tâm ngày càng tăng đối với các mô hình AI nguồn mở, nhỏ, miễn phí.
Một số nguồn tin đã xác nhận rằng Meta đang có kế hoạch ra mắt phiên bản lớn nhất của Llama 3, với 400 tỷ thông số, vào ngày 23 tháng 7, mặc dù ngày phát hành có thể thay đổi.
Khả năng của phiên bản Llama 3 này vẫn chưa rõ ràng, nhưng một số công ty đang hướng tới các mô hình AI nguồn mở do tính hiệu quả về chi phí, khả năng tùy chỉnh và khả năng kiểm soát tốt hơn mà chúng cung cấp đối với cả mô hình và dữ liệu mà nó xử lý.