OpenAI vừa hé lộ về việc phát hành một mô hình ngôn ngữ nguồn mở mới vào mùa hè này, cho phép các nhà phát triển chạy mô hình trên phần cứng của riêng họ.
Động thái này sẽ đánh dấu lần đầu tiên công ty phát hành một mẫu máy mở kể từ khi ra mắt GPT-2 vào năm 2019, dường như đảo ngược sự chuyển dịch sang các mẫu máy kín của công ty trong những năm gần đây.
Nhưng các chuyên gia suy đoán rằng mô hình mới sẽ không mở 100%, giống như các công ty khác cung cấp mô hình AI "mở", bao gồm meta và Mistral, openAI sẽ không cung cấp quyền truy cập vào dữ liệu được sử dụng để đào tạo mô hình. Tuy nhiên, giấy phép sử dụng sẽ cho phép các nhà nghiên cứu, nhà phát triển và người dùng khác truy cập vào mã cơ bản và trọng số của chế độ mới để sử dụng, sửa đổi hoặc cải thiện nó.
CEO Sam Altman đã thông báo trong bài đăng trên X vào ngày 31 tháng 3 rằng mô hình mới sẽ có khả năng suy luận, dự kiến sẽ được phát hành trong những tháng tới. Ông nói thêm rằng mặc dù đây là điều ông đã nghĩ đến trong một thời gian dài, nhưng ông không muốn phát hành mô hình ngôn ngữ một cách vội vàng.
Thay vào đó, công ty muốn trước tiên thu thập phản hồi về cách làm cho nó hữu ích tối đa. Vì vậy, họ đang tổ chức các sự kiện dành cho nhà phát triển để thu thập phản hồi và thử nghiệm các nguyên mẫu khác nhau để hoàn thiện mô hình ngôn ngữ mới trước khi phát hành.
Các sự kiện dành cho nhà phát triển sẽ bắt đầu tại Hoa Kỳ, tiếp theo là các mùa giải ở khu vực Châu Âu và Châu Á - Thái Bình Dương.
Tại sao lại đột nhiên thay đổi thái độ như vậy?
Nhiều người cho rằng sự thay đổi đột ngột của OpenAI trong việc áp dụng các mô hình ngôn ngữ nguồn mở xuất phát từ áp lực từ Trung Quốc, đặc biệt là sau sự bùng nổ gần đây của các mô hình AI nguồn mở như DeepSeek R1, đã đảo ngược kịch bản AI theo hướng có lợi cho nguồn mở vào tháng 1.
Lần đầu tiên trong những năm gần đây, các mô hình nguồn mở cung cấp hiệu suất tương đương với AI độc quyền tiên tiến nhất. Đặc biệt là ở Trung Quốc, thành công của DeepSeek đã làm hồi sinh bối cảnh AI nguồn mở, tạo động lực mới sau một thời gian mà nghiên cứu khép kín chiếm ưu thế.
Nhưng có vẻ như có một sắc thái và lý do sâu xa hơn thúc đẩy Sam Altman thay đổi quan điểm về mã nguồn mở. Khi công nghệ AI đi vào kinh doanh, ngày càng nhiều khách hàng yêu cầu tính linh hoạt và minh bạch cao hơn của các mô hình mã nguồn mở cho nhiều mục đích sử dụng.
Khi khoảng cách giữa OpenAI và các đối thủ cạnh tranh ngày càng thu hẹp, OpenAI ngày càng khó có thể biện minh cho cách tiếp cận gần 100% của mình - điều mà Altman đã thừa nhận vào tháng 1 khi ông thừa nhận rằng DeepSeek đã làm giảm vị thế dẫn đầu của OpenAI trong lĩnh vực AI và rằng OpenAI đã "đi sai hướng" khi nói đến việc mở nguồn công nghệ của mình.
OpenAI thích ứng với kỷ nguyên AI rất khác biệt với những nhu cầu riêng biệt
Ngoài áp lực từ các đối thủ cạnh tranh Trung Quốc, động thái này cũng cho thấy bối cảnh phát triển của bối cảnh AI. Không giống như trước đây, người dùng ngày nay đang chuyển trọng tâm từ mô hình sang ứng dụng hoặc tổ chức hệ thống sử dụng mô hình để đáp ứng nhu cầu cụ thể của họ.
Mặc dù vẫn còn một lượng lớn người dùng muốn sử dụng LLM tiên tiến, nhưng việc mở rộng phạm vi để cung cấp mô hình nguồn mở sẽ cho phép OpenAI hiện diện trong các tình huống mà khách hàng không muốn sử dụng ChatGPT hoặc API dành cho nhà phát triển của công ty.
Rowan Curran, nhà phân tích cấp cao tại Forrester Research giải thích rằng sự trở lại mã nguồn mở của OpenAi cho thấy hệ sinh thái AI ngày càng đa dạng, từ OpenAI, Google, Antropoic, Amazon và Meta.
Ông nói thêm rằng các công ty doanh nghiệp không hào hứng với các mô hình AI nguồn mở vì độ chính xác của chúng, mà vì chúng linh hoạt. Điều này có nghĩa là chúng có thể chạy trên các nền tảng đám mây khác nhau hoặc thậm chí trên trung tâm dữ liệu, máy trạm, máy tính xách tay của riêng công ty thay vì bị ràng buộc với một nhà cung cấp.
Một hành động cân bằng tinh tế
Khi OpenAI chuyển trở lại mô hình mã nguồn mở, họ cũng sẽ dễ bị các đối thủ cạnh tranh Trung Quốc sao chép và cải tiến công nghệ của mình.
OpenAI trước đây đã nêu mối quan ngại này là lý do chính khiến họ giữ mô hình ngôn ngữ của mình đóng cửa. Quay trở lại tháng 1, OpenAi đã đưa ra một tuyên bố, lưu ý rằng, "Điều cực kỳ quan trọng là chúng tôi đang hợp tác chặt chẽ với chính phủ Hoa Kỳ để bảo vệ tốt nhất các mô hình có khả năng nhất khỏi những nỗ lực của đối thủ và đối thủ cạnh tranh nhằm chiếm đoạt Công nghệ Hoa Kỳ.
Sau đó, người ta còn phát hiện ra rằng mặc dù DeepSeek không công bố dữ liệu được sử dụng để đào tạo mô hình R1, nhưng có dấu hiệu cho thấy nó có thể đã sử dụng kết quả từ o1 của OpenAi để khởi động quá trình đào tạo khả năng suy luận của mô hình.
Hiện nay, Hoa Kỳ một lần nữa lại đứng trước ngã ba đường quan trọng, nơi họ phải cân bằng giữa việc sử dụng nguồn đóng hay nguồn mở; trong khi nguồn mở trao các công cụ mạnh mẽ vào tay các nhà phát triển quyền lực trên toàn thế giới, mở rộng nguyên tắc AI dân chủ và thúc đẩy tăng trưởng kinh tế, thì các mô hình đóng kết hợp các biện pháp bảo vệ quan trọng giúp bảo vệ lợi thế chiến lược của Hoa Kỳ và ngăn chặn việc sử dụng sai mục đích.