Nhà sản xuất điện thoại thông minh và xe điện Trung Quốc, Xiaomi đã chính thức bước vào cuộc đua AI với việc ra mắt MiMo, mô hình ngôn ngữ lớn (LLM) mã nguồn mở đầu tiên của hãng được thiết kế riêng cho các tác vụ suy luận nâng cao.
Mặc dù có cấu trúc tương đối nhỏ gọn với 7 tỷ tham số, MiMo đã vượt trội hơn các đối thủ lớn hơn như o1-mini của OpenAI về khả năng lập luận toán học và mã hóa, đưa Xiaomi trở thành đối thủ đáng gờm trong lĩnh vực AI.
MiMo là mô hình ngôn ngữ đầu tiên của Xiaomi và công ty cho biết mô hình này được phát triển bằng cách sử dụng công nghệ học tăng cường bởi nhóm chuyên trách AI có tên là Core.
Xiaomi nhấn mạnh rằng MiMo đặc biệt phù hợp với các nhiệm vụ đòi hỏi tư duy logic, lý luận toán học và suy luận phức tạp. Điều này khiến nó trở thành một công cụ mạnh mẽ cho các lĩnh vực như thiết kế thuật toán, kỹ thuật phần mềm, khoa học dữ liệu và nghiên cứu học thuật.
Kích thước nhỏ hơn của nó cũng mang lại một lợi thế độc đáo: MiMo có thể được triển khai trong môi trường doanh nghiệp hoặc thiết lập điện toán biên nơi tài nguyên phần cứng bị hạn chế, khiến nó vừa mạnh mẽ vừa thiết thực.
Phù hợp với triết lý nguồn mở, Xiaomi đã công khai MiMo và báo cáo kỹ thuật đầy đủ của nó trên GitHub và Hugging Face. Động thái này mời cộng đồng nhà phát triển toàn cầu thử nghiệm, tinh chỉnh và mở rộng khả năng của mô hình—có khả năng thúc đẩy đổi mới và áp dụng.
Mô hình AI của Xiaomi ra đời vào thời điểm các công ty công nghệ lớn của Trung Quốc bắt đầu thể hiện sức mạnh của mình trong việc phát triển các mô hình nền tảng, được thúc đẩy bởi tiềm năng thương mại khi kết hợp sản phẩm của họ với AI.
Trong khi Xiaomi đang tung ra một mô hình lý luận sau DeepSeek và Alibaba, thì hôm thứ sáu, hãng này cho biết họ vẫn có cơ hội đạt tới trí tuệ nhân tạo tổng quát, mốc lý thuyết mà AI ngang bằng hoặc vượt qua trí thông minh của con người.
"Năm 2025 dường như là nửa sau của cuộc cạnh tranh mô hình AI, nhưng chúng tôi tin chắc rằng con đường đến AGI vẫn còn rất dài."
Alibaba đã chính thức tung ra thế hệ thứ ba của mô hình AI Qwen nguồn mở, nhằm mục đích nâng cao tốc độ, khả năng mở rộng và xử lý đa ngôn ngữ.
Sự ra mắt này sẽ tiếp thêm động lực mới cho bối cảnh AI vốn đã cạnh tranh của Trung Quốc, nơi chứng kiến sự gia nhập nhanh chóng của các mô hình ngôn ngữ mạnh mẽ từ những gã khổng lồ công nghệ trên khắp cả nước.
Dòng Qwen3 mới bao gồm tám kích cỡ mô hình—từ 600 triệu tham số nhẹ đến 235 tỷ tham số khổng lồ—mỗi mô hình đều có những nâng cấp về hiệu quả, khả năng lập luận và tính linh hoạt của ngôn ngữ.
Theo Alibaba Cloud, bộ phận dẫn đầu phát triển AI của công ty, mọi phiên bản Qwen3 đều được tối ưu hóa để xử lý nhanh hơn và hỗ trợ ngôn ngữ rộng hơn, giúp chúng dễ tiếp cận hơn cho cả doanh nghiệp và nhà phát triển.
Những công ty lớn khác như ByteDance và Tencent Holdings cũng đã có những bước tiến đáng kể trong lĩnh vực AI. Chỉ tuần trước, Baidu đã công bố ra mắt Ernie 4.5 Turbo, phiên bản mới nhất của các mô hình ngôn ngữ lớn, làm gia tăng thêm sự cạnh tranh giữa các công ty công nghệ hàng đầu của Trung Quốc.