Nguồn: Lượng tử
"Đánh giá công nghệ MIT" đã đưa ra 5 xu hướng chính trong phát triển trí tuệ nhân tạo vào năm 2025, đồng thời loại trừ các tác nhân và mô hình ngôn ngữ nhỏ với lý do điều này đã rõ ràng rằng xu hướng lớn. Ngoài ra, đây là năm xu hướng hot khác mà bạn nên chú ý trong năm nay, theo trang này. Xin vui lòng đọc tiếp.
Trong vài năm qua, chúng tôi đã dự đoán về sự phát triển trong tương lai của trí tuệ nhân tạo. Xem xét ngành này đang phát triển nhanh như thế nào, điều này có vẻ giống như một giấc mơ viển vông. Nhưng chúng tôi đã tiếp tục nỗ lực này và đã đạt được danh tiếng về tư duy cầu tiến và độ tin cậy.
Vòng dự đoán gần đây nhất của chúng ta diễn ra như thế nào? Bốn xu hướng hàng đầu cần chú ý vào năm 2024, được dự đoán vào năm ngoái, bao gồm: Cái mà chúng tôi gọi là chatbot tùy chỉnh — các ứng dụng trợ lý tương tác được hỗ trợ bởi các mô hình ngôn ngữ quy mô lớn đa phương thức (chúng tôi chưa biết về điều đó, nhưng chúng tôi đang nói về điều gì) Điều mà mọi người đang gọi là đại lý ngày nay là tiếng vang lớn nhất trong lĩnh vực trí tuệ nhân tạo hiện nay); tạo video (rất ít công nghệ đã phát triển nhanh như vậy trong 12 tháng qua, với OpenAI và Google DeepMind trong một tuần vào tháng 12 đã phát hành các mô hình tạo video hàng đầu của họ. Sora và Veo); và nhiều robot có mục đích chung hơn có thể thực hiện nhiều nhiệm vụ hơn (lợi ích từ các mô hình ngôn ngữ lớn tiếp tục lan sang các lĩnh vực khác của ngành công nghệ, trong đó có robot đứng đầu).
Chúng tôi cũng nói rằng thông tin sai lệch về bầu cử do AI tạo ra sẽ có ở khắp mọi nơi, nhưng may mắn thay, chúng tôi đã nhầm. Có rất nhiều điều phải lo lắng trong năm nay, nhưng những vụ deepfake chính trị rất hiếm xảy ra.
Vậy điều gì sẽ xảy ra vào năm 2025? Chúng ta sẽ bỏ qua điều hiển nhiên ở đây: điều chắc chắn là các đại lý và các mô hình ngôn ngữ nhỏ hơn, hiệu quả hơn sẽ tiếp tục định hình ngành. Dưới đây là năm xu hướng hot bạn nên chú ý đến trong năm nay.
1. Tạo sân chơi ảo
< /p >
Nếu năm 2023 là năm của hình ảnh và năm 2024 là năm của video thì điều gì sẽ xảy ra tiếp theo? Nếu bạn đoán đó là thế giới ảo (hay còn gọi là trò chơi điện tử) được tạo ra thì hãy cùng đập tay với chúng nhé.
Vào tháng 2 năm 2024, Google DeepMind đã phát hành một mô hình tổng quát có tên Genie, có thể chụp ảnh tĩnh và chuyển đổi chúng thành trò chơi nền tảng hai chiều cuộn bên mà người chơi có thể tương tác sơ bộ. hiểu biết về công nghệ này. Vào tháng 12, công ty đã phát hành Genie 2, một mô hình có thể biến hình ảnh ban đầu thành toàn bộ thế giới ảo.
Các công ty khác đang phát triển các công nghệ tương tự. Vào tháng 10, các công ty khởi nghiệp AI Decart và Etched đã tiết lộ một bản hack không chính thức của Minecraft, trong đó mọi khung hình trong trò chơi được tạo ra một cách nhanh chóng khi người chơi chơi. World Labs là một công ty khởi nghiệp được đồng sáng lập bởi Li Feifei, một nhà khoa học trí tuệ nhân tạo nổi tiếng và được mệnh danh là "Mẹ đỡ đầu của Trí tuệ nhân tạo". Công ty đang xây dựng cái gọi là Mô hình Thế giới Lớn (LWM). (Lý Phi Phi cũng là người sáng tạo ra ImageNet, bộ dữ liệu ảnh khổng lồ đã khởi đầu cơn sốt học sâu.)
Một lĩnh vực ứng dụng rõ ràng là trò chơi điện tử. Những thử nghiệm ban đầu này rất thú vị và mô phỏng 3D tổng quát có thể được sử dụng để khám phá các khái niệm thiết kế cho trò chơi mới, chuyển đổi ngay lập tức các bản phác thảo thành môi trường có thể chơi được. Điều này có thể dẫn đến một loại trò chơi hoàn toàn mới.
Nhưng chúng cũng có thể được sử dụng để huấn luyện robot. World Lab hy vọng sẽ phát triển được cái gọi là trí tuệ không gian - khả năng của robot diễn giải và tương tác với cuộc sống hàng ngày. Nhưng các nhà nghiên cứu robot thiếu dữ liệu chất lượng cao từ các tình huống thực tế để đào tạo công nghệ này. Xây dựng vô số thế giới ảo, đặt robot ảo vào đó và học hỏi thông qua thử và sai có thể bù đắp cho thiếu sót này.
2. Mô hình ngôn ngữ lớn có khả năng "lý luận"
Tin đồn này là chính đáng. Khi OpenAI phát hành o1 vào tháng 9, nó đã giới thiệu một mô hình mới về cách hoạt động của các mô hình ngôn ngữ lớn. Hai tháng sau, công ty đã thúc đẩy mô hình này về mọi mặt với việc ra mắt o3 - một mẫu máy có thể tái tạo lại hoàn toàn công nghệ.
Hầu hết các mô hình, bao gồm cả sản phẩm chủ lực GPT-4 của OpenAI, đều đưa ra câu trả lời đầu tiên mà họ nghĩ ra. Đôi khi điều đó đúng; đôi khi không. Nhưng mô hình mới của công ty được đào tạo để giải quyết vấn đề theo từng bước, chia nhỏ các vấn đề khó thành hàng loạt vấn đề đơn giản hơn. Khi một cách tiếp cận không hiệu quả, họ sẽ thử cách khác. Kỹ thuật này, được gọi là "suy luận" (vâng - chúng tôi biết chính xác từ đó nghĩa là gì), có thể làm cho kỹ thuật này trở nên chính xác hơn, đặc biệt là trong các bài toán, vật lý và logic.
Điều này cũng rất quan trọng đối với các đại lý.
Vào tháng 12, Google DeepMind đã phát hành một tác nhân duyệt web thử nghiệm mới có tên Mariner. Trong bản demo xem trước do công ty cung cấp, Mariner dường như đang gặp sự cố. Megha Gore, giám đốc sản phẩm của công ty, đã yêu cầu người đại diện tìm cho cô ấy một công thức làm bánh quy Giáng sinh trông giống như những chiếc trong bức ảnh mà cô ấy đã đưa cho cô ấy. Mariner tìm thấy một công thức trực tuyến và bắt đầu thêm nguyên liệu vào giỏ hàng trực tuyến của Gore.
Rồi nó dừng lại vì không biết nên chọn loại bột nào. Gore quan sát Mariner giải thích các bước của mình trong cửa sổ trò chuyện: "Nó nói: 'Tôi sẽ sử dụng nút quay lại trên trình duyệt của mình để quay lại công thức nấu ăn.'"
Đó là một khoảnh khắc đáng chú ý. Thay vì đụng vào tường, tác nhân chia nhiệm vụ thành nhiều hành động khác nhau và chọn một hành động có khả năng giải quyết được vấn đề. Việc nhận ra rằng bạn cần nhấn nút "quay lại" nghe có vẻ đơn giản, nhưng đối với một robot không có trí óc thì đó là khoa học tên lửa. Và nó đã thành công: Mariner quay lại công thức, xác nhận loại bột và tiếp tục chất bột mì vào xe đẩy của Gore.
Google DeepMind cũng đang xây dựng phiên bản thử nghiệm của mô hình ngôn ngữ quy mô lớn mới nhất, Gemini 2.0, sử dụng phương pháp tiếp cận từng bước này để giải quyết vấn đề, được gọi là Tư duy chớp nhoáng Gemini 2.0.
Nhưng OpenAI và Google chỉ là phần nổi của tảng băng trôi. Nhiều công ty đang xây dựng các mô hình ngôn ngữ lớn bằng cách sử dụng các kỹ thuật tương tự để giúp họ thực hiện tốt hơn các nhiệm vụ từ nấu ăn đến lập trình. Mong đợi nhiều cuộc thảo luận hơn về suy luận trong năm nay (chúng tôi biết, chúng tôi biết).
3. Sự phát triển bùng nổ của trí tuệ nhân tạo trong lĩnh vực khoa học
Một trong những ứng dụng thú vị nhất của trí tuệ nhân tạo là tăng tốc độ khám phá trong khoa học tự nhiên. Có lẽ minh chứng lớn nhất về tiềm năng của trí tuệ nhân tạo trong lĩnh vực này là vào tháng 10 năm ngoái, khi Viện Hàn lâm Khoa học Hoàng gia Thụy Điển trao giải Nobel Hóa học cho Demis Hassabis và John M. Jungper của Google DeepMind vì sự phát triển của họ cho công cụ AlphaFold. có thể giải quyết các vấn đề về gấp protein và David Baker vì đã phát triển các công cụ giúp thiết kế các protein mới.
Xu hướng này dự kiến sẽ tiếp tục trong năm nay với sự xuất hiện của nhiều bộ dữ liệu và mô hình dành riêng cho khám phá khoa học. Protein là mục tiêu hoàn hảo cho AI vì lĩnh vực này có các bộ dữ liệu hiện có tuyệt vời có thể được sử dụng để đào tạo các mô hình AI.
Mọi người đang tìm kiếm khám phá lớn tiếp theo. Một lĩnh vực tiềm năng là khoa học vật liệu. Công ty Meta đã phát hành các bộ dữ liệu và mô hình khổng lồ có thể giúp các nhà khoa học khám phá các vật liệu mới nhanh hơn bằng trí tuệ nhân tạo. Vào tháng 12, Hugging Face hợp tác với công ty khởi nghiệp Entalpic để ra mắt LeMaterial, một dự án nguồn mở được thiết kế nhằm đơn giản hóa và tăng tốc nghiên cứu vật liệu. Dự án đầu tiên của họ là tập dữ liệu nhằm thống nhất, làm sạch và tiêu chuẩn hóa các tập dữ liệu vật liệu quan trọng nhất.
Các nhà sản xuất mô hình trí tuệ nhân tạo cũng mong muốn sử dụng các sản phẩm sáng tạo của họ làm công cụ nghiên cứu cho các nhà khoa học. OpenAI cho phép các nhà khoa học thử nghiệm mô hình o1 mới nhất của mình để xem nó có thể làm gì cho nghiên cứu của họ. Kết quả thật đáng khích lệ.
Có một công cụ trí tuệ nhân tạo hoạt động giống như nhà khoa học là một trong những giấc mơ của thế giới công nghệ. Trong một tuyên ngôn được xuất bản vào tháng 10 năm ngoái, người sáng lập Anthropic Dario Amodei đã nhấn mạnh khoa học và sinh học nói riêng là một trong những lĩnh vực quan trọng mà trí tuệ nhân tạo mạnh mẽ có thể trợ giúp. Amodei suy đoán rằng trong tương lai, trí tuệ nhân tạo có thể không chỉ là phương pháp phân tích dữ liệu mà còn là “nhà sinh vật học ảo thực hiện mọi nhiệm vụ của một nhà sinh vật học”. Chúng ta vẫn còn một chặng đường dài mới đạt được tầm nhìn này. Nhưng năm nay, chúng ta có thể thấy một bước tiến đáng kể hướng tới mục tiêu đó.
4. Các công ty trí tuệ nhân tạo có liên quan chặt chẽ hơn đến an ninh quốc gia
Các công ty AI có thể kiếm được rất nhiều tiền nếu họ sẵn sàng sử dụng các công cụ của mình để giám sát biên giới, thu thập thông tin tình báo và các nhiệm vụ an ninh quốc gia khác.
Quân đội Hoa Kỳ đã triển khai một loạt chương trình thể hiện sự háo hức áp dụng trí tuệ nhân tạo, từ chương trình Replicator, lấy cảm hứng từ cuộc chiến ở Ukraine và hứa sẽ hoạt động ở quy mô nhỏ không người lái. phương tiện trên không trị giá 1 tỷ USD (khoảng 7,3 tỷ nhân dân tệ) đã được đầu tư vào "Đơn vị năng lực nhanh trí tuệ nhân tạo" - một đơn vị sẽ đưa trí tuệ nhân tạo vào mọi việc, từ ra quyết định trên chiến trường đến hậu cần. Quân đội châu Âu đang chịu áp lực phải tăng cường đầu tư vào công nghệ trong bối cảnh lo ngại chính quyền Donald Trump sẽ cắt giảm hỗ trợ cho Ukraine. Căng thẳng gia tăng giữa nhiều quốc gia và khu vực cũng khiến các nhà hoạch định quân sự lo lắng.
Vào năm 2025, những xu hướng này sẽ tiếp tục mang lại lợi ích cho các công ty công nghệ quốc phòng như Palantir và Anduril, những công ty hiện đang sử dụng dữ liệu quân sự mật để đào tạo các mô hình trí tuệ nhân tạo.
Nguồn vốn mạnh mẽ của ngành công nghiệp quốc phòng cũng sẽ thu hút các công ty trí tuệ nhân tạo chính thống tham gia. Vào tháng 12, OpenAI tuyên bố sẽ hợp tác với Anduril trong chương trình bắn hạ máy bay không người lái, hoàn thành sự thay đổi kéo dài một năm từ chính sách không hợp tác với quân đội. Nó cùng với Microsoft, Amazon và Google đã hợp tác với Lầu Năm Góc trong nhiều năm.
Các đối thủ cạnh tranh AI khác đang đầu tư hàng tỷ đô la để đào tạo và phát triển các mô hình mới, và vào năm 2025, họ sẽ phải đối mặt với áp lực lớn hơn trong việc coi trọng doanh thu. Có thể họ sẽ tìm được đủ khách hàng không thuộc ngành bảo vệ sẵn sàng trả nhiều tiền nhất cho các đại lý AI có thể xử lý các nhiệm vụ phức tạp hoặc các ngành sáng tạo sẵn sàng chi tiền cho các công cụ tạo hình ảnh và video.
Nhưng họ cũng sẽ ngày càng bị cám dỗ theo đuổi các hợp đồng béo bở với Lầu Năm Góc. Liệu việc tham gia vào các dự án quốc phòng có bị coi là trái với giá trị của công ty hay không sẽ là một câu hỏi khó đối với các công ty này. Công ty viết rằng lý do OpenAI thay đổi quan điểm của mình là “các nền dân chủ nên tiếp tục dẫn đầu sự phát triển của trí tuệ nhân tạo”, lập luận rằng việc cho quân đội mượn các mô hình của mình sẽ thúc đẩy mục tiêu đó. Vào năm 2025, chúng ta sẽ chứng kiến các công ty khác đi theo sự dẫn dắt của họ.
5. NVIDIA nhìn thấy sự cạnh tranh sắp tới
5. p>Đối với phần lớn cơn sốt AI hiện nay, nếu bạn là một công ty khởi nghiệp công nghệ đang cố gắng tạo ra các mô hình AI thì Jensen Huang là người bạn nên chọn. Với tư cách là Giám đốc điều hành của gã khổng lồ chip Nvidia, Huang đã giúp công ty trở thành công ty dẫn đầu không thể tranh cãi về chip có thể được sử dụng để đào tạo các mô hình trí tuệ nhân tạo và thực hiện "suy luận" khi ai đó sử dụng mô hình.
Vào năm 2025, một số thế lực có thể thay đổi điều này. Đầu tiên, các đối thủ khổng lồ như Amazon, Broadcom và AMD đã và đang đầu tư mạnh vào chip mới, và có những dấu hiệu ban đầu cho thấy những con chip này có thể cạnh tranh gay gắt với chip của Nvidia - đặc biệt là ở lĩnh vực suy luận, nơi mà sự dẫn đầu của Nvidia không vững chắc bằng.
Ngày càng có nhiều công ty khởi nghiệp tấn công Nvidia từ nhiều góc độ khác nhau. Thay vì cố gắng thực hiện những cải tiến nhỏ đối với thiết kế của Nvidia, các công ty khởi nghiệp như Groq đang đặt cược nhiều rủi ro hơn vào các kiến trúc chip hoàn toàn mới mà nếu có đủ thời gian, hứa hẹn sẽ cung cấp chương trình đào tạo hiệu quả hơn. Vào năm 2025, những thử nghiệm này vẫn đang ở giai đoạn đầu, nhưng có thể một đối thủ cạnh tranh nổi bật sẽ xuất hiện làm thay đổi giả định rằng các mô hình AI hàng đầu chỉ dựa vào chip Nvidia.
Nền tảng của sự cạnh tranh này là cuộc chiến chip địa chính trị. Cho đến nay, cuộc chiến chủ yếu dựa vào hai chiến lược. Một mặt, phương Tây đang cố gắng hạn chế xuất khẩu những con chip hàng đầu và công nghệ sản xuất của chúng sang các nước đối thủ. Mặt khác, các sáng kiến như Đạo luật Chip Hoa Kỳ nhằm mục đích thúc đẩy sản xuất chất bán dẫn trong nước tại Hoa Kỳ.
Donald Trump có thể sẽ tăng cường các biện pháp kiểm soát xuất khẩu này và hứa sẽ áp đặt mức thuế lớn đối với tất cả hàng nhập khẩu từ các nước đối thủ. Vào năm 2025, mức thuế như vậy sẽ đặt TSMC, công ty sản xuất chip của Mỹ phụ thuộc nhiều vào, vào tâm điểm của một cuộc chiến thương mại.
Không rõ những yếu tố này sẽ diễn ra như thế nào nhưng nó sẽ chỉ khuyến khích hơn nữa các nhà sản xuất chip giảm sự phụ thuộc vào TSMC, đây là toàn bộ mục đích của Đạo luật CHIP. Khi chi tiêu từ dự luật bắt đầu được lưu hành, năm nay sẽ là năm đầu tiên xem liệu nó có thúc đẩy sản xuất chip nội địa ở Hoa Kỳ hay không.