Nguồn: Quantum
Khi nói đến sự đóng góp của trí tuệ nhân tạo cho khoa học, bạn có thể nghĩ ngay đến AlphaFold, đây là protein của Google DeepMind chương trình gấp, mà người sáng tạo ra nó đã đoạt giải Nobel năm ngoái.
Giờ đây, OpenAI cho biết họ cũng đang tiến vào lĩnh vực khoa học—bằng cách xây dựng một mô hình về kỹ thuật protein.
Công ty cho biết họ đã phát triển một mô hình ngôn ngữ có thể hình thành các protein có khả năng biến đổi tế bào bình thường thành tế bào gốc—và nó đã dễ dàng đánh bại con người.
Nghiên cứu này là mô hình đầu tiên của OpenAI tập trung vào dữ liệu sinh học và là lần đầu tiên công ty công khai tuyên bố rằng mô hình của mình có thể mang lại những kết quả khoa học bất ngờ. Như vậy, đây là một bước để xác định liệu AI có thể tạo ra những khám phá thực sự hay không, điều mà một số người coi là một thử nghiệm lớn đối với “trí thông minh nhân tạo nói chung”.
Tuần trước, Giám đốc điều hành OpenAI Sam Altman cho biết ông “tin tưởng” rằng công ty của ông biết cách xây dựng trí tuệ nhân tạo nói chung, đồng thời nói thêm rằng “các công cụ siêu thông minh có thể tăng tốc đáng kể việc khám phá khoa học và Sự đổi mới vượt xa những gì con người chúng ta có thể làm được tự mình làm.”
Dự án kỹ thuật protein bắt đầu cách đây một năm, khi công ty nghiên cứu tuổi thọ Retro Biosciences có trụ sở tại San Francisco tiếp cận OpenAI về sự hợp tác.
Sự hợp tác này không phải ngẫu nhiên. Theo báo cáo, Giám đốc điều hành OpenAI Sam Altman đã đích thân tài trợ 180 triệu USD (khoảng 1,318 tỷ nhân dân tệ) cho Retro.

(Nguồn: OpenAI)
Mục tiêu của Retro là kéo dài tuổi thọ bình thường của con người thêm 10 năm. Để làm được điều này, công ty đã nghiên cứu cái gọi là yếu tố Yamanaka, hay tế bào gốc đa năng cảm ứng. Đây là một nhóm protein mà khi được thêm vào tế bào da người sẽ biến chúng thành tế bào gốc trông trẻ hơn, loại tế bào có thể tạo ra bất kỳ mô nào khác trong cơ thể.
Các nhà nghiên cứu tại Retro và các công ty được tài trợ tốt như Altos Labs coi hiện tượng này là điểm khởi đầu khả thi để trẻ hóa động vật, tạo ra nội tạng người hoặc cung cấp tế bào thay thế.
Nhưng kiểu "tái lập trình" tế bào này không hiệu quả lắm. Phải mất vài tuần và chưa đến 1% tế bào được xử lý trong đĩa thí nghiệm hoàn thành hành trình tái tạo.
Mô hình mới của OpenAI, được gọi là GPT-4b micro, có thể được đào tạo để đề xuất các cách thiết kế lại các yếu tố protein nhằm nâng cao chức năng của chúng. Theo OpenAI, các nhà nghiên cứu đã sử dụng các đề xuất của mô hình để cải thiện hiệu quả của hai yếu tố Yamanaka hơn 50 lần – ít nhất là theo một số phép đo sơ bộ.
"Nhìn chung, những protein này có vẻ tốt hơn những gì các nhà khoa học có thể tự tạo ra", nhà nghiên cứu John Holman của OpenAI cho biết.
Holman là nhà phát triển chính của mô hình này, cùng với Aaron Jack của OpenAI và Rico Meni của Retro.
Các nhà khoa học bên ngoài không thể biết liệu kết quả có đúng hay không cho đến khi chúng được công bố, điều mà hai công ty cho biết họ dự định thực hiện. Mô hình này vẫn chưa được phổ biến rộng rãi hơn - đây vẫn là bản demo tùy chỉnh chứ không phải là bản giới thiệu sản phẩm chính thức.
“Dự án này nhằm chứng tỏ rằng chúng tôi nghiêm túc trong việc đóng góp cho khoa học,” Jack nói. "Nhưng liệu những khả năng này sẽ được cung cấp dưới dạng các mô hình riêng biệt hay được tích hợp vào các mô hình suy luận chính của chúng tôi - điều đó vẫn chưa được xác định."
Mô hình này hoạt động khác với AlphaFold của Google, mô hình có thể dự đoán hình dạng protein. OpenAI cho biết vì các yếu tố Yamanaka là các protein mềm và không có cấu trúc khác thường nên chúng yêu cầu một cách tiếp cận khác mà các mô hình ngôn ngữ lớn của nó rất phù hợp.
Mô hình này được đào tạo về các mẫu trình tự protein từ nhiều loài, cũng như thông tin về các protein có xu hướng tương tác với nhau. Mặc dù dữ liệu lớn nhưng nó chỉ là một phần dữ liệu đào tạo cho chatbot hàng đầu của OpenAI, vì vậy GPT-4b là một ví dụ về "mô hình ngôn ngữ nhỏ" sử dụng tập dữ liệu tập trung.
Sau khi các nhà khoa học của Retro có được mô hình này, họ đã cố gắng hướng nó tới việc thiết kế lại protein của Yamanaka. Chiến lược nhắc nhở được sử dụng tương tự như cách tiếp cận "vài mẫu", trong đó người dùng đặt câu hỏi cho chatbot bằng cách cung cấp một loạt ví dụ kèm theo câu trả lời, sau đó cung cấp ví dụ để bot phản hồi.
Mặc dù các kỹ sư di truyền có đủ phương tiện để điều khiển quá trình tiến hóa phân tử trong phòng thí nghiệm nhưng họ thường chỉ có thể thử nghiệm một số khả năng hạn chế. Hơn nữa, ngay cả những protein có chiều dài trung bình cũng có thể được biến đổi theo những cách gần như vô tận (vì chúng được tạo thành từ hàng trăm axit amin, mỗi loại có 20 biến thể có thể có).
Tuy nhiên, các mô hình của OpenAI thường đề xuất thay đổi 1/3 số axit amin trong protein.
“Chúng tôi ngay lập tức đưa mô hình này vào phòng thí nghiệm và thu được kết quả thực tế,” Giám đốc điều hành Retro Joe Bates-Lacroix cho biết. Anh ấy cũng nói rằng ý tưởng của mô hình này rất hay và đã được cải thiện so với yếu tố Yamanaka Shinya ban đầu trong một số trường hợp.
Chúng ta cần những cách tốt hơn để tạo ra tế bào gốc, Vadim Gradyshev, chuyên gia về lão hóa tại Đại học Harvard và là nhà tư vấn cho Retro, cho biết. Ông nói: “Đối với chúng tôi, điều này sẽ rất hữu ích. [Tế bào da] dễ dàng được lập trình lại, nhưng các tế bào khác thì không”. "Và việc lập trình lại ở một loài mới - nó thường rất khác và bạn không nhận được gì." Làm thế nào GPT-4b đạt được dự đoán của nó, vẫn chưa rõ ràng – như trường hợp thường thấy với các mô hình AI. Bates-Lacroix nói: “Giống như AlphaGo đánh bại người chơi cờ vây giỏi nhất, nhưng phải mất một thời gian dài để tìm ra lý do”. "Chúng tôi vẫn đang cố gắng tìm hiểu xem nó có tác dụng gì và chúng tôi nghĩ cách chúng tôi áp dụng nó chỉ mới ở bề mặt."

Giám đốc điều hành OpenAI Sam Altman (Nguồn: TechCrunch, CC BY 2.0 , thông qua Wikimedia Commons)
OpenAI tuyên bố rằng không có giao dịch tiền tệ nào được tham gia vào sự hợp tác này. Nhưng vì nghiên cứu này có thể mang lại lợi ích cho Retro, công ty có nhà đầu tư lớn nhất là Altman, nên tin tức này có thể đặt ra nhiều câu hỏi hơn về công việc bận rộn bên cạnh CEO OpenAI.
Năm ngoái, Wall Street Journal cho biết các khoản đầu tư sâu rộng của Altman vào các công ty khởi nghiệp công nghệ tư nhân đã trở thành một "đế chế đầu tư không rõ ràng" và đang "tạo ra ngày càng nhiều xung đột tiềm tàng" vì một số công ty trong số này cũng kinh doanh với OpenAI.
Đối với Retro, chỉ cần liên kết với Ultraman, OpenAI và cuộc thi AGI có thể nâng cao vị thế của họ cũng như nâng cao khả năng thuê nhân viên và gây quỹ. Bates-Lacroix đã không trả lời các câu hỏi về việc liệu công ty ở giai đoạn đầu có đang trong giai đoạn cấp vốn hay không.
OpenAI cho biết Altman không trực tiếp tham gia vào công việc này và công ty chưa bao giờ đưa ra quyết định dựa trên các khoản đầu tư khác của Altman.