OpenAI ra mắt Sora 2 và ứng dụng xã hội cho phép người dùng đóng vai chính trong video do AI tạo ra
OpenAI đã ra mắt Sora 2, hệ thống tạo video và âm thanh tiên tiến nhất từ trước đến nay, cùng với một ứng dụng xã hội mới đưa nội dung video do AI tạo ra vào nguồn cấp dữ liệu theo phong cách TikTok.
Ứng dụng này, còn được gọi là Sora, cho phép người dùng tự đưa mình vào các cảnh do AI tạo ra bằng tính năng có tên "cameos", cung cấp cả giọng nói và hình ảnh giống nhau trong các video được chia sẻ.
Sora 2 mang lại hiệu ứng vật lý chân thực và chuyển động phức tạp cho video AI
Sora 2 đại diện cho bước tiến lớn trong công nghệ video AI hiện thực.
Không giống như các mô hình trước đây thường "biến đổi vật thể và làm biến dạng thực tế" để đáp ứng các yêu cầu trong văn bản, Sora 2 tuân thủ chặt chẽ hơn các định luật vật lý.
OpenAI đã nêu bật các ví dụ như trò chơi bóng chuyền bãi biển, trò trượt ván, bài tập thể dục dụng cụ và cú nhảy cầu bằng ván nhảy, tất cả đều thể hiện chuyển động chính xác và kết quả hợp lý.
Các mô hình video trước đây thường lạc quan quá mức — chúng sẽ biến đổi các vật thể và làm biến dạng thực tế để thực hiện thành công theo lời nhắc văn bản. Ví dụ, nếu một cầu thủ bóng rổ ném trượt, quả bóng có thể tự động dịch chuyển đến rổ. Trong Sora 2, nếu một cầu thủ bóng rổ ném trượt, bóng sẽ bật ra khỏi bảng rổ.
Mô hình có thể xử lý các hướng dẫn nhiều cảnh quay trong khi vẫn duy trì trạng thái thế giới và phong cách hình ảnh nhất quán, dù là điện ảnh, thực tế hay anime.
Nó cũng tạo ra các thành phần âm thanh như hội thoại, âm thanh nền và hiệu ứng âm thanh đồng bộ với hình ảnh.
Cameos cho phép người dùng trở thành một phần của video AI
Ứng dụng Sora giới thiệu một cách mới để tương tác với nội dung do AI tạo ra.
Thông qua "cameo", người dùng có thể tải lên một bản ghi âm và video một lần để xác minh ngoại hình và giọng nói của họ, cho phép họ xuất hiện trong bất kỳ cảnh nào được tạo ra.
Bạn bè có thể được thêm vào với quyền do người dùng quản lý, cho phép tạo video cộng tác có sự góp mặt của nhiều người.
OpenAI mô tả tính năng này là "sự tiến hóa tự nhiên trong giao tiếp - phát triển từ văn bản thành biểu tượng cảm xúc, ghi chú bằng giọng nói và video hấp dẫn".
Các video được tạo trên ứng dụng có thể được chia sẻ trong nguồn cấp dữ liệu giống như TikTok hoặc Instagram Reels.
Các đề xuất trong nguồn cấp dữ liệu bị ảnh hưởng bởi hoạt động của người dùng, vị trí, mức độ tương tác trước đây và thậm chí cả lịch sử trò chuyện ChatGPT, mặc dù dữ liệu này có thể bị tắt.
Tính năng kiểm soát của phụ huynh hạn chế việc xem và nhắn tin cho thanh thiếu niên, bao gồm hạn chế cuộn vô hạn và cài đặt cá nhân hóa theo thuật toán.
Chi tiết về quyền truy cập và sử dụng cho Sora và Sora 2
Ứng dụng Sora hiện chỉ dành cho người được mời tại Hoa Kỳ và Canada và dự kiến sẽ mở rộng phạm vi sử dụng.
Trình tạo video Sora 2 ban đầu miễn phí với giới hạn dung lượng lớn, mặc dù việc sử dụng tùy thuộc vào khả năng tính toán.
Người dùng ChatGPT Pro sẽ được tiếp cận với phiên bản Sora 2 Pro chất lượng cao hơn, trong khi Sora 1 Turbo vẫn có sẵn cho nội dung cũ.
Tất cả video được tạo, bao gồm cả bản nháp, đều có thể được chủ thể khách mời truy cập và có thể thu hồi quyền hoặc xóa nội dung bất cứ lúc nào.
Bối cảnh cạnh tranh và ngành công nghiệp cho thế hệ video AI
Sora 2 bước vào cuộc cạnh tranh với Google, Runway AI và Midjourney, tất cả đều sản xuất các đoạn video ngắn một cách nhanh chóng.
Meta gần đây đã ra mắt nguồn cấp video AI riêng của mình, Vibes, trên ứng dụng Meta AI, khuyến khích người dùng thử nghiệm với hình ảnh do AI tạo ra.
OpenAI phải đối mặt với thách thức kép là cung cấp video chân thực trong khi vẫn quản lý được tác động về mặt xã hội và môi trường của hoạt động tính toán AI quy mô lớn, đặc biệt là những lo ngại về thời lượng sử dụng màn hình, tình trạng nghiện và nội dung lừa đảo.
Liệu ứng dụng mạng xã hội và video AI có thể thay đổi cách chúng ta tạo và chia sẻ nội dung không?
Sora 2 của OpenAI và ứng dụng xã hội Sora đánh dấu nỗ lực đầy tham vọng trong việc kết hợp tính hiện thực của AI với các tính năng xã hội tương tác.
Mặc dù công nghệ này cho thấy độ trung thực và khả năng kiểm soát ấn tượng, Coinlive lưu ý rằng việc áp dụng rộng rãi vẫn gặp phải những rào cản về nhu cầu tính toán, sự an toàn của người dùng và việc sử dụng sai nội dung.
Khái niệm "khách mời" rất hấp dẫn, nhưng việc cho phép người dùng chèn hình ảnh của họ vào nội dung do AI tạo ra tiềm ẩn những rủi ro vượt xa việc lạm dụng mạng xã hội thông thường.
Sự thành công của dự án không chỉ phụ thuộc vào sự đổi mới kỹ thuật mà còn phụ thuộc vào sự tin tưởng, sự kiểm duyệt về mặt đạo đức và tính bền vững của sự tham gia, từ đó đặt ra câu hỏi liệu các nền tảng như vậy có thể định hình lại quá trình sáng tạo kỹ thuật số mà không ảnh hưởng đến sức khỏe của người dùng hay không.