Stability.ai, một công ty AI nguồn mở tiên phong được thành lập vào năm 2019, gần đây đã công bố bước đột phá mới nhất của mình – mô hình AI Khuếch tán Video Ổn định. Sự đổi mới này đánh dấu bước nhảy vọt đáng kể về khả năng AI, cho phép chuyển đổi hình ảnh tĩnh thành hình ảnh động quyến rũ. Tương tự như người tiền nhiệm của nó, mô hình hình ảnh Khuếch tán ổn định, sản phẩm mới này đã được cung cấp thông qua kho lưu trữ Github của Stability.ai để xem trước nghiên cứu.
Hoạt hình ảnh tĩnh: Khái niệm cốt lõi
Điểm mấu chốt của Khuếch tán video ổn định nằm ở khả năng tạo chuỗi hoạt ảnh dựa trên hình ảnh tĩnh được tải lên. Tận dụng nội dung của hình ảnh, mô hình AI tạo ra một video bằng cách tạo 25 khung hình, đỉnh cao là một hoạt ảnh ngắn. Hơn nữa, người dùng có thể linh hoạt tạo video 14 khung hình. Tuy nhiên, độ phân giải của hoạt ảnh thu được, tối đa là 576x1024, phụ thuộc vào kích thước hình ảnh được tải lên.
Ưu điểm và hạn chế
Stability.ai tuyên bố tính ưu việt của Khuếch tán video ổn định so với các mô hình AI đối thủ, trích dẫn một nghiên cứu đi kèm với việc phát hành nó. Tuy nhiên, điều cần thiết là phải thừa nhận rằng nghiên cứu này thiếu sự đánh giá ngang hàng, do đó đặt ra câu hỏi về tính khách quan. Đáng chú ý, sự so sánh liên quan đến mô hình GEN-2 của Runway và Pika Labs' chào bán.
Tuy nhiên, những hạn chế vẫn tồn tại. Thời lượng của video được tạo từ hình ảnh tĩnh được giới hạn trong khoảng 4 giây. Mặc dù phù hợp để lặp lại nội dung nhưng nó lại không phù hợp với các tác phẩm hoạt hình gốc. Hơn nữa, đôi khi không tạo được hình ảnh động và các trường hợp chuyển động chậm hoặc không tự nhiên là một trong những hạn chế của mô hình.
Những thách thức mà mô hình phải đối mặt
Giống như nhiều đối tác AI, Khuếch tán video ổn định gặp phải những thách thức nhất định. Đáng chú ý, văn bản trong hình ảnh có thể mất khả năng đọc khi dịch sang định dạng video, trong khi các thành phần trên khuôn mặt có thể bị biến dạng. Hiện chỉ nhằm mục đích nghiên cứu, quyền truy cập vào mô hình có sẵn thông qua kho lưu trữ GitHub của Stability.ai, mặc dù yêu cầu phải có kinh nghiệm trước đó về tải xuống và thực thi mã.
Một cái nhìn thoáng qua về tương lai
Việc Stability.ai ra mắt tính năng Khuếch tán video ổn định góp phần vào sự phát triển nhanh chóng của công nghệ AI. Đồng thời, Pika Labs gần đây đã giới thiệu Pika 1.0, một công cụ tạo AI chuyển văn bản thành video, củng cố những tiến bộ đang tăng tốc trong việc tạo video và hình ảnh thông qua những nỗ lực nghiên cứu đang diễn ra.