Stability.ai, sebuah perusahaan perintis AI sumber terbuka yang didirikan pada tahun 2019, baru-baru ini mengumumkan terobosan terbarunya - model Stable Video Diffusion AI. Inovasi ini menandai lompatan yang signifikan dalam kemampuan AI, memungkinkan transformasi gambar diam menjadi animasi yang menawan. Mirip dengan pendahulunya, model gambar Stable Diffusion, penawaran baru ini telah tersedia melalui repositori Github Stability.ai untuk pratinjau penelitian.
Animasi Gambar Diam: Konsep Inti
Inti dari Stable Video Diffusion terletak pada kemampuannya untuk menghasilkan urutan animasi berdasarkan gambar diam yang diunggah. Dengan memanfaatkan konten gambar, model AI membuat video dengan membuat 25 frame, yang berujung pada animasi singkat. Selain itu, pengguna memiliki fleksibilitas untuk menghasilkan video 14 frame. Namun, resolusi animasi yang dihasilkan, maksimal 576x1024, bergantung pada ukuran gambar yang diunggah.
Keuntungan dan Keterbatasan
Stability.ai mengklaim keunggulan Stable Video Diffusion dibandingkan model AI lainnya, dengan mengutip sebuah studi yang menyertai perilisannya. Namun, penting untuk diketahui bahwa studi ini tidak memiliki tinjauan sejawat, sehingga menimbulkan pertanyaan tentang ketidakberpihakan. Khususnya, perbandingan tersebut melibatkan model GEN-2 Runway dan penawaran Pika Labs.
Namun demikian, tetap saja ada batasannya. Durasi video yang dihasilkan dari gambar diam dibatasi hingga kira-kira 4 detik. Meskipun cocok untuk konten perulangan, namun tidak cocok untuk kreasi animasi orisinal. Selain itu, kegagalan sesekali untuk menghasilkan animasi dan contoh gerakan yang lamban atau tidak alami adalah salah satu kelemahan model ini.
Tantangan yang Dihadapi oleh Model
Seperti kebanyakan AI lainnya, Stable Video Diffusion bergulat dengan beberapa tantangan. Khususnya, teks dalam gambar dapat kehilangan keterbacaan saat diterjemahkan ke dalam format video, sementara elemen wajah dapat mengalami distorsi. Saat ini hanya ditujukan untuk tujuan penelitian, akses ke model ini tersedia melalui repositori GitHub Stability.ai, meskipun membutuhkan pengalaman sebelumnya dalam mengunduh dan mengeksekusi kode.
Sekilas tentang Masa Depan
Peluncuran Stability.ai & # 39; Stable Video Diffusion berkontribusi pada evolusi teknologi AI yang cepat. Bersamaan dengan itu, Pika Labs baru-baru ini memperkenalkan Pika 1.0, generator AI teks-ke-video, yang memperkuat percepatan kemajuan dalam pembuatan video dan gambar melalui upaya penelitian yang sedang berlangsung.