JAKARTA – Pemimpin kecerdasan buatan OpenAI memperkenalkan model AI baru bernama Sora yang diklaim dapat membuat video berdurasi 60 detik yang “realistis” dan “imajinatif” dari perintah teks cepat.
Diberitakan CNN, dalam sebuah unggahan blog pada Rabu (14/2), perusahaan tersebut mengatakan Sora mampu menghasilkan video berdurasi hingga 60 detik dari instruksi teks.
Hal itu dilengkapi dengan kemampuan menyajikan adegan dengan banyak karakter, jenis gerakan tertentu, dan detail latar belakang yang mendetail.
“Model tersebut memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada di dunia fisik,” kata unggahan blog tersebut.
OpenAI mengatakan pihaknya bermaksud untuk melatih model AI sehingga dapat “membantu orang memecahkan masalah yang memerlukan interaksi di dunia nyata”.
Ini adalah upaya terbaru dari perusahaan di balik chatbot ChatGPT yang viral, yang terus mendorong kemajuan AI generatif.
Meskipun “model multi-modal” bukanlah hal baru dan model text-to-video sudah ada, yang membedakannya adalah panjang dan akurasi yang diklaim OpenAI dimiliki Sora, menurut Reece Hayden, analis senior di firma riset pasar ABI Research.
Hayden mengatakan model AI semacam ini dapat berdampak besar pada pasar hiburan digital dengan konten baru yang dipersonalisasi yang dialirkan ke seluruh saluran.
“Salah satu kasus penggunaan yang jelas ada di TV; membuat adegan pendek untuk mendukung narasi,” kata Hayden. “Modelnya masih terbatas, tapi menunjukkan arah pasar.”
Pada saat yang sama, OpenAI mengatakan Sora masih dalam proses dengan “kelemahan” yang jelas, terutama dalam hal detail spasial dari sebuah prompt – pencampuran kiri dan kanan – serta sebab dan akibat.
Mereka memberikan contoh pembuatan video seseorang yang sedang menggigit kue tetapi tidak ada bekas gigitan setelahnya.
Untuk saat ini, pesan OpenAI tetap fokus pada keselamatan. Perusahaan tersebut mengatakan pihaknya berencana untuk bekerja dengan tim ahli untuk menguji model terbaru dan mencermati berbagai bidang termasuk misinformasi, konten kebencian, dan bias.
Perusahaan mengatakan mereka juga sedang membangun alat untuk membantu mendeteksi informasi yang menyesatkan.
Sora pertama-tama akan tersedia bagi para profesor keamanan siber, yang disebut “petugas tim merah”, yang dapat menilai bahaya atau risiko suatu produk.
Hal ini juga memberikan akses kepada sejumlah seniman visual, desainer, dan pembuat film untuk mengumpulkan masukan tentang bagaimana para profesional kreatif dapat menggunakannya.
Pembaruan terbaru ini hadir seiring OpenAI terus memajukan ChatGPT.
Awal pekan ini, perusahaan mengatakan sedang menguji fitur di mana pengguna dapat mengontrol memori ChatGPT, memungkinkan mereka meminta platform untuk mengingat obrolan untuk membuat percakapan di masa depan lebih personal atau menyuruhnya melupakan apa yang telah dibahas sebelumnya.