7 Kehebatan Sora, AI Video Generator Terbaru dari OpenAI

OpenAI, perusahaan di balik ChatGPT, baru-baru ini memperkenalkan Sora, model generatif berbasis kecerdasan buatan (AI) terbaru mereka yang fokus pada pembuatan video. Sora merupakan model AI yang mampu membuat video kompleks hanya dari teks prompt. Saat ini, Sora masih dalam tahap uji coba dan belum dirilis ke publik.
Bersamaan dengan pengumuman ini, OpenAI juga merilis laporan teknis dari Sora. Dalam laporan teknis tersebut, Sora diklaim memiliki berbagai kemampuan yang terbilang mindblowing. Beberapa di antaranya, seperti video to video editing, image to video, dan simulasi digital.
1. Menghasilkan video dengan berbagai durasi, resolusi dan aspek rasio

Melansir situs OpenAI, Sora disebut mampu membuat video dengan berbagai durasi, resolusi, dan aspek rasio. Dalam demonstrasinya, Sora mampu menghasilkan video dengan durasi hingga 1 menit. Model ini juga mampu menghasilkan video horizontal 1920x1080p, vertikal 1080x1920p, dan beragam ukuran lain yang berada di antara rentang tersebut.
2. Pemahaman prompt yang baik
Sora mampu memahami keinginan pengguna dengan sangat baik berkat pemahamannya akan bahasa natural. Sama seperti Dall-E 3, Sora juga menggunakan model GPT untuk mengubah prompt dari pengguna menjadi lebih panjang dan detail. Prompt yang disempurnakan tersebut kemudian dikirim ke model video sehingga menghasilkan video yang lebih akurat seperti apa yang diharapkan pengguna.
3. Image to Video

Sora juga dibekali kemampuan konversi image to video. Artinya, model ini mampu menerima input berupa gambar dan mengubahnya menjadi video. Dalam demonstrasinya, Sora diperlihatkan mampu mengubah berbagai gambar dari Dall-E menjadi video yang lebih hidup.
4. Video to video editing

Tidak hanya itu, Sora juga memiliki kemampuan video to video editing, lho! Lewat kemampuan ini, Sora bisa mengedit video yang telah ada sesuai keinginan pengguna. Misalnya, pengguna dapat menginput video mobil yang sedang melaju dan meminta Sora untuk mengganti lingkungan di sekitar mobil tersebut. Sora juga bahkan mampu memperpanjang durasi video yang sudah ada.
5. Sora mampu menggabungkan dua video

Kemampuan Sora untuk menggabungkan dua video menjadi salah satu fitur paling inovatif. Transisi antara dua video yang digabungkan juga terlihat sangat mulus. Fitur ini memanfaatkan teknik interpolasi bertahap di mana elemen dari kedua video input disatukan untuk menciptakan output yang koheren dengan visual yang menarik.
6. Image generation

Hal menarik lainnya, Sora juga ternyata mempunyai kemampuan image generation. Gambar yang dihasilkan Sora juga terlihat jauh lebih realistis dari hasil Dall-E 3. Menurut OpenAI, Sora mampu menghasilkan gambar dalam berbagai ukuran hingga 2048x2048.
7. Simulasi dunia nyata dan digital

Sora diklaim mampu mensimulasikan berbagai objek dan lingkungan dunia nyata dengan baik. Hal ini yang mungkin membuat hasil generate dari Sora terlihat sangat realistis. Misalnya, ketika membuat video seseorang sedang memakan kue, Sora akan memerhatikan detail kecil seperti bekas gigitan pada kue.
Selain dunia nyata, Sora juga mampu mensimulasikan dunia digital. Dalam demonstrasinya, Sora mampu membuat video gameplay Minecraft dengan sangat baik. Meski begitu, OpenAI masih belum memberi informasi apa pun terkait kapan waktu perilisan Sora. Saat ini, OpenAI masih melakukan uji coba keamanan agar Sora tidak dipakai untuk membuat konten berbahaya. Menurut kamu, apakah perkembangan kecerdasan buatan semacam ini akan membawa dampak positif atau malah negatif bagi peradaban manusia?