Google Rilis Project Genie, AI Ajaib Pembuat Dunia Virtual

Project Genie adalah eksperimen AI yang memungkinkan pengguna menciptakan dunia virtual interaktif dengan teks atau gambar.
Teknologi world model Genie 3 memprediksi interaksi fisik dalam lingkungan, pengguna bisa membuat dan mengedit dunia imajinatif.
Akses terbatas bagi pelanggan layanan premium Google AI Ultra di AS, teknologi ini menuju Artificial General Intelligence (AGI) dan masa depan robotika.
Google DeepMind meluncurkan inovasi menarik di ranah kecerdasan buatan (AI) dengan merilis Project Genie, sebuah eksperimen yang memungkinkan pengguna menyulap imajinasi menjadi dunia virtual interaktif. Proyek ini bukan sekadar pembuat video biasa, melainkan sebuah purwarupa penelitian yang dirancang untuk memungkinkan pengguna masuk dan bermain di dalam dunia yang mereka deskripsikan lewat teks atau gambar. Mulai Kamis (29/1/2026), Google membuka pintu akses bagi pelanggan layanan premium Google AI Ultra yang berdomisili di Amerika Serikat (AS) untuk menjadi yang pertama menjajal teknologi futuristik ini.
Proyek ini hadir sebagai langkah besar dalam evolusi Generative AI, di mana AI tidak hanya menciptakan gambar statis tetapi memprediksi interaksi fisik dalam sebuah lingkungan. Pengguna dapat mengontrol karakter untuk melompat, berlari, atau terbang di dalam dunia yang dibuat secara real-time oleh kecerdasan buatan. Berikut penjelasan mengenai teknologi di balik Project Genie, cara akses dan menggunakannya, hingga berbagai batasan yang masih dimiliki.
1. Mengenal teknologi world model di balik Project Genie

Project Genie beroperasi menggunakan otak cerdas bernama Genie 3, sebuah model dasar yang dikembangkan khusus oleh Google DeepMind untuk memahami dinamika dunia fisik. Berbeda dengan AI generatif video biasa, Genie 3 adalah sebuah world model yang dilatih untuk memprediksi bagaimana sebuah lingkungan berubah sebagai respons terhadap tindakan pengguna. Google juga memadukan kecerdasan Genie 3 dengan model gambar Nano Banana Pro serta kemampuan penalaran Gemini untuk menghasilkan visual yang kaya dan detail. Kombinasi ketiga teknologi ini menciptakan simulasi lingkungan yang hidup dan interaktif, bukan sekadar rekaman video.
Secara teknis, Genie 3 bekerja dengan metode auto-regressive, yang berarti ia menciptakan dunia tersebut frame demi frame secara langsung saat kamu memainkannya. Kualitas visual yang disajikan pada resolusi 720p, yang cukup tajam untuk ukuran sebuah eksperimen AI generasi awal. Pengguna dapat menikmati pengalaman menjelajah dunia virtual dengan kecepatan frame mencapai 20 hingga 24 fps (frame per second), memberikan pengalaman gerakan yang cukup mulus.
Salah satu keunggulan utama teknologi ini adalah konsistensi memori yang dimilikinya. Tantangan besar dalam pembuatan video AI biasanya adalah objek yang berubah bentuk atau menghilang seiring berjalannya waktu. Namun, Genie 3 memiliki kemampuan mengingat detail lingkungan yang sudah dilewati hingga satu menit sebelumnya. Artinya, jika karakter pemain berjalan menjauh dari sebuah pohon dan kembali lagi ke sana, pohon tersebut akan tetap ada di tempat yang sama dan tidak berubah menjadi objek lain.
Meskipun demikian, teknologi ini tetap memiliki karakteristik unik yang membedakannya dari game engine tradisional. Karena dunia dibuat oleh prediksi AI, terkadang hukum fisika yang berlaku terasa janggal, di mana karakter bisa saja menembus dinding padat. DeepMind sendiri mengakui bahwa simulasi ini belum sepenuhnya akurat merepresentasikan lingkungan dunia nyata. Namun, teknologi ini dianggap sebagai fondasi penting bagi AI untuk belajar memahami konsep ruang dan waktu dalam format digital.
2. Pengguna bisa membuat hingga mengedit dunia imajinatif

Fitur utama yang menjadi daya tarik Project Genie adalah World Sketching, sebuah alat yang mengizinkan pengguna menciptakan dunia dari nol menggunakan deskripsi teks sederhana atau prompt. Pengguna bisa menuliskan ide seperti "kastil yang terbuat dari marshmallow dengan sungai cokelat" dan sistem akan menerjemahkannya menjadi konten visual. Selain teks, kamu juga bisa mengunggah sketsa tangan atau foto asli sebagai fondasi awal lingkungan virtual yang ingin dibangun. Model Nano Banana Pro kemudian bertugas memvisualisasikan instruksi tersebut menjadi pratinjau gambar sebelum dunia itu benar-benar "dihidupkan" untuk dimainkan,.
Setelah dunia terbentuk, pemain memiliki kebebasan untuk menentukan jenis karakter utamanya. Pilihan karakter sangat beragam, mulai dari manusia, hewan, hingga benda mati seperti boneka, bola, atau mobil mainan. Navigasi di dalam dunia virtual ini menggunakan tombol keyboard standar WASD untuk bergerak ke berbagai arah dan tombol spasi untuk melompat atau naik ke tempat yang lebih tinggi. Sudut pandang kamera pun dapat diatur sesuka hati, baik itu perspektif orang pertama maupun orang ketiga agar sesuai dengan gaya bermain pengguna.
Kreativitas pengguna tidak berhenti pada tahap pembuatan awal berkat adanya fitur Remix Worlds. Fitur sosial ini memungkinkan pengguna untuk memodifikasi dunia yang sudah ada atau milik orang lain dengan menambahkan elemen baru atau mengubah gaya visualnya. Jika sedang kehabisan ide, pengguna bisa mencari inspirasi di galeri kurasi yang disediakan oleh Google atau menggunakan tombol pengacak (randomizer).
Namun, pengalaman bermain di Project Genie tentu belum bisa disamakan dengan video game komersial buatan Nintendo atau Sony. Menurut The Verge, tidak ada misi, skor, atau tujuan khusus dalam dunia ini selain berjalan-jalan dan melihat pemandangan. Interaksi fisik dalam dunia tersebut kadang memukau, seperti bola yang meninggalkan jejak cat di lantai, tetapi terkadang juga gagal muncul secara konsisten.
3. Keterbatasan akses, biaya, dan teknis

Saat ini, Google memberlakukan akses yang sangat eksklusif untuk Project Genie. Eksperimen ini hanya tersedia bagi pengguna yang berlangganan paket Google AI Ultra seharga 250 dolar Amerika Serikat (AS) (sekitar Rp4,1 juta) per bulan dan berdomisili di AS. Selain itu, pengguna wajib berusia di atas 18 tahun untuk bisa menjajal eksperimen ini. Belum ada informasi pasti kapan fitur ini akan tersedia untuk pengguna paket langganan atau wilayah lain seperti Indonesia.
Genie juga masih memiliki beberapa batasan teknis. Misalnya, durasi permainan yang sangat singkat, yakni hanya 60 detik untuk setiap dunia yang dihasilkan. Pembatasan waktu ini diterapkan karena besarnya daya komputasi yang dibutuhkan oleh Genie 3. Pihak DeepMind menjelaskan bahwa setiap sesi permainan membutuhkan satu chip khusus yang didedikasikan hanya untuk satu pengguna, sehingga biayanya sangat mahal. Membatasi durasi adalah cara Google agar teknologi ini bisa diakses oleh lebih banyak orang.
Dari sisi performa, para penguji awal melaporkan adanya masalah input lag atau jeda respons tombol yang cukup mengganggu kenyamanan bermain. Karakter kadang terasa lambat merespons perintah atau bergerak tidak sesuai arah yang diinginkan, membuat navigasi menjadi sulit dilakukan. Selain itu, karena dunia dibuat secara real-time oleh AI, halusinasi visual masih kerap terjadi, seperti objek yang berubah bentuk tiba-tiba atau detail tekstur yang hilang saat karakter bergerak cepat.
Google juga menerapkan kebijakan yang sangat ketat terkait hak cipta untuk mencegah masalah hukum. Pengguna tidak bisa membuat dunia berdasarkan karakter atau properti intelektual populer milik perusahaan lain seperti Disney, Nintendo, atau karakter game terkenal lainnya. Sistem akan secara otomatis memblokir prompt yang mengarah pada karakter bermerek dagang, bahkan jika prompt tersebut hanya mendeskripsikan ciri-ciri fisik karakter tanpa menyebut nama aslinya.
4. Menuju AGI dan masa depan robotika

DeepMind menyatakan, Project Genie bukan sekadar mainan untuk hiburan semata, melainkan batu loncatan strategis menuju Artificial General Intelligence (AGI). Sistem AGI masa depan dinilai membutuhkan pemahaman mendalam tentang cara kerja dunia fisik, hukum sebab-akibat, dan penalaran spasial agar bisa berpikir layaknya manusia. Dengan melatih AI untuk memprediksi konsekuensi visual dari setiap tindakan dalam simulasi, para ilmuwan sedang mengajarkan mesin bagaimana berinteraksi dengan realitas.
Teknologi simulasi lingkungan semacam ini memiliki potensi besar untuk melatih agen robot otonom di masa depan. Robot dapat belajar melakukan tugas kompleks dalam simulasi aman yang dibuat oleh Genie sebelum terjun langsung ke dunia nyata yang penuh risiko. Google bahkan telah menguji coba agen AI lain bernama SIMA (Scalable Instructable Multiworld Agent) untuk menyelesaikan berbagai misi di dalam dunia virtual buatan Genie 3, membuktikan bahwa dunia ini bisa menjadi tempat latihan bagi AI lain.
Selain robotika, penerapan teknologi world model bisa meluas ke sektor pendidikan interaktif dan pelatihan profesional. Misalnya, di masa depan, pelajar mungkin akan bisa menjelajahi reka ulang kota Roma kuno atau era dinosaurus secara hanya dengan mengetikkan perintah teks. Simulasi skenario berbahaya, seperti pelatihan pemadam kebakaran atau pengemudi kendaraan otonom, juga bisa dilakukan di dalam dunia virtual ini untuk meminimalkan risiko fisik.
Project Genie membuka gerbang baru bagi kolaborasi antara imajinasi manusia dan kemampuan generatif mesin yang belum pernah ada sebelumnya. Meski saat ini masih berstatus purwarupa dengan banyak keterbatasan, teknologi ini memberikan gambaran masa depan di mana pembuatan game dan simulasi 3D tidak lagi memerlukan kemampuan teknis yang rumit. Teknologi seperti Project Genie diharapkan dapat mempercepat inovasi di berbagai bidang sains lain.



















