Baca artikel IDN Times lainnya di IDN App
For
You

Genie 3: AI Buatan Google yang Bisa Ciptakan Dunia Virtual

berbagai dunia virtual yang diciptakan Genie 3
berbagai dunia virtual yang diciptakan Genie 3 (deepmind.google)
Intinya sih...
  • Genie 3 adalah model AI yang mengubah prompt teks menjadi lingkungan 3D interaktif dengan kualitas visual 720p dan kecepatan 24 fps.
  • Genie 3 membawa peningkatan konsistensi lingkungan, fitur "promptable world events", dan fleksibilitas dalam menciptakan variasi dunia virtual.
  • Genie 3 berfungsi sebagai platform pelatihan untuk melatih agen AI berwujud hingga robot, meskipun masih memiliki keterbatasan dalam mereplikasi lokasi dunia nyata secara akurat.
Disclaimer: This summary was created using Artificial Intelligence (AI)

Bayangkan bisa menciptakan dan menjelajahi sebuah dunia virtual hanya dengan beberapa baris teks. Fantasi tersebut kini selangkah lebih dekat menjadi kenyataan berkat inovasi terbaru dari Google DeepMind, Genie 3. Teknologi ini merupakan sebuah "world model" atau model dunia kecerdasan buatan (AI) yang dirancang untuk membangun simulasi 3D interaktif dari perintah sederhana.

Genie 3 membawa lompatan besar dibandingkan pendahulunya, terutama dalam kemampuan interaksi real-time dan konsistensi visual. Google menyebut teknologi ini sebagai fondasi penting untuk mengembangkan Kecerdasan Buatan Umum (AGI). Mari kita telusuri lebih dalam berbagai fakta menarik seputar Genie 3 dari Google ini.

1. Apa itu Genie 3?

Genie 3 adalah model AI yang dapat mengubah prompt teks menjadi lingkungan 3D yang dapat dijelajahi. Simulasi ini mampu berjalan secara lancar pada resolusi 720p dengan kecepatan 24 frame per detik (fps). Kualitas tersebut membuat interaksi di dalam dunia yang diciptakan terasa lebih hidup dan responsif.

Menurut The Verge, peningkatannya cukup signifikan jika dibandingkan dengan Genie 2, terutama pada durasi interaksi. Pengguna kini dapat menjelajahi dunia yang dihasilkan selama beberapa menit, sebuah kemajuan pesat dari batas 10-20 detik pada versi sebelumnya. Kualitas visualnya pun meningkat dari 360p menjadi 720p, menyajikan gambar yang lebih jernih.

Di balik kemampuannya, Genie 3 bekerja secara auto-regresif, yaitu membangun adegan bingkai demi bingkai untuk menciptakan video. Model ini harus terus-menerus merujuk pada informasi visual yang telah dibuat sebelumnya untuk menjaga konsistensi dunia. Metode ini secara teknis sangat menantang, namun menjadi kunci untuk menciptakan simulasi yang imersif.

2. Genie 3 membawa peningkatan konsistensi dan interaktivitas

contoh simulasi yang dihasilan Genie 3
contoh simulasi yang dihasilan Genie 3 (deepmind.google)

Salah satu terobosan utama Genie 3 adalah konsistensi lingkungannya yang jauh lebih baik. Dengan memori visual yang mampu bertahan sekitar satu menit, objek seperti lukisan di dinding akan tetap ada bahkan setelah pengguna memalingkan pandangan. Menariknya, kemampuan ini muncul secara alami, bukan hasil dari pemrograman eksplisit.

Genie 3 memperkenalkan fitur inovatif yang disebut "promptable world events". Fitur ini memungkinkan pengguna mengubah dunia yang sedang berjalan menggunakan perintah teks tambahan. Sebagai contoh, pengguna bisa meminta untuk mengubah kondisi cuaca atau memunculkan objek serta karakter baru ke dalam adegan.

Model ini juga sangat fleksibel karena mampu menghasilkan variasi dunia yang sangat beragam. Mulai dari pemandangan alam fotorealistik seperti pegunungan Alpen hingga latar sejarah seperti Athena kuno, model ini dapat mewujudkan berbagai skenario imajinatif. Kemampuan ini membuka potensi aplikasi yang luas di berbagai bidang, mulai dari hiburan, animasi, hingga edukasi.

3. Genie 3 bisa sangat berguna untuk melatih robot

contoh simulasi yang dihasilan Genie 3
contoh simulasi yang dihasilan Genie 3 (deepmind.google)

Genie 3 diklaim sebagai alat penting untuk mencapai AGI. Model ini bisa berfungsi sebagai "tempat latihan" virtual untuk melatih agen AI berwujud (embodied agent) hingga robot. Di dalam simulasi ini, agen AI dapat belajar dan bereksperimen di lingkungan yang kompleks tanpa risiko dunia nyata.

Genie 3 menyediakan kurikulum pelatihan yang hampir tak terbatas bagi para agen AI, termasuk skenario langka yang sulit direplikasi. Model ini mempelajari hukum fisika dengan mengamati dan bernalar dari dunia yang diciptakannya sendiri, bukan dari mesin fisika yang kaku. Proses ini memungkinkan agen belajar secara lebih organik dan mandiri.

Kemampuan Genie 3 sebagai platform pelatihan telah diuji coba menggunakan agen AI Google bernama SIMA. Dalam pengujian tersebut, SIMA berhasil menyelesaikan serangkaian tugas navigasi di dalam dunia yang dihasilkan Genie 3. Keberhasilan ini membuktikan bahwa lingkungan simulasinya cukup konsisten dan andal untuk melatih AI yang kompleks, dilansir Tech Crunch.

4. Keterbatasan dan masa depan Genie 3

ilustrasi DeepMind
ilustrasi DeepMind (Jernej Furman from Slovenia, CC BY 2.0 , via Wikimedia Commons)

Meskipun canggih, Google mengakui Genie 3 masih memiliki sejumlah keterbatasan. Kemampuan agen untuk berinteraksi dengan objek masih terbatas, dan menyimulasikan interaksi antar beberapa agen secara bersamaan masih menjadi tantangan. Selain itu, model ini belum mampu mereplikasi lokasi dunia nyata secara akurat atau membuat teks dengan sempurna.

Google juga berhati-hati dalam pengembangan Genie 3 karena AI semacam ini memiliki segudang risiko. Saat ini, aksesnya dibatasi hanya untuk pratinjau riset bagi sekelompok kecil akademisi dan kreator. Para penguji diharapkan dapat memberikan umpan balik dan memastikan pengembangan Genie berjalan dengan aman dan bertanggung jawab.

Kehadiran Genie 3 menandai sebuah lompatan baru bagi world model yang berpotensi memengaruhi bidang pendidikan, gaming, hingga riset AI. Sambil terus menyempurnakan teknologinya, Google berencana memperluas akses bagi lebih banyak penguji di masa depan. Melalui teknologi semacam Genie 3 dari Google ini, ke depannya AI akan berkembang lebih dari sekedar chatbot untuk membantu kita di dunia fisik.

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Debby Utomo
EditorDebby Utomo
Follow Us