Baca artikel IDN Times lainnya di IDN App
For
You

Daftar Inovasi AI di Google I/O 2025, Gemini hingga Veo 3

CEO Google Sundar Pichai di Google I/O 2025. (youtube.com/Google)
CEO Google Sundar Pichai di Google I/O 2025. (youtube.com/Google)
Intinya sih...
  • Google I/O 2025 mengumumkan AI Mode untuk pengguna Amerika Serikat, memungkinkan pertanyaan kompleks dan Project Mariner untuk memesan tiket.
  • Deep Search dan Search Live dijadwalkan rilis musim panas 2025, Gemini 2.5 Pro dilengkapi model Deep Think, LearnLM, dan Gemini Diffusion.
  • Veo 3 viral dengan video super realistis, Imagen 4 dan Flow untuk kreator, Lyria 2 di YouTube Shorts, dan Project Astra sebagai asisten AI universal.

Google I/O 2025 telah selesai diselenggarakan pada Rabu (21/5/2025). Raksasa teknologi satu ini mengumumkan kurang lebih 100 hal baru dalam ajang tahun ini. Seperti tahun sebelumnya, Google tampak semakin serius menggenjot segmen inovasi kecerdasan buatan atau artificial intelligence (AI).

AI, AI dan AI, kata ini disebutkan hingga 92 kali dalam keynote tahun ini. Mulai dari update Gemini, rilis Veo 3 yang viral hingga berbagai teknologi agen. Berikut daftar inovasi AI di Google I/O 2025 yang paling mencuri perhatian. 

1. Pencarian Google kehadiran serangkaian fitur AI

tampilan AI Mode. (dok. Google)

Google mengumumkan peluncuran AI Mode untuk semua pengguna di Amerika Serikat. Fitur ini memungkinkan pengguna mengajukan pertanyaan kompleks dan mendapat jawaban komprehensif dengan interaksi yang lebih natural. AI Mode di Labs juga kehadiran sebagai kemampuan dari Project Mariner untuk tugas seperti memesan tiket, restoran dan lain-lain. 

Google juga memperkenalkan Deep Search yang dirancang untuk melakukan riset mendalam dengan menganalisis topik rumit dan menyajikan ringkasan terstruktur. Sementara itu, Search Live dijadwalkan rilis musim panas 2025 dengan kemampuan menjawab pertanyaan visual melalui kamera ponsel secara real-time.

2. Gemini 2.5 Pro semakin cerdas dengan Deep Think

ilustrasi Gemini. (unsplash.com/Solen Feyissa)

Google mengklaim Gemini 2.5 Pro sebagai model AI terbaik di berbagai tolok ukur. Model ini meraih peforma apik dalam tes coding, matematika, dan pengetahuan umum. Tidak berhenti di situ, Gemini 2.5 Pro kini dilengkapi dengan model Deep Think untuk meningkatkan kemampuan penalarannya dalam mengerjakan tugas yang lebih rumit. Google juga mengintegrasi LearnLM untuk meningkatkan kemampuan model ini dalam tugas terkait belajar dan mengajar. 

Google juga memperkenalkan model baru Gemini Diffusion yang masih dalam tahap penelitian. Model ini memiliki metode yang unik dengan menciptakan teks dari noise, seperti model image dan video generator

3. Veo 3 dan Imagen 4 untuk hasilkan konten visual super realistis

cuplikan video yang dihasilkan Veo 3. (dok. Google DeepMind)

Salah satu inovasi yang paling viral dari Google I/O adalah Veo 3. Model generator video terbaru Google ini mampu menghasilkan adegan yang kompleks, realistis dan cukup konsisten. Menariknya, Veo 3 mampu menghasilkan audio secara native, artinya langsung terintegrasi dengan video. Tidak heran, media sosial langsung dibanjiri dengan berbagai video buatan Veo 3 yang mindblowing.

Selain Veo 3, Google juga merilis Imagen 4 dan Flow untuk kebutuhan para kreator. Imagen 4 adalah model generator gambar terbaru yang memiliki kemampuan artistik memukau. Sementara, Flow adalah platform pembuatan film yang dilengkapi berbagai fitur dan kontrol sinematik. 

4. Bukan hanya visual, AI Google juga bisa hasilkan audio realistis

kemampuan audio Gemini 2.5. (youtube.com/Google)
kemampuan audio Gemini 2.5. (youtube.com/Google)

Lyria 2 dapat membuat komposisi musik kompleks dari penyanyi tunggal hingga paduan suara lengkap dengan kualitas studio rekaman. Model ini kini tersedia melalui YouTube Shorts untuk kreator dan Vertex AI.

Sementara itu, Lyria RealTime kini tersedia melalui Gemini API di Google AI Studio dan Vertex AI untuk pengembang musik. Model ini memungkinkan pembuatan musik secara langsung di mana pengguna dapat mengubah dan mengontrol musik sambil mendengarkannya. 

Text-to-speech di Gemini 2.5 kini mendukung beberapa pembicara sekaligus dengan suara yang natural dan dapat menangkap nuansa halus seperti bisikan. Sementara, Google Meet mendapat fitur terjemahan real-time untuk bahasa Spanyol-Inggris.

5. Update perkembangan Project Astra

demonstrasi kemampuan Project Astra. (youtube.com/Google)
demonstrasi kemampuan Project Astra. (youtube.com/Google)

Google memamerkan perkembangan Project Astra sebagai asisten AI universal. Demonstrasi menunjukkan Astra mampu membantu memperbaiki sepeda sambil mengakses email dan melakukan panggilan telepon ke toko suku cadang.

Selain itu, Agent Mode kini hadir dalam versi eksperimental yang memungkinkan pengguna mendeskripsikan tujuan dan membiarkan Gemini menyelesaikan tugas kompleks secara mandiri. Google menyatakan fitur ini akan tersedia untuk pelanggan AI Ultra sebagai pratinjau.

6. Google rilis berbagai tool AI baru untuk developer

tampila Jules. (youtube.com/@GoogleDevelopers)
tampila Jules. (youtube.com/@GoogleDevelopers)

Google meluncurkan Jules sebagai agen pemrograman otomatis untuk repositori GitHub yang dapat menangani beberapa tugas coding secara bersamaan. Agen ini memberikan ringkasan audio dari perubahan terbaru basis kode dan dapat melakukan ulasan kode, perbaikan bug, serta implementasi fitur secara mandiri.

Hadir juga Stitch, alat yang memungkinkan pembuatan desain UI dan kode frontend menggunakan deskripsi bahasa natural atau gambar. Sementara, Gemini Code Assist kini menggunakan Gemini 2.5 dengan peningkatan kemampuan coding untuk versi gratis dan berbayar. 

7. Rilis model AI untuk berbagai kebutuhan khusus

tampilan Gemma 3n. (blog.google.com)
tampilan Gemma 3n. (blog.google.com)

Google memperkenalkan Gemma 3n sebagai model multimodal yang dioptimalkan untuk perangkat mobile dengan kemampuan memproses audio, teks, gambar, dan video. Model ini dirancang dengan ukuran efisien untuk berjalan lancar di ponsel, laptop, dan tablet dengan spesifikasi terbatas namun tetap mempertahankan performa.

Sementara, MedGemma diluncurkan sebagai model open source untuk analisis teks dan gambar medis yang dirancang untuk pengembang aplikasi kesehatan. Model ini dapat menganalisis citra medis dan memberikan wawasan untuk mendukung diagnosis dan layanan kesehatan.

Google juga merilis SignGemma untuk menerjemahkan bahasa isyarat ke teks lisan, terutama American Sign Language ke bahasa Inggris. Menurut Google, model ini akan membuka peluang pengembangan aplikasi komunikasi untuk komunitas tunarungu.

8. Perluasan integrasi AI untuk produktivitas

tampilan Gemini di Gmail. (workspaceupdates.googleblog.com)

Gmail akan mendapat fitur balasan pintar yang dipersonalisasi dengan menganalisis konteks dan gaya penulisan dari email dan file Drive sebelumnya.  Fitur ini tentu memerlukan persetujuan pengguna dan akan tersedia musim panas 2025.

Gemini juga mulai terintegrasi ke Chrome untuk pelanggan AI Pro dan Ultra dengan kemampuan menjawab pertanyaan tentang konten website yang sedang terbuka. Asisten AI ini dapat diakses dari taskbar dan menu browser untuk membantu riset, rangkuman, dan navigasi website.

Sementara, NotebookLM kini tersedia sebagai aplikasi mobile di Play Store dan App Store untuk menghasilkan Audio Overviews dengan lebih praktis. Google juga mengumumkan Video Overviews yang akan segera hadir dengan kemampuan mengubah PDF, dokumen, dan diagram menjadi konten visual dan narasi yang mudah dipahami.

Daftar inovasi AI di Google I/O 2025 merupakan bukti bahwa perkembangan AI kini semakin pesat. Menurutmu, apakah inovasi AI yang bermunculan di masa kini terlihat serupa dan menjemukan? Atau, kamu makin tertarik dan penasaran dengan perkembangan AI kedepannya? Kalau menurut penulislaju perkembangan AI kemungkinan malah akan semakin cepat di masa mendatang. 

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Debby Utomo
EditorDebby Utomo
Follow Us