Iklan - Scroll untuk Melanjutkan
Baca artikel IDN Times lainnya di IDN App
ilustrasi Gemini. (unsplash.com/Solen Feyissa)

Intinya sih...

  • Google meningkatkan kemampuan model AI Gemini 2.5 dengan mode penalaran baru "Deep Think" untuk memecahkan masalah kompleks secara akurat.
  • Gemini 2.5 Pro unggul dalam berbagai benchmark matematika dan coding, serta terintegrasi dengan LearnLM untuk bantuan belajar.
  • Gemini 2.5 Flash mengalami peningkatan performa dengan efisiensi token 20-30% lebih baik, serta fitur audio baru dan teknologi text-to-speech terbaru.

Google baru saja mengumumkan serangkaian pembaruan menarik untuk keluarga model AI Gemini 2.5 di ajang Google I/O 2025 yang berlangsung Selasa (20/5/2025) kemarin. Pembaruan ini meningkatkan kemampuan model dalam memahami, bernalar, dan berinteraksi dengan pengguna. Google memperkenalkan mode penalaran Deep Think, versi baru Gemini 2.5 Flash, kemampuan audio yang lebih natural, serta fitur baru untuk developer .

Salah satu yang disoroti adalah kemampuan baru Gemini 2.5 Pro bernama "Deep Think" yang berhasil mengalahkan model AI kompetitor di berbagai benchmark matematika dan coding. Gemini 2.5 Flash juga mendapatkan peningkatan dengan efisiensi token yang lebih baik. Simak deretan pembaruan menarik Gemini 2.5 yang diperkenalkan pada Google I/O 2025 berikut!

1. Gemini 2.5 Pro kini dilengkapi mode Deep Think

Deep Think adalah mode penalaran baru yang dikembangkan Google untuk Gemini 2.5 Pro. Teknologi ini memungkinkan AI mempertimbangkan beberapa jawaban alternatif sebelum memberikan respons final. Melansir blog Google, Deep Think menggunakan teknik penelitian terbaru dalam berpikir dan penalaran yang membuat model mampu memecahkan masalah kompleks dengan lebih akurat.

Kemampuan Deep Think terlihat dari performanya yang mengesankan pada berbagai benchmark sulit. Pada United States of America Mathematical Olympiad (USAMO) 2025, Gemini 2.5 Pro dengan Deep Think meraih skor 49,4 persen, jauh melampaui OpenAI o3 High (21,7 persen) dan o4-mini (19,1 persen). Model ini juga unggul pada LiveCodeBench, tolok ukur untuk coding kompetitif, dengan skor 80,4 persen dan meraih nilai 84,0 persen pada tes pemahaman multimodal MMMU.

Saat ini Deep Think masih dalam tahap pengujian terbatas dan hanya tersedia untuk penguji terpercaya melalui Gemini API. Google masih perlu melakukan evaluasi keamanan tambahan sebelum meluncurkan teknologi ini secara luas. Meski begitu, kamu masih bisa mencoba Gemini 2.5 Pro tanpa Deep Think yang sudah cukup cerdas.

Gemini 2.5 Pro kini terintegrasi dengan LearnLM, alat pembelajaran Google yang dikembangkan bersama ahli pendidikan. Berkat fitur ini, Gemini menjadi lebih pintar dalam memberikan bantuan belajar untuk berbagai topik dan mata pelajaran. Para guru dan pakar pendidikan diklaim lebih menyukai Gemini 2.5 Pro dibanding AI lainnya untuk kebutuhan mengajar.

2. Google membuat Gemini 2.5 Flash lebih efisien dan cerdas

Melansir TechCrunch, Gemini 2.5 Flash, model yang dirancang untuk kecepatan dan biaya rendah, kini hadir dengan berbagai peningkatan performa. Model ini mengalami perbaikan di berbagai aspek seperti penalaran, pemahaman multimodal, kemampuan coding, dan pemahaman konteks panjang. Google mengklaim model ini sekarang 20-30 persen lebih efisien dalam penggunaan token.

Efisiensi yang lebih baik tidak mengorbankan kualitas model secara keseluruhan. Gemini 2.5 Flash mencatat skor mengesankan pada berbagai tolok ukur penting, termasuk 79,7 persen pada MMMU (pemahaman multimodal), 74 persen pada MRCR v2 (konteks panjang 128k), dan 88,4 persen pada Global MMLU Lite (performa multibahasa). Dari segi biaya, model ini menawarkan nilai kompetitif dengan tarif input 0,15 dolar AS (sekitar Rp2.400) dan output 0,60 dolar AS (sekitar Rp9.800) per satu juta token.

Kabar baiknya, Gemini 2.5 Flash versi terbaru sudah tersedia untuk dicoba di Google AI Studio bagi para developer, di Vertex AI untuk perusahaan, dan di aplikasi Gemini untuk pengguna umum. Google berencana merilis versi final untuk penggunaan produksi pada awal Juni 2025. Peningkatan efisiensi ini memberi alternatif ekonomis bagi developer atau pelaku bisnis yang ingin memanfaatkan AI tanpa biaya tinggi.

3. Kemampuan audio yang lebih alami dan ekspresif

Google meluncurkan kemampuan audio baru untuk Gemini 2.5 melalui Live API yang membuat percakapan dengan AI terasa lebih alami. Pengguna kini bisa mengatur bagaimana Gemini berbicara dengan memilih nada suara, aksen, dan gaya bicara yang diinginkan. Fitur ini memungkinkan Gemini berbicara dramatis saat bercerita atau menggunakan nada formal saat diperlukan.

Melansir ZD Net, beberapa fitur cerdas yang ditambahkan meliputi Affective Dialogue yang membuat Gemini bisa "membaca" emosi dari suara pengguna, Proactive Audio yang membantu AI mengabaikan suara latar dan gangguan, serta Thinking in Live API untuk menyelesaikan tugas-tugas rumit. Semua fitur ini dirancang agar interaksi dengan AI terasa lebih manusiawi dan responsif.

Google juga menghadirkan teknologi text-to-speech terbaru yang mendukung percakapan dengan beberapa karakter suara berbeda sekaligus. Teknologi ini bekerja dalam lebih dari 24 bahasa dan bisa berganti bahasa dengan mulus. Kemampuan menangkap nuansa halus seperti berbisik membuat komunikasi dengan Gemini terasa lebih ekspresif dan natural.

Selain itu, Google mengintegrasikan Project Mariner yang memberi Gemini kemampuan menggunakan komputer layaknya manusia. Fitur ini akan tersedia dalam Gemini API dan Vertex AI dengan peluncuran lebih luas bagi pengembang pada musim panas ini. Perusahaan seperti Automation Anywhere dan UiPath saat ini sudah mulai mengeksplorasi potensi teknologi ini.

4. Berbagai pembaruan lain untuk developer   

Google melengkapi Gemini 2.5 dengan fitur thought summaries yang menyederhanakan cara AI menjelaskan proses berpikirnya. Fitur ini mengubah pemikiran mentah model menjadi format yang lebih rapi dengan header, detail penting, dan informasi tentang tindakan yang dilakukan model. Bagi developer, fitur ini sangat membantu untuk memahami alasan di balik jawaban Gemini.

Kini developer juga bisa menghemat biaya dengan lebih mudah. Google telah menambahkan fitur thinking budgets ke Gemini 2.5 Pro yang memungkinkan developer mengatur seberapa panjang atau lama model berpikir. Pengembang kini bisa menentukan berapa banyak token yang digunakan Gemini sebelum memberikan jawaban. Pengguna juga bisa mematikan proses berpikir jika ingin respons lebih cepat dan hemat biaya.

Google juga menambahkan dukungan SDK native untuk Model Context Protocol (MCP) di Gemini API. Fitur ini mempermudah integrasi Gemini dengan berbagai alat open-source yang sudah ada. Nah, dari sederet pembaruan menarik untuk Gemini 2.5 yang diumumkan pada Google I/O 2025, apakah ada yang menjadi favoritmu? 

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.

Editorial Team