5 Fakta Gemini 2.5 Pro, Model AI Paling Cerdas dari Google

31 Mar 2025, 17:52 WIB

ilustrasi Gemini. (unsplash.com/Solen Feyissa)

Intinya Sih

Gemini 2.5 Pro memiliki kemampuan bernalar yang membedakannya dari model AI biasa, mampu berpikir lama dan hati-hati untuk menangani tugas kompleks.
Model ini unggul dalam benchmark penalaran tingkat lanjut, dengan skor tinggi pada tes sains, matematika, dan Humanity's Last Exam.
Fitur unggulan lainnya adalah jendela konteks yang besar, kemampuan programming yang meningkat, serta dukungan multimodal untuk pemrosesan teks, audio, gambar, dan video secara bersamaan.

Disclaimer: This was created using Artificial Intelligence (AI)

Google telah merilis model kecerdasan buatan (AI) terbaru mereka, Gemini 2.5 Pro. Model ini diklaim sebagai yang paling cerdas dari jajaran AI Google hingga saat ini. Gemini 2.5 Pro hadir sebagai model pertama dari keluarga Gemini 2.5 dan masih dalam tahap eksperimental.

Gemini 2.5 Pro merupakan model penalaran atau thinking model yang mampu bernalar sebelum memberikan respons. Model ini berhasil memimpin di berbagai benchmark penting, bersaing dengan model dari OpenAI, Anthropic, dan DeepSeek. Mari kita bahas lebih dalam tentang lima fakta menarik Gemini 2.5 Pro yang baru dirilis Google!

1. Gemini 2.5 Pro kalahkan AI lain dalam berbagai benchmark

Gemini 2.5 Pro hadir dengan kemampuan bernalar yang membedakannya dari model AI biasa. Model ini mampu berpikir lebih lama dan berhati-hati sehingga membuatnya lebih efektif dalam menangani tugas kompleks. Google berencana mengembangkan kemampuan bernalar untuk semua model AI mereka di masa depan.

Melansir blog Google, Gemini 2.5 Pro menunjukkan performa unggul dalam benchmark penalaran tingkat lanjut. Pada benchmark GPQA Diamond untuk sains, model ini memimpin dengan skor 84,0 persen, mengungguli o3-mini (79,7 persen), GPT-4.5 (71,4 persen) dan Claude 3.7 Sonnet (78,2 persen). Sementara dalam benchmark matematika AIME 2025, Gemini 2.5 Pro mencapai skor 86,7 persen, sedikit di atas o3-mini (86,5 persen) dan jauh melampaui Claude 3.7 Sonnet (49,5 persen).

Pada Humanity's Last Exam, sebuah tes yang dikembangkan oleh ratusan pakar, Gemini 2.5 Pro mencapai skor 18,8 persen. Angka ini paling tinggi dibandingkan model AI lainnya, seperti o3-mini dari OpenAI yang mendapat 14 persen dan Claude 3.7 Sonnet dengan 8,9 persen. Humanity's Last Exam dikenal sebagai salah satu tes paling sulit untuk AI.

2. Memiliki jendela konteks hingga 1 juta token

Fitur unggulan lain dari Gemini 2.5 Pro adalah jendela konteksnya yang sangat besar, mencapai 1 juta token. Kapasitas ini memungkinkan Gemini memproses sekitar 750 ribu kata dalam sekali proses. Google berencana meningkatkan kapasitas ini menjadi 2 juta token dalam waktu dekat.

Jendela konteks yang besar memungkinkan Gemini untuk memahami dataset besar dan masalah kompleks dengan lebih baik. Gemini 2.5 Pro mampu menganalisis berbagai jenis data termasuk teks panjang, kode, dan dokumen tanpa perlu memecahnya menjadi bagian kecil. Menurut DataCamp, kemampuan ini setara dengan memproses seluruh seri buku "Lord of The Rings" dalam sekali jalan.

Pada benchmark MRCR untuk pengujian konteks panjang, Gemini 2.5 Pro mencetak skor 91,5 persen untuk konteks 128 ribu token. Pencapaian ini jauh melampaui o3-mini (36,3 persen) dan GPT-4.5 (48,8 persen). Keunggulan ini membuat Gemini 2.5 Pro menjadi pilihan ideal untuk tugas analisis dokumen panjang atau dataset kompleks.

3. Gemini 2.5 Pro lebih andal dalam coding

Kemampuan programming Gemini 2.5 Pro meningkat signifikan dibandingkan pendahulunya. Model ini sangat baik dalam membuat aplikasi web dengan tampilan menarik serta memodifikasi dan memperbaiki kode yang sudah ada. Pada tes SWE-Bench Verified yang mengukur kemampuan AI dalam menyelesaikan tugas pemrograman kompleks, Gemini 2.5 Pro mendapat nilai 63,8 persen.

Nilai ini lebih tinggi dari model o3-mini (49,3 persen) dan DeepSeek R1 (49,2 persen) , meskipun masih di bawah Claude 3.7 Sonnet (70,3 persen). Namun untuk tes Aider Polyglot yang fokus pada kemampuan memperbaiki kode, Gemini 2.5 Pro mampu unggul dengan nilai 74 persen. Model ini dapat memahami repositori kode lengkap, membuat penulisan dan debug kode lebih efisien. Kemampuan ini sangat berguna bagi developer yang bekerja dengan codebase besar dan kompleks. Google bahkan menunjukkan bagaimana Gemini 2.5 Pro bisa membuat game sederhana hanya dari satu baris prompt.

4. Dilengkapi kemampuan multimodal untuk berbagai jenis input

Gemini 2.5 Pro hadir bersama dukungan multimodal yang memungkinkannya memproses teks, audio, gambar, dan video secara bersamaan. Kemampuan ini sangat berguna untuk menganalisis data dalam berbagai format dalam satu proses. Melansir VentureBeat, Gemini 2.5 Pro memimpin benchmark MMMU (pemahaman multimodal) dengan skor 81,7 persen, mengungguli GPT-4.5 (74,4 persen), Claude 3.7 Sonnet (75 persen), dan Grok 3 Beta (76 persen). Pada benchmark Vibe-Eval untuk pemahaman gambar, model ini mencetak 69,4 persen. Berkat kemampuan ini, pengguna dapat mengunggah gambar atau video bersamaan dengan teks dan mendapatkan analisis komprehensif dalam sekali proses. Hal ini akan mempermudah berbagai, tugas seperti analisis grafik, pemahaman konten visual, atau pengembangan aplikasi yang menerima berbagai jenis data.

5. Gemini 2.5 Pro dapat diakses gratis

TechCrunch melaporkan bahwa Gemini 2.5 Pro tersedia melalui Google AI Studio dan aplikasi Gemini. Menariknya, pengguna gratis Gemini juga dapat mengakses model ini dengan batasan tertentu. Google juga berencana membawa model ini ke Vertex AI dalam waktu dekat untuk pengguna bisnis. Google belum mengumumkan harga API untuk Gemini 2.5 Pro tetapi akan membagikan informasi dalam minggu mendatang.

Kehadiran Gemini 2.5 Pro memperketat persaingan dalam industri AI, khususnya di segmen model penalaran. Model ini bersaing ketat dengan o1 dari OpenAI, Claude 3.7 Sonnet dari Anthropic, dan DeepSeek-R1. Melihat berbagai kemampuan Gemini 2.5 Pro, apakah kamu tertarik untuk mencoba model AI terbaru dari Google ini?

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.