Baca artikel IDN Times lainnya di IDN App
For
You

Head-to-Head Gemini 3 vs Claude Sonnet 4.5, Siapa Pemenangnya?

Gemini 3 dan Claude 4.5
Gemini 3 (kiri) (blog.google) | Claude 4.5 (kanan) (anthropic.com)
Intinya sih...
  • Gemini 3 dan Claude Sonnet 4.5 memiliki pendekatan yang berbeda dalam pemrosesan teks, gambar, video, audio, dokumen, dan screenshot.
  • Gemini 3 Pro unggul dalam tolok ukur AI dengan skor tertinggi di LMArena Leaderboard dan kemampuan reasoning yang tinggi.
  • Kemampuan multimodal menjadi keunggulan utama Gemini 3 dibanding Claude Sonnet 4.5, sementara Claude Sonnet 4.5 unggul dalam kemampuan agentic AI.
Disclaimer: This summary was created using Artificial Intelligence (AI)

Persaingan model AI kelas atas semakin memanas sepanjang 2025. Dua di antaranya yang paling banyak mencuri perhatian publik adalah Gemini 3 besutan Google DeepMind dan Claude Sonnet 4.5 dari Anthropic. Claude Sonnet 4.5 dirilis pada 29 September 2025 sebagai penerus Claude Sonnet 4 yang meluncur pada Mei di tahun yang sama. Sementara itu, Gemini 3 rilis pada 18 November 2025 dan langsung disebut-sebut sebagai salah satu model AI paling cerdas karena sangat akurat dalam memberikan jawaban.

Kondisi ini membuat perbandingan kedua model tersebut menjadi relevan untuk melihat siapa yang benar-benar unggul secara keseluruhan. Kira-kira, apakah Gemini 3 mampu mengungguli performa Claude Sonnet 4.5 atau justru sebaliknya? Artikel ini akan mengulas performa masing-masing model untuk memberikan gambaran lebih jelas mengenai siapa yang paling layak disebut sebagai pemenang. Yuk, simak perbandingannya berikut!

1. Gemini 3 dan Claude Sonnet 4.5 memiliki pendekatan yang berbeda

Claude Sonnet 4.5
Claude Sonnet 4.5 (anthropic.com)

Google DeepMind menempatkan Gemini 3 sebagai model multimodal penuh berkat kemampuannya memproses teks, gambar, video, audio, dokumen, hingga screenshot dalam satu alur percakapan. Arsitektur multi-tower yang digunakan memungkinkan setiap jenis input dianalisis secara paralel sebelum digabungkan pada lapisan reasoning. Mekanisme ini dirancang untuk memberikan pemahaman lintas media, terutama pada kebutuhan pendidikan, analisis visual, dan produksi konten kreatif.

Sementara itu, Claude Sonnet 4.5 mengusung pendekatan yang menekankan akurasi, konsistensi, dan ketahanan dalam mengeksekusi tugas. Anthropic merancang model ini agar unggul dalam penalaran logis dan penggunaan tool yang stabil di berbagai kondisi. Fokus pengembangannya diarahkan pada workflow profesional, mulai dari pembuatan dokumen, pelaksanaan rencana kerja berdurasi panjang, hingga penyelesaian proyek coding berskala besar.

2. Adu tolok ukur Gemini 3 dan Claude Sonnet 4.5

Gemini 3 unggul di beberapa benchmark AI
Gemini 3 unggul di beberapa benchmark AI (blog.google)

Selain merilis model utamanya, Google juga memperkenalkan Gemini 3 Pro. Mengutip blog resmi Google, Gemini 3 Pro dirancang untuk mewujudkan berbagai ide melalui kemampuan reasoning tercanggih dan dukungan multimodal yang lebih matang. Model ini secara signifikan mengungguli pendahulunya, Gemini 2.5 Pro di semua tolok ukur utama AI.

Gemini 3 Pro juga menduduki peringkat teratas di LMArena Leaderboard atas capaian skor 1.501 poin. Kemampuan reasoning-nya berada di level tertinggi berkat pencapaian 37,5 persen pada Humanity’s Last Exam (tanpa menggunakan alat bantu) dan 91,9 persen di GPQA Diamond. Gemini 3 Pro juga menetapkan standar baru untuk model frontier di bidang matematika yang mencapai skor tertinggi 23,4 persen di MathArena Apex.

Tak hanya unggul dalam pemrosesan teks, Gemini 3 Pro juga menunjukkan performa kuat pada multimodal reasoning. Model ini mencatat 81 persen di MMMU-Pro dan 87,6 persen pada Video-MMMU. Model ini juga mencetak skor tertinggi 72,1 persen pada SimpleQA Verified yang menunjukkan kemajuan signifikan dalam akurasi fakta. Ini membuktikan bahwa Gemini 3 Pro sangat andal dalam menyelesaikan masalah kompleks di bidang sains dan matematika.

Di sisi lain, Claude Sonnet 4.5 menunjukkan keunggulan pada pengujian reasoning dan kemampuan coding. Model ini meraih skor 77,2 persen di SWE-bench Verified. Atas raihan skor tersebut, Claude Sonnet 4.5 didaulat sebagai salah satu model paling akurat untuk tugas pemrograman. Performanya tetap stabil pada skenario yang membutuhkan logika bertahap, seperti debugging, refactoring, hingga pembangunan proyek multi-file. Dalam workflow coding jangka panjang, Claude Sonnet 4.5 juga mampu mempertahankan konteks secara lebih konsisten dan jarang mengalami penurunan kualitas selama sesi kerja yang panjang.

3. Kemampuan multimodal menjadi keunggulan utama Gemini 3

penjelasan materi sel prokariotik dan eukariotik
penjelasan materi sel prokariotik dan eukariotik (youtube.com/Google)

Kemampuan multimodal menjadi kekuatan Gemini 3 dibanding Claude Sonnet 4.5. Pengguna dapat menggabungkan screenshot, laporan PDF, rekaman suara, hingga video pendek untuk dianalisis sekaligus. Performa ini membuat Gemini lebih cocok untuk analisis visual, pembuatan konten kreatif, dan skenario pendidikan berbasis media.

Di sisi lain, Claude Sonnet 4.5 memang mampu memahami gambar dokumen, tetapi kemampuan multimodalnya tidak sehebat Gemini. Claude Sonnet 4.5 memang belum dioptimalkan untuk pemrosesan video atau audio sebagai input utama. Ketika membicarakan kemampuan multimodal, Gemini 3 dan Gemini 3 Pro memiliki keunggulan yang lebih jelas dan lebih matang dibanding Claude Sonnet 4.5.

4. Claude Sonnet 4.5 unggul dalam kemampuan agentic AI

Claude Agent SDK
Claude Agent SDK (anthropic.com)

Claude Sonnet 4.5 hingga saat ini masih menjadi model yang paling matang dalam kemampuan agentic AI, terutama untuk kebutuhan otomatisasi kerja dan eksekusi tugas berbasis workflow. Model ini mampu menjalankan tugas browser, membuat dan mengedit dokumen, hingga menyusun rencana multi-step yang dapat berjalan dalam waktu lama tanpa kehilangan konteks. Keunggulan ini diperkuat dengan ketersediaan agent SDK dari Anthropic yang dirancang khusus untuk lingkungan industri.

Kematangan Claude 4.5 terlihat dari konsistensinya dalam menyelesaikan rangkaian tugas yang membutuhkan struktur, penalaran jangka panjang, dan reliabilitas tool-use. Di ekosistem enterprise, model ini terbukti mampu mempertahankan performa dalam sesi yang panjang sehingga menjadi pilihan utama untuk otomasi DevOps, manajemen dokumen, dan proses operasional yang memerlukan agent AI yang benar-benar dapat bekerja mandiri. Berkat jejak pemakaian yang sudah mapan, Claude 4.5 memegang posisi terdepan dalam kategori agentic AI yang siap produksi.

Sementara itu, Gemini 3 menunjukkan potensi besar melalui fitur seperti Deep Think dan terintegrasi langsung oleh layanan Google. Model ini dirancang untuk mendukung perencanaan tingkat tinggi dan penalaran multimodal yang dapat meningkatkan cara pengguna menyelesaikan tugas kompleks. Namun, dalam konteks implementasi agentic AI, upaya Google masih berada pada tahap pengembangan dan belum mencapai kematangan ekosistem yang dimiliki Claude Sonnet 4.5. Kapabilitas otomatisasinya masih bertahap dirilis dan belum memberikan pengalaman end-to-end yang benar-benar stabil bagi developer.

Google kini mulai memperluas pendekatannya melalui peluncuran Google Antigravity, platform agentic terbaru yang memungkinkan developer berorientasi pada tugas. Antigravity memanfaatkan kemampuan penalaran, penggunaan alat, dan agentic coding dari Gemini 3 untuk mengubah AI dari sekadar alat bantu menjadi mitra aktif. Meski konsepnya kuat, ekosistem ini masih tergolong baru dan belum mencapai level kedewasaan seperti implementasi agentic yang diterapkan oleh Anthropic.

Pada tahap awal ini, Antigravity berfungsi sebagai fondasi arah pengembangan masa depan Gemini 3 dan menjadi bagian dari strategi Google untuk menutup jarak dengan Claude di bidang agentic AI. Platform ini juga terhubung dengan Gemini 2.5 Computer Use untuk kontrol browser dan Nano Banana (Gemini 2.5 Image) untuk penyuntingan gambar. Meski demikian, sampai ekosistem tersebut teruji di lingkungan produksi, Claude Sonnet 4.5 tetap menjadi tolok ukur agentic AI yang paling siap digunakan untuk kebutuhan industri saat ini.

5. Gemini 3 dan Claude Sonnet 4.5 sama-sama menawarkan context window hingga 1 juta token

Gemini 3 dapat membaca dan menerjemahkan resep keluarga sebagai media belajar memasak
Gemini 3 dapat membaca dan menerjemahkan resep keluarga sebagai media belajar memasak (blog.google)

Sejak awal, Gemini 3 memang dirancang untuk memadukan informasi dari berbagai jenis media, mulai dari teks, gambar, video, audio, hingga kode. Misalnya, jika kamu ingin mendokumentasikan resep warisan keluarga yang ditulis tangan oleh Ibu, Gemini 3 dapat membaca tulisan tersebut dan menerjemahkannya ke berbagai bahasa, kemudian mengubahnya menjadi buku resep digital yang siap dibagikan. Contoh lain, kamu bisa memasukkan diktat kuliah, makalah akademik, referensi, video seminar, atau rekaman kuliah, dan Gemini 3 akan membantu membuat kode untuk visualisasi, flashcard, atau format lain yang memudahkanmu memahami materi.

Menariknya, Gemini 3 dan Claude Sonnet 4.5 sama-sama menawarkan context window hingga sekitar 1 juta token. Claude Sonnet 4.5 menonjol pada tugas panjang yang terstruktur, termasuk proyek yang berlangsung lebih dari 30 jam. Model ini mampu menjaga konteks, mencegah penyimpangan logika, dan mempertahankan konsistensi output, sehingga sangat cocok untuk workflow enterprise maupun pekerjaan teknis yang menuntut ketelitian tinggi.

Melihat berbagai parameter, tidak ada satu model yang benar-benar unggul di semua bidang. Kedua model menghadirkan pendekatan berbeda sesuai kebutuhan pengguna. Gemini 3 unggul dalam reasoning, matematika tingkat tinggi, dan pemrosesan multimodal. Hasil benchmark menunjukkan keunggulan yang merata di hampir semua kategori akademik dan penalaran. Sementara itu, Claude Sonnet 4.5 lebih menonjol pada aspek praktis, khususnya eksekusi tugas panjang, otomatisasi, dan konsistensi hasil dalam skenario nyata.

Perbedaan ini membuat kedua model AI saling melengkapi, bukan saling menyaingi secara mutlak. Jawaban atas pertanyaan “siapa pemenangnya” sangat bergantung pada konteks penggunaan. Untuk riset dan analisis teknis, Gemini 3 menjadi pilihan utama. Namun, Claude Sonnet 4.5 tetap menawarkan performa yang solid dan dapat diandalkan untuk workflow profesional dan implementasi praktis. Kedua model ini menegaskan diri sebagai dua AI paling matang dan berpengaruh di tahun 2025. Jadi, mana yang menjadi favoritmu?

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Kidung Swara Mardika
EditorKidung Swara Mardika
Follow Us

Latest in Tech

See More

TikTok Hadirkan Fitur Kesehatan Mental, Bisa Dapat Lencana!

23 Nov 2025, 13:02 WIBTech