perbandingan Gemini 3 Flash dengan model AI lain (blog.google)
Gemini 3 Flash menunjukkan performa yang mengesankan ketika diuji dengan berbagai benchmark industri. Pada pengujian MMMU-Pro yang mengukur pemahaman multimodal dan penalaran, Gemini 3 Flash berhasil mencetak skor impresif sebesar 81,2 persen. Angka ini secara mengejutkan berhasil mengungguli model GPT-5.2 dari OpenAI yang mencatatkan skor 79,5 persen pada pengujian yang sama.
Model ini juga tampil mumpuni dalam tolok ukur Humanity's Last Exam yang dirancang untuk menguji keahlian akademis di berbagai domain pengetahuan. Gemini 3 Flash mencatatkan skor 33,7 persen tanpa bantuan alat tambahan, angka yang sangat kompetitif dan hanya terpaut tipis di bawah GPT-5.2 yang meraih 34,5 persen. Hasil ini menunjukkan Gemini 3 Flash yang lebih ringan dan murah sanggup bersaing dengan model flagship yang lebih mahal.
Dalam hal kemampuan matematika, Gemini 3 Flash juga menunjukkan performa yang kuat pada pengujian AIME 2025. Model ini mampu meraih skor 95,2 persen tanpa bantuan alat, dan melesat hingga 99,7 persen ketika diperbolehkan menggunakan bantuan kode. Kemampuan ini jauh melampaui pendahulunya, Gemini 2.5 Flash, yang hanya mampu meraih skor 72,0 persen pada kategori yang sama.
Untuk tugas pemrograman yang bersifat agentic, Gemini 3 Flash lagi-lagi berhasil melampaui model yang lebih besar. Pada benchmark SWE-bench Verified yang mengukur kemampuan coding agent, model ini meraih skor 78,0 persen, mengalahkan Gemini 3 Pro yang berada di angka 76,2 persen. Oleh karena itu, Gemini 3 Flash bisa menjadi pilihan menarik bagi para developer yang membutuhkan asisten coding gesit dan cerdas.