4 Fakta Menarik o3 dan o4-mini, Model AI Terpintar dari OpenAI

- OpenAI meluncurkan model kecerdasan buatan o3 dan o4-mini, bagian dari seri "o-series" dengan kemampuan "thinking with images".
- o3 merupakan model AI terpintar OpenAI hingga saat ini, unggul dalam berbagai benchmark termasuk matematika, pemrograman, dan analisis visual.
- o4-mini dirancang untuk kecepatan dan efisiensi biaya, unggul dalam matematika dan pemrograman namun masih kalah secara umum dari o3.
Setelah GPT-4.1, minggu ini OpenAI kembali meluncurkan dua model kecerdasan buatan (AI) baru bernama o3 dan o4-mini. Kedua model ini merupakan bagian dari seri "o-series" yang dirancang untuk berpikir lebih lama sebelum memberikan jawaban. Model ini membawa keunggulan baru yaitu kemampuan "thinking with images" atau berpikir dengan gambar.
Model ini juga mampu menggunakan berbagai alat secara mandiri seperti browsing, kode Python, analisis file, dan pembuatan gambar. Penasaran seberapa cerdas o3 dan o4-mini dari OpenAI ini? Yuk kita pelajari lebih lanjut dalam artikel ini!
1. o3 menjadi model AI terpintar dari OpenAI
OpenAI o3 menjadi model AI terpintar yang pernah dirilis OpenAI hingga saat ini. Model ini meraih performa tinggi di berbagai benchmark, termasuk tes coding Codeforces dengan skor ELO 2706 dan SWE-bench dengan akurasi 69,1 persen. Model ini juga mencapai skor 82,9 persen dalam MMMU yang mengukur kemampuan pemecahan masalah visual. Tidak heran kalau o3 diklaim sebagai model AI terdepan (state-of-the-art) dalam berbagai benchmark saat ini.
Berdasarkan blog OpenAI, o3 membuat 20 persen lebih sedikit kesalahan dibanding pendahulunya, o1, saat mengerjakan tugas dunia nyata yang rumit. Keunggulan o3 terutama terlihat pada bidang pemrograman, bisnis, dan pengembangan ide kreatif. Model ini juga mampu menangani pertanyaan kompleks yang membutuhkan analisis dari berbagai sudut pandang.
Kemampuan matematika o3 dalam juga sangat mengesankan. Pada tes matematika AIME 2024, o3 mencapai skor 91,6 persen tanpa bantuan alat dan 98,4 persen saat menggunakan Python. Pada tes visual, o3 unggul dengan skor 86,8 persen pada benchmark MathVista dan 78,6 persen pada CharXiv untuk analisis gambar ilmiah.
2. o4-mini lebih cepat dan hemat biaya
O4-mini dirancang untuk kecepatan dan efisiensi biaya namun tetap berkemampuan cukup tinggi. Model ini unggul dalam matematika dengan skor 93,4 persen pada AIME 2024 tanpa alat bantu, melampaui o3 (91,6 persen) dan o1 (74,3 persen). Dengan bantuan Python pada AIME 2025, skornya mencapai 99,5 persen. Model ini cukup baik untuk tugas pemrograman dan pemahaman visual.
Kemampuan pemrograman o4-mini juga tidak kalah mengesankan. Pada Codeforces, o4-mini meraih skor ELO 2719, sedikit lebih tinggi dari o3 (2706). Pada benchmark SWE-bench, o4-mini mencapai 68,1 persen, hampir setara dengan o3 (69,1 persen). Kemampuan multimodal-nya juga cukup baik dengan skor 81,6 persen pada MMMU dan 84,3 persen pada MathVista. Namun, secara umum, o3 masih lebih unggul dari o4-mini.
Pengguna bisa memilih antara dua versi o4-mini yang tersedia. Versi standar memberikan respons lebih cepat dengan kemampuan yang seimbang. Versi o4-mini-high menghabiskan waktu lebih lama untuk berpikir tetapi menghasilkan jawaban berkualitas lebih tinggi untuk tugas-tugas rumit.
3. Memiliki kemampuan berpikir dengan gambar
Fitur paling menarik dari o3 dan o4-mini adalah kemampuannya berpikir dengan gambar. Melansir TechCrunch, model ini tidak sekadar mengenali gambar, tetapi menggunakannya sebagai bagian proses berpikir. AI ini mampu menganalisis berbagai jenis gambar meski buram, terbalik, atau berkualitas rendah.
Kedua model dapat memanipulasi gambar saat berpikir, seperti memutar, memperbesar, atau mengubah gambar. Kemampuan ini sangat membantu saat menganalisis diagram kompleks atau ilustrasi ilmiah yang detail.
Dalam demonstrasinya, o3 berhasil menganalisis poster fisika rumit dan bahkan mengidentifikasi informasi yang tidak ada di dalamnya. Model ini juga andal dalam membaca teks dalam gambar, seperti tulisan tangan di papan tulis atau diagram dari buku pelajaran. Cara kerja ini hampir mirip dengan otak manusia yang memproses informasi visual dan teks secara bersamaan.
4. Telah tersedia di berbagai tier langganan ChatGPT

Kedua model ini sudah tersedia bagi pengguna ChatGPT Plus, Pro, dan Team sejak Rabu (16/4/2025), menggantikan o1, o3-mini, dan o3-mini-high. Pengguna ChatGPT Enterprise dan Edu akan mendapatkan akses dalam satu minggu ke depan. Pengguna gratis juga bisa mencoba o4-mini secara terbatas dengan memilih mode "Think" sebelum mengirim pertanyaan.
Developer dapat mengakses o3 dan o4-mini melalui API Chat Completions dan Responses API. API ini mendukung streaming, function calling, dan output terstruktur. Jendela konteks kedua model mencapai 200 ribu token dan mendukung hingga 100 ribu token output.
Harga API o4-mini jauh lebih terjangkau, hanya 1,1 dolar AS (sekitar Rp18.500) per satu juta token input dan 4,4 dolar AS (sekitar Rp74 ribu) per satu juta token output. Harga ini sekitar sepersepuluh dari biaya o3 yang mencapai 10 dolar AS (sekitar Rp168 ribu) dan 40 dolar AS (sekitar Rp675 ribu).
Bersamaan dengan perilisan dua model ini, OpenAI juga meluncurkan Codex CLI, sebuah alat pemrograman ringan yang bisa dijalankan dari terminal komputer. Alat ini memaksimalkan kemampuan model seperti o3 dan o4-mini, dengan dukungan untuk input multimodal seperti tangkapan layar atau sketsa sederhana.
OpenAI akan segera meluncurkan o3-pro dalam beberapa minggu ke depan. Model ini hanya akan tersedia untuk pelanggan ChatGPT Pro. Sam Altman, CEO OpenAI, menyebutkan o3 dan o4-mini kemungkinan adalah model terpisah terakhir sebelum GPT-5. Model GPT-5 nantinya akan menggabungkan kemampuan percakapan biasa dengan kemampuan penalaran dalam satu sistem. Kedepannya, bukan tidak mungkin cara kerja AI akan semakin mirip dengan otak manusia.