Baca artikel IDN Times lainnya di IDN App
For
You

Model AI Buatan OpenAI Raih Emas di Olimpiade Matematika Bergengsi

ilustrasi OpenAI. (unsplash.com/ Andrew Neel)
Intinya sih...
  • Model AI eksperimental OpenAI meraih medali emas di Olimpiade Matematika Internasional (IMO) 2025 dengan menyelesaikan 5 dari 6 soal dan perolehan skor total 35 dari 42 poin.
  • Kemampuan AI ini tidak dirancang khusus untuk tugas matematis, melainkan berbasis Large Language Model (LLM) dan general-purpose reinforcement learning.
  • Perkembangan pesat AI dalam bidang matematika terbukti sangat cepat, namun masih perlu dilihat dari berbagai sisi termasuk proses verifikasi kinerja dan kegunaannya bagi masyarakat umum.

Kabar menarik datang dari dunia kecerdasan buatan (AI). Sebuah model AI eksperimental milik OpenAI diklaim berhasil meraih prestasi setara medali emas di Olimpiade Matematika Internasional (IMO), salah satu kompetisi matematika paling sulit di dunia. Peneliti OpenAI Alexander Wei menyebut keberhasilan ini sebagai terobosan atas tantangan besar yang telah lama ada di bidang AI.

Pencapaian ini menjadi sorotan karena soal-soal IMO terkenal membutuhkan penalaran kreatif tingkat tinggi, bukan sekadar kemampuan berhitung. Keberhasilan model ini mematahkan prediksi banyak ahli yang sebelumnya pesimis AI bisa menaklukkan tantangan tersebut. Berikut fakta-fakta menarik di balik lompatan besar teknologi AI ini.

1. Diuji layaknya kontestan manusia

Model AI besutan OpenAI ini sukses menyelesaikan 5 dari 6 soal yang diujikan pada IMO 2025. Perolehan skor totalnya mencapai 35 dari 42 poin. Angka tersebut sudah cukup untuk menempatkannya di kategori peraih medali emas. Proses pengujiannya pun tidak main-main. Model AI ini dihadapkan pada aturan yang sama seperti kontestan manusia. Ujian berlangsung dalam dua sesi terpisah yang masing-masing berdurasi 4,5 jam, tanpa akses internet ataupun alat bantu lainnya.

Validitas hasil ujian juga menjadi perhatian utama. Seluruh lembar jawaban dan alur pembuktian dari model AI diperiksa secara independen. Tim penilainya terdiri dari tiga orang mantan peraih medali IMO yang kredibilitasnya tidak diragukan. Sebagai gambaran tingkat kesulitan kompetisi ini, hanya sekitar sepuluh persen dari 630 kontestan manusia yang berhasil membawa pulang medali emas. Kemenangan model AI ini menempatkannya sejajar dengan para talenta matematika muda paling cemerlang dari seluruh dunia, dilansir Engadget.

2. Tidak dirancang khusus untuk tugas matematis

ilustrasi logo OpenAI. (unsplash.com/Levart_Photographer)
ilustrasi logo OpenAI. (unsplash.com/Levart_Photographer)

CEO OpenAI Sam Altman menyatakan bahwa kemampuan ini tidak datang dari sistem yang dirancang khusus untuk matematika. AI ini pada dasarnya adalah sebuah Large Language Model (LLM) atau model bahasa untuk penalaran dan tugas umum. Keberhasilannya merupakan buah dari terobosan dalam metode yang disebut sebagai general-purpose reinforcement learning.

Kunci dari pencapaian ini adalah kemampuan AI untuk melakukan penalaran yang kompleks dan berkelanjutan. Berbeda dari model-model sebelumnya, AI ini sanggup berpikir selama berjam-jam untuk memecahkan satu masalah.

"Soal-soal IMO menuntut tingkat pemikiran kreatif berkelanjutan yang baru, berbeda dari tolok ukur sebelumnya. Model ini dirancang untuk dapat berpikir dalam jangka waktu yang sangat lama," tulis Noam Brown, peneliti di OpenAI.

Dalam kompetisi ini, AI tersebut perlu menghasilkan argumen matematis yang kuat dan sulit dibantah. Wei menjelaskan, model ini mampu merangkai argumen rumit yang kualitasnya setara dengan matematikawan manusia. Kemampuan tersebut adalah sebuah kemajuan besar, terutama untuk tugas yang pembuktiannya bisa sepanjang beberapa halaman.

3. Bukti cepatnya perkembangan AI di bidang matematika

Laju perkembangan AI dalam bidang matematika terbukti sangat cepat. Brown mengingatkan bahwa pada 2024, banyak laboratorium AI masih menggunakan soal matematika tingkat sekolah dasar sebagai tolok ukur. Hasil ini bahkan mengejutkan banyak peneliti di OpenAI karena dicapai menggunakan teknik yang baru saja dikembangkan.

Meski begitu, pencapaian ini tetap perlu dilihat dari berbagai sisi. Kritikus AI ternama, Gary Marcus, mengakui bahwa performa model tersebut memang sangat mengesankan. Namun, ia juga mempertanyakan metode pelatihan, biaya hingga kegunaannya bagi masyarakat umum.

Marcus juga menyorot proses verifikasi dari kinerja AI tersebut. Hingga saat ini, pihak penyelenggara IMO sendiri belum melakukan verifikasi resmi terhadap klaim yang dipublikasikan oleh OpenAI. Poin ini penting untuk melihat pencapaian tersebut secara lebih objektif. OpenAI pun meluruskan bahwa model ini masih bersifat riset eksperimental dan bukanlah GPT-5 yang akan datang. Perusahaan tersebut belum berencana merilis AI dengan kemampuan matematis setingkat ini ke publik dalam beberapa bulan ke depan.

"Ketika kami pertama kali memulai OpenAI, ini adalah sebuah mimpi yang tidak terasa realistis. Pencapaian ini menjadi penanda signifikan tentang seberapa jauh kemajuan AI selama dekade terakhir," ujar Sam Altman dilansir Business Insider.

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Kidung Swara Mardika
EditorKidung Swara Mardika
Follow Us