xAI Rilis Grok 4, Diklaim Elon Musk sebagai AI Tercerdas di Dunia

13 Jul 2025, 21:58 WIB

Leo Manik

tampilan Grok AI. (x.AI)

Intinya sih...

xAI merilis dua versi Grok 4, yaitu model agen tunggal dan sistem AI multi-agen yang lebih cerdas.
Grok 4 unggul dalam berbagai benchmark AI, seperti Indeks Intelijen, Humanity's Last Exam, dan tes penalaran abstrak.
Grok 4 memiliki kelebihan fitur suara ekspresif dan pemahaman budaya internet, namun masih memiliki kelemahan dalam kecepatan proses output dan kemampuan multimodal.

Perusahaan kecerdasan buatan (AI) milik Elon Musk, xAI, meluncurkan model AI terbarunya, Grok 4, pada Kamis (10/7/2025). Dalam siaran langsungnya, Musk dengan penuh percaya diri memperkenalkan Grok 4 sebagai "AI paling cerdas di dunia". Grok diharapkan dapat bersaing melawan AI lain seperti ChatGPT dari OpenAI dan Gemini dari Google.

Grok 4 diklaim membawa lompatan besar dalam hal kemampuan penalaran dan pemecahan masalah kompleks. Musk bahkan mengklaim Grok 4 dapat mengungguli mahasiswa pascasarjana dalam berbagai bidang ilmu. Berikut fakta-fakta terkait xAI rilis Grok 4!

1. xAI rilis dua versi Grok 4

Elon Musk dan tim xAI saat mengumumkan Grok 4. (x.com/xAI)

Dalam peluncuran kali ini, xAI tidak hanya merilis satu, melainkan dua model sekaligus. Varian pertama adalah Grok 4, yang merupakan model agen tunggal (single-agent). Model ini sudah dilengkapi dengan kemampuan penalaran dan cocok untuk kebanyakan tugas.

Varian kedua adalah Grok 4 Heavy, sebuah sistem AI multi-agen yang jauh lebih cerdas. Menurut penjelasan tim xAI, Grok 4 Heavy bekerja dengan cara mengerahkan beberapa "agen" AI secara bersamaan untuk menganalisis satu masalah dari berbagai sudut. Hasil kerja para agen ini kemudian dibandingkan dan disatukan untuk menghasilkan jawaban akhir yang paling komprehensif, dilansir Datacamp.

Musk mengklaim bahwa Grok 4 adalah AI pertama yang sanggup memecahkan masalah teknis dunia nyata yang solusinya tidak bisa ditemukan begitu saja di internet atau buku. Model ini juga dilatih dengan menggunakan berbagai tools, seperti pencarian web real-time, eksekusi kode, dan analisis dokumen dalam menyelesaikkan masalah.

2. Grok 4 merajai berbagai benchmark AI

perbandingan hasil benchmark Grok 4 dengan model AI lain. (x.com/xAI)

Klaim sebagai AI tercerdas tentu perlu pembuktian, dan xAI memamerkan serangkaian hasil benchmark yang sangat mengesankan. Menurut data dari Artificial Analysis, Grok 4 berhasil memuncaki Indeks Intelijen mereka dengan skor 73. Angka ini melampaui skor para pesaingnya, yaitu o3 dari OpenAI o3 dan Gemini 2.5 Pro dari Google, yang sama-sama meraih skor 70, dilansir VentureBeat.

Pada tes akademis super sulit bernama Humanity's Last Exam (HLE), Grok 4 tampak superior. Tanpa menggunakan alat bantu, Grok 4 meraih skor 25,4 persen, mengungguli Gemini 2.5 Pro (21,6 persen) dan OpenAI o3 (21 persen). Saat Grok 4 Heavy diizinkan menggunakan alat, skornya meroket hingga 44,4 persen, jauh meninggalkan Gemini 2.5 Pro yang hanya mampu meraih 26,9 persen di kategori yang sama.

Keunggulan juga terlihat pada tes penalaran abstrak ARC-AGI-2, yang dikenal sangat sulit untuk ditaklukkan AI. Di sini, Grok 4 mencetak skor fenomenal 15,9 persen, atau hampir dua kali lipat lebih tinggi dari skor pesaing terdekatnya, Claude 4 Opus (8,6 persen). Tak hanya di ranah akademis, dalam simulasi bisnis bernama Vending-Bench, Grok 4 juga terbukti mampu mengelola bisnis virtual dengan keuntungan lebih dari dua kali lipat dibanding Claude Opus 4.

3. Kekurangan Grok 4

tampilan Grok 4 Heavy. (x.com/xAI)

Grok 4 tidak hanya unggul dalam angka, tetapi juga dibekali fitur-fitur baru. Salah satu yang diperkenalkan adalah mode suara yang lebih ekspresif dengan latensi rendah. Grok juga dikenal unggul dalam pemahaman budaya internet, meme, dan humor berkat integrasinya dengan platform X.

Namun, di balik kehebatannya, Grok 4 masih memiliki beberapa kelemahan. Dari sisi kecepatan, proses output-nya masih berada di angka 75 token per detik (tps), tertinggal dari model lain seperti Gemini 2.5 Flash (353 tps) atau OpenAI o3 (187 tps). Selain itu, context window atau kapasitas memorinya dalam satu sesi percakapan, yang sebesar 256.000 token, juga lebih kecil dibandingkan Gemini 2.5 Pro yang sudah mencapai 1 juta token.

Kemampuan multimodalnya, khususnya dalam memahami gambar dan video, juga diakui masih kurang mumpuni. Tim xAI menggambarkan kemampuan visual model ini masih seperti "mengintip melalui kaca buram". Grok dan xAI juga masih dibayangi kontroversi. Sehari sebelum rilis ini, Grok menjadi sorotan karena mengeluarkan berbagai pernyataan antisemit dan konspirasi di platform X.

4. Cara mengakses Grok 4

ilustrasi logo Grok. (unsplash.com/Mariia Shalabaieva)

Bagi yang tertarik mencoba, xAI menyediakan beberapa jalur akses. Para pengembang dapat mulai membangun aplikasi di atas Grok 4 melalui API yang telah disediakan. Sementara itu, pengguna umum dapat merasakan langsung kemampuannya lewat website dan aplikasi Grok, di Android serta iOS.

Saat ini, Grok 4 masih hanya tersedia bagi pengguna premium. Kamu bisa mengakses model ini dengan merogoh kocek mulai 30 dolar AS (sekitar Rp480 ribu) untuk langganan tier SuperGrok. Bagi kamu yang membutuhkan kekuatan maksimal dari Grok 4 Heavy, xAI meluncurkan paket langganan baru bernama SuperGrok Heavy dengan biaya 300 dolar AS (sekitar Rp4,8 jutaan) per bulan.

xAI rilis Grok 4 hanyalah awal dari serangkaian rencana besar yang akan datang. Perusahaan ini berencana merilis model AI untuk coding pada Agustus dan agen multimodal pada September. xAI juga berencana merilis model pembuat video pada Oktober mendatang. Nah, apakah kamu sudah mencoba Grok 4 dari xAI ini?

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.