Fakta Qwen3, Model AI Terbaru Alibaba yang Saingi OpenAI

06 Mei 2025, 18:28 WIB

logo Alibaba. (Mfn, CC BY-SA 4.0 , via Wikimedia Commons)

Panggung persaingan industri kecerdasan buatan (AI) kembali kehadiran model baru dari China. Alibaba baru saja meluncurkan model AI terbarunya, Qwen3, pada 28 April 2025. Model ini diklaim mampu menandingi bahkan mengungguli model AI papan atas dari OpenAI dan Google. Qwen3 hadir sebagai penerus Qwen2.5 dengan berbagai peningkatan kemampuan yang signifikan.

Melansir TechCrunch, Qwen3 tersedia dalam delapan varian berbeda. Variasi Qwen3 terdiri dari dua model MoE (Mixture of Experts) dan enam model biasa dengan ukuran mulai dari 0,6 miliar hingga 235 miliar parameter. Sebagian besar model ini bisa diunduh gratis dengan lisensi Apache 2.0 dari platform Hugging Face, ModelScope, dan GitHub. Berikut fakta-fakta menarik dari Qwen3!

1. Performa Qwen3 dibandingkan pesaing

Model utama Qwen3-235B-A22B tampil mengesankan dalam berbagai tes. Model ini berhasil mengalahkan OpenAI o1 dan DeepSeek R1 di beberapa benchmark penting. Pada tes ArenaHard, Qwen3 meraih skor 95,6, jauh di atas o1 dari OpenAI yang hanya mencapai 92,1 dan hampir menyamai Gemini 2.5 Pro dari Google dengan skor 96,4.

Kemampuan matematika Qwen3 juga patut diacungi jempol. Pada tes AIME'24, model utama Qwen3 mendapat skor 85,7, mengungguli o1 (74,3) dan DeepSeek R1 (79,8). Hasil serupa juga terlihat pada AIME'25, dengan Qwen3-235B-A22B memperoleh skor 81,5, melampaui DeepSeek R1 (70) meski masih di bawah Gemini 2.5 Pro (86,7).

Dalam hal kemampuan coding, Qwen3 tidak kalah hebat. Pada benchmark CodeForces, model utama Qwen3 meraih rating Elo 2056, mengungguli o1 (1891), DeepSeek R1 (2029), dan Gemini 2.5 Pro (2001). Bahkan pada LiveCodeBench, Qwen3-235B-A22B meraih skor 70,7, lebih tinggi dari o1 (63,9) dan DeepSeek R1 (64,3).

Model yang lebih kecil seperti Qwen3-30B-A3B juga menunjukkan efisiensi luar biasa. Model ini mampu menyaingi performa QwQ-32B dengan hanya menggunakan 10 persen parameter aktif. Bahkan Qwen3-4B, model yang jauh lebih kecil, mampu menandingi Qwen2.5-72B-Instruct yang berukuran lebih besar. Efisiensi ini membuka peluang penggunaan AI canggih pada perangkat dengan daya komputasi terbatas.

2. Fitur unggulan Qwen3

Qwen3 hadir dengan pendekatan hybrid yang cerdas. Model ini menawarkan dua mode penggunaan yang bisa disesuaikan dengan kebutuhan. Mode pertama adalah Mode Berpikir (Thinking Mode), di mana model akan memerlukan waktu untuk bernalar langkah demi langkah sebelum memberikan jawaban akhir. Mode ini sangat cocok untuk masalah rumit yang membutuhkan analisis mendalam.

Mode kedua adalah Mode Tanpa Berpikir (Non-Thinking Mode) yang memberikan jawaban cepat dan instan. Mode ini ideal untuk pertanyaan sederhana yang membutuhkan respons segera. Pengguna bisa beralih antara kedua mode ini melalui tombol di situs Qwen Chat atau dengan perintah khusus seperti /think atau /no_think saat menggunakan API model tersebut.

Dukungan bahasa yang luas menjadi nilai tambah utama Qwen3. Menurut blog Qwen, model ini mendukung 119 bahasa dan dialek dari berbagai rumpun bahasa dunia. Bahasa yang didukung mencakup Indo-Eropa, Sino-Tibet, Afro-Asiatik, Austronesia, Dravida, Turkik, dan banyak lagi. Kemampuan ini membuat Qwen3 lebih inklusif dan dapat diakses oleh pengguna global.

Teknologi MoE (Mixture of Experts) pada Qwen3 membawa efisiensi komputasi yang cukup baik. Sistem ini membagi tugas menjadi bagian-bagian kecil dan menyerahkannya ke model spesialis yang lebih kecil. Hanya parameter yang dibutuhkan yang diaktifkan, sehingga menghemat daya komputasi secara signifikan. Sebagai contoh, Qwen3-30B-A3B hanya mengaktifkan sekitar 3 miliar parameter dari total 30 miliar yang dimilikinya.

Proses pelatihan Qwen3 menggunakan data yang sangat besar yakni 36 triliun token, dua kali lipat dari pendahulunya. Data ini mencakup teks web, dokumen PDF, buku, pasangan pertanyaan-jawaban, kode program, dan data buatan AI. Pelatihan dilakukan dalam tiga tahap awal dan empat tahap lanjutan untuk membangun kemampuan bernalar hybrid.

3. Ketersediaan Qwen3

ilustrasi kecerdasan buatan (unsplash.com/Steve Johnson)

Ketersediaan Qwen3 sebagai model open source sejalan dengan semangat demokratisasi teknologi AI. Berbeda dengan beberapa model AI komersial yang aksesnya terbatas, Qwen3 bisa diunduh dan digunakan secara bebas berkat lisensi Apache 2.0. Melansir VentureBeat, tim teknis bisa mengintegrasikan model ini dengan cepat dan praktis.

Pengguna memiliki banyak pilihan cara untuk mengakses Qwen3. Model ini tersedia melalui website Qwen Chat dan aplikasi mobile untuk penggunaan langsung. Bagi developer, integrasi bisa dilakukan dengan framework seperti SGLang dan vLLM yang kompatibel dengan API OpenAI. Sementara, untuk penggunaan lokal bisa melalui platform seperti Ollama, LMStudio, MLX, llama.cpp, dan KTransformers.

Peluncuran Qwen3 terjadi di tengah meningkatnya ketegangan geopolitik terkait teknologi AI. Amerika Serikat telah memberlakukan regulasi yang membatasi akses perusahaan AI China terhadap chip pemrosesan canggih. Namun kehadiran Qwen3 sebagai model open source berkualitas tinggi membuktikan inovasi AI di China masih mampu berkembang.

Tim Qwen melihat pengembangan Qwen3 sebagai langkah penting menuju Artificial General Intelligence (AGI) dan Artificial Superintelligence (ASI). Kedepannya, tim Qwen berencana membuat model AI yang lebih pintar dengan data lebih banyak, ukuran lebih besar, dan kemampuan memahami lebih banyak input. Mereka meyakini perkembangan AI akan bergeser ke tren agen AI. Perkembangan ini diharapkan bisa memberikan manfaat nyata dalam berbagai aspek kehidupan sehari-hari.

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.