5 Fakta Menarik Claude 4, Model AI Paling Cerdas dari Anthropic

- Anthropic meluncurkan Claude 4, model AI terbaru pada Kamis (22/5/2025)
- Claude 4 memiliki dua versi, yaitu Sonnet 4 dan Opus 4 dengan keunggulan masing-masing
- Sonnet 4 cocok untuk tugas umum, sedangkan Opus 4 lebih unggul untuk coding tingkat lanjut
Anthropic baru saja meluncurkan Claude 4 pada, Kamis (22/5/2025). Kehadirannya menambah panasnya persaingan di dunia kecerdasan buatan (AI). Perusahaan ini merilis dua versi sekaligus, yaitu Claude Opus 4 dan Sonnet 4. Keduanya merupakan model AI tercerdas yang pernah dirilis Anthropic.
Claude 4 diklaim punya kemampuan coding dan penalaran yang lebih baik dari pendahulunya. Menariknya, Sonnet 4 bisa diakses secara gratis oleh semua orang, sementara Opus 4 khusus untuk pengguna berbayar. Yuk, telusuri deretan fakta menarik dari model AI terbaru Anthropic ini!
1. Claude 4 hadir dalam dua varian

Melansir DataCamp, Claude 4 hadir dalam dua varian yang bisa disesuaikan dengan kebutuhan pengguna. Sonnet 4 dirancang untuk penggunaan sehari-hari dengan performa yang seimbang antara kecepatan dan kecerdasan. Model ini cocok untuk tugas umum seperti menulis, coding, menjawab pertanyaan, atau analisis dokumen.
Opus 4 adalah versi premium yang ditujukan untuk pekerjaan kompleks. Model ini lebih unggul untuk coding tingkat lanjut, riset mendalam, dan tugas yang butuh penalaran panjang. Namun, Opus 4 lebih lambat dan mahal dibanding Sonnet 4. Kalau kamu menggunankannya lewat website Claude, Opus 4 bisa menguras limit harianmu lebih cepat.
Kedua model hadir dengan dua mode berpikir. Pertama, mode biasa yang bisa merespons lebih cepat untuk pertanyaan atau tugas ringan. Sementara, mode "extended thinking" cocok untuk tugas berat dan kompleks, namun, membutuhkan waktu respons lebih lama. Opus dan Sonnet 4 sama-sama memiliki jendela konteks hingga 200 ribu token. Sementara, Opus 4 mampu menghasilkan output hingga 64 ribu token.
2. Opus 4 Diklaim sebagai AI terbaik untuk coding

Selama ini, model-model Anthropic seperti 3.5 dan 3.7 Sonnet telah menjadi favorit para programmer. Namun, akhir-akhir ini posisi ini mulai diganggu oleh Gemini 2.5 Pro dari Google dan o3 dari OpenAI. Kali ini, Anthropic berusaha mempertahankan keunggulannya dan mengklaim Opus 4 sebagai model terbaik di dunia untuk coding.
Klaim ini bukan hanya bualan tanpa dasar. Claude Opus 4 mencapai skor 72,5 persen pada benchmark SWE-bench Verified yang mengukur kemampuan coding. Sebagai perbandingan, o3 hanya meraih 69,1 persen dan Gemini 2.5 Pro dengan 63,2 persen. Menariknya, Sonnet 4 malah sedikit lebih tinggi dari Opus dengan skor 72,7 persen.
Keunggulan juga terlihat pada Terminal-bench yang juga menguji kemampuan coding. Opus 4 memimpin dengan skor 43,2 persen dan Sonnet 4 dengan 35,5 persen. Keduanya mengalahkan o3 (30,2 persen) dan Gemini 2.5 Pro (25,3 persen).
Namun, di AIME 2025, untuk tolok ukur kemampuan matematika, Opus 4 hanya meraih skor 75,5 persen dan Sonnet 4 dengan 70,5 persen. Angka ini kalah dari o3 (88,9 persen) dan Gemini 2.5 Pro (83 persen). Keduanya juga kalah unggul dalam benchmark MMMU untuk penalaran visual. Tapi, sebaiknya pengguna jangan terlalu berpatok pada benchmark dan bisa mencoba langsung untuk menyesuaikan kebutuhan masing-masing.
3. Opus 4 mampu bekerja hingga 7 jam secara mandiri

Melansir VentureBeat, Opus 4 menunjukkan kemampuan yang menonjol dalam tugas agentic. Perusahaan teknologi Rakuten melakukan tes dengan memberikan proyek refactoring kode besar kepada model ini. Hasilnya mengejutkan, Opus 4 mampu bekerja mandiri selama hampir 7 jam.
Beberapa perusahaan teknologi memberikan testimoni positif setelah mencoba model ini. Menurut Cursor, kemampuan Opus 4 menunjukkan lompatan besar dalam memahami kode kompleks. Sementara itu, Block menyatakan Opus 4 adalah model pertama yang benar-benar bisa meningkatkan kualitas kode saat editing dan debugging.
4. Claude 4 bisa menggunakan tool sambil berpikir

Claude 4 memperkenalkan kemampuan baru bernama "extended thinking with tool use" yang memungkinkan model menggunakan berbagai alat sambil melakukan penalaran. Berbeda dengan pendahulunya, Claude 4 bisa bergantian antara tool dan bernalar secara fleksibel dalam satu waktu. Misalnya saat menganalisis topik kompleks, model ini bisa berhenti sejenak untuk mencari informasi tambahan via web search, lalu melanjutkan analisisnya dengan data baru tersebut.
Namun, kemampuan semacam ini sebenarnya bukan hal baru. Model o3 dari OpenAI sudah terlebih dulu punya kemampuan serupa. Opus 4 dibanderol 15 dolar AS (sekitar 243 ribu rupiah) per satu juta input token dan 75 dolar AS (sekitar 1,2 juta rupiah) per satu juta output token. Sementara, Sonnet 4 lebih terjangkau dengan harga 3 dolar AS (sekitar 48 ribu rupiah) dan 15 dolar AS (sekitar 230 ribu rupiah) per satu juta token.
5. Anthropic terapkan keamanan ekstra untuk Opus 4

ASL-3 atau AI Safety Level 3 adalah standar keamanan Anthropic untuk model AI yang berisiko berbahaya. Anthropic mengaktifkan ASL-3 untuk model yang bisa secara substansial meningkatkan kemampuan seseorang dengan latar belakang STEM untuk memperoleh atau memproduksi senjata berbahaya. Opus 4 adalah model pertama Anthropic yang masuk kategori ini, sebelumnya semua model mereka hanya masuk ASL-2. Apollo Research bahkan sempat merekomendasikan untuk tidak merilis versi awal model ini.
Sebenarnya, Anthropic sendiri belum sepenuhnya yakin apakah Opus 4 benar-benar membutuhkan proteksi ASL-3. Namun, mereka menerapkannya sebagai tindakan pencegahan. Opus 4 dilengkapi pengamanan ekstra seperti sistem deteksi konten berbahaya dan pertahanan siber berlapis. Langkah ini dimaksudkan untuk membatasi risiko penyalahgunaan Claude. Kalau kamu sedang mencari alternatif ChatGPT, mungkin kamu bisa mempertimbangkan Claude ini.