Iklan - Scroll untuk Melanjutkan
Baca artikel IDN Times lainnya di IDN App
ilustrasi Claude dari Anthropic. (anthropic.com)
ilustrasi Claude dari Anthropic. (anthropic.com)

Anthropic baru saja meluncurkan Claude 3.7 Sonnet, model kecerdasan buatan (AI) yang diklaim sebagai hybrid reasoning pertama di industri. Artinya, model ini memiliki dua mode berpikir, yaitu respons cepat untuk pertanyaan sederhana dan penalaran mendalam untuk masalah kompleks. Pendekatan ini berbeda dari OpenAI yang memisahkan kedua kemampuan tersebut ke dalam model terpisah seperti GPT-4o dan o3-mini.

Claude 3.7 Sonnet merupakan penerus dari Claude 3.5 Sonnet dan menjadi model medium di jajaran produk Anthropic. Sebagai informasi, Anthropic memiliki dua varian model lain: Claude Opus sebagai model terbesar dan Haiku sebagai model paling ringan dan gesit. Mari kita pelajari lebih lanjut kecanggihan Claude 3.7 Sonnet dari Anthropic ini!

1. Claude 3.7 Sonnet mampu berpikir cepat dan mendalam

Claude 3.7 Sonnet diklaim menjadi pionir dalam model penalaran hibrida. Model ini bisa memberikan jawaban cepat untuk pertanyaan sederhana, atau bernalar lebih lama untuk memproses masalah rumit. Pengguna dapat memilih mode mana yang dibutuhkan sesuai kompleksitas pertanyaan mereka. Oleh karena itu, pengguna tidak perlu repot-repot berpindah model. 

Melansir VentureBeat, Dianne Penn selaku kepala produk dan riset Anthropic menjelaskan bahwa dua kemampuan berpikir ini seharusnya menjadi fitur dasar sebuah AI. Model AI dinilai tidak perlu dipisah menjadi dua versi berbeda hanya untuk memberikan respon cepat atau lambat. Penn mengibaratkan Claude 3.7 Sonnet seperti otak manusia yang secara alami bisa beradaptasi antara berpikir cepat atau mendalam sesuai kebutuhan.

Fitur yang juga dinamai "extended thinking" ini mampu memproses hingga 128 ribu token dalam sekali proses. Dalam mode bernalar, Claude 3.7 Sonnet akan menampilkan proses penalarannya untuk pengguna. Jadinya, pengguna dapat memahami tahapan berpikir AI ini sebelum menghasilkan jawaban final. Namun, beberapa bagian proses berpikir mungkin tidak ditampilkan karena pertimbangan keamanan.

2. Performa Claude 3.7 Sonnet menonjol di pemrograman

perbandingan hasil evaluasi Claude 3.7 Sonnet dengan model AI lain. (dok. Anthropic)

Claude 3.7 Sonnet menunjukkan performa mengesankan bahkan dalam mode standar. Saat diuji dalam benchmark SWE-bench untuk kemampuan coding, mode standar mencapai akurasi 62,3 persen, jauh melampaui OpenAI o3-mini yang hanya mencapai 49,3 persen. Model ini juga unggul dalam TAU-bench, tes yang mengukur kemampuan berinteraksi dengan tool, dengan skor 81,2 persen dibanding model o1 OpenAI yang mendapat 73,5 persen.

Saat mode penalaran diaktifkan, kemampuan Claude Sonnet 3.7 mengalami peningkatan di berbagai benchmark. Mode ini mendongkrak skor model dalam pengujian penalaran pascasarjana (GPQA Diamond) dari 68 persen menjadi 78,2 persen. Namun, Grok 3 masih unggul dalam bidang ini dengan skor 80,2 persen. Skor SWE-bench meningkat jadi 70,3 persen dan menempatkan Claude 3.7 Sonnet sebagai model paling andal dalam tugas coding. Peningkatan juga terlihat dalam tes matematika MATH 500, di mana akurasi model melonjak dari 82,2 persen menjadi 96,2 persen.

Claude sebelumnya sering mendapat kritik karena terlalu berhati-hati dan menolak banyak permintaan yang sebenarnya aman. Model terbaru Claude 3.7 Sonnet kini lebih pintar dalam menilai permintaan pengguna. Anthropic mengklaim model ini berhasil mengurangi penolakan yang tidak perlu hingga 45 persen dibanding versi sebelumnya.

Claude Sonnet telah diakui oleh industri akan kemampuan coding-nya yang superior. Berdasarkan blog Anthropic, perusahaan seperti Cursor, Cognition, Vercel, Replit, dan Canva telah menguji Claude 3.7 Sonnet. Mereka melaporkan peningkatan kemampuan Claude dalam menangani basis kode kompleks, membuat perubahan terencana, dan menghasilkan kode siap produksi dengan tingkat kesalahan minimal.

3. Anhropic juga rilis Claude Code

Claude 3.7 Sonnet kini tersedia bagi semua pengguna Claude, mulai dari paket Free, Pro, Team, hingga Enterprise. Namun, fitur penalaran hanya bisa diakses pengguna berbayar dan API. Model ini tersedia melalui API Anthropic, Amazon Bedrock, dan Google Cloud Vertex AI. Anthropic menetapkan biaya 3 dolar AS (sekitar Rp49 ribu) untuk setiap satu juta token input dan 15 dolar AS (sekitar Rp248 ribu) untuk setiap satu juta token output, termasuk token yang dipakai saat mode penalaran aktif.

Anthropic juga meluncurkan Claude Code, alat pemrograman yang bisa diakses melalui command line dan tersedia dalam versi preview. Claude Code mampu menganalisis dan mengubah kode secara langsung dari terminal. Tugas yang biasanya memakan waktu 45 menit bisa diselesaikan dalam sekali proses. Anthropic berjanji akan meningkatkan kemampuan Claude Code segera, termasuk perbaikan fungsi dasar, dukungan perintah kompleks, dan tampilan aplikasi.

Terakhir, Anthropic menghadirkan integrasi GitHub untuk semua pengguna web Claude. Para developer kini bisa menghubungkan repositori kode mereka secara langsung ke Claude. Kehadiran Claude 3.7 Sonnet dan Claude Code, ditambah integrasi GitHub ini, menunjukkan keseriusan Anthropic dalam menjawab kebutuhan developer. Nah, melihat berbagai kemampuan Claude 3.7 Sonnet ini, apakah kamu tertarik mencobanya?

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.

Editorial Team

EditorLeo Manik