Baca artikel IDN Times lainnya di IDN App
For
You

Anthropic Rilis Claude 4.5, AI yang Bisa Coding Mandiri 30 Jam

ilustrasi Claude dari Anthropic. (anthropic.com)
ilustrasi Claude dari Anthropic. (anthropic.com)
Intinya sih...
  • Sonnet 4.5 mampu bekerja secara mandiri hingga 30 jam
  • Model AI terbaik di dunia untuk coding
  • Sonnet 4.5 juga andal di berbagai bidang ilmu
Disclaimer: This summary was created using Artificial Intelligence (AI)

Perusahaan kecerdasan buatan (AI) Anthropic merilis model terbarunya, Claude Sonnet 4.5, pada Senin (29/9/2025). Anthropic rilis Claude 4.5 yang diklaim membawa berbagai lompatan besar, terutama terkait kemampuannya untuk bekerja secara otonom. Sonnet 4.5 disebut mampu bekerja secara mandiri selama puluhan jam nonstop.

Dalam sebuah pengujian, AI ini berhasil membangun aplikasi yang cukup kompleks. Sonnet 4.5 menghasilkan ribuan baris kode secara mandiri dan menciptakan produk yang siap pakai. Berikut fakta-fakta menarik Claude Sonnet 4.5 dari Anthropic ini.

1. Sonnet 4.5 mampu bekerja secara mandiri hingga 30 jam

perbandingan hasil benchmark Claude Sonnet 4.5 dengan model AI lain
perbandingan hasil benchmark Claude Sonnet 4.5 dengan model AI lain (anthropic.com)

Claude Sonnet 4.5 diklaim mampu ngoding hingga 30 jam secara otonom, empat kali lebih lama dari pendahulunya, Claude Opus 4. Kemampuan ini sangat penting untuk tugas-tugas agentic, yaitu pekerjaan yang membutuhkan AI untuk bekerja di latar belakang dalam waktu yang lama. Dengan fokus yang panjang ini, AI bisa diandalkan untuk mengelola riset mendalam, memecahkan masalah coding yang rumit, atau menyelesaikan proyek multitahap yang kompleks.

Contohnya, Sonnet 4.5 dilaporkan berhasil membuat aplikasi obrolan yang mirip Slack dari nol. Selama proses tersebut, AI ini menulis 11 ribu baris kode, mengatur layanan database dan membeli nama domain secara mandiri. Dilansir dari TechCrunch, AI ini bahkan mampu melakukan audit keamanan SOC 2 untuk memastikan aplikasi yang dibuatnya aman untuk digunakan.

Kemampuan Sonnet 4.5 tidak hanya sebatas menulis kode, tetapi juga mengoperasikan komputer layaknya manusia. Menurut blog resmi Anthropic, AI ini bisa menavigasi browser, mengisi spreadsheet, dan menyelesaikan berbagai tugas di berbagai aplikasi software. Sonnet 4.5 mencatat skor 61,4 persen di benchmark OSWorld, sebuah tes yang mengukur kemampuan AI dalam menggunakan komputer untuk tugas di dunia nyata.

Sonnet 4.5 dibekali dua mode kerja yang bisa dipilih pengguna. Mode standar dirancang untuk memberikan respons yang cepat, cocok untuk tugas-tugas ringan sehari-hari. Sementara itu, mode "extended thinking" memungkinkan AI berpikir lebih dalam dan bertahap untuk menghasilkan jawaban yang lebih akurat, meski butuh waktu lebih lama.

2. Model AI terbaik di dunia untuk coding

perbandingan kemampuan software engineering Claude Sonnet 4.5 dengan model AI lain
perbandingan kemampuan software engineering Claude Sonnet 4.5 dengan model AI lain (anthropic.com)

Anthropic dengan percaya diri mengklaim Sonnet 4.5 sebagai model AI terbaik di dunia untuk coding dan penggunaan komputer. Model ini mencatat skor tertinggi 77,2 persen pada benchmark SWE-bench Verified, sebuah tes kemampuan rekayasa perangkat lunak. Menurut ZDNet, pencapaian ini membuatnya berhasil mengungguli model-model pesaing ternama seperti GPT-5 dari OpenAI dan Gemini 2.5 Pro dari Google.

Tak hanya itu, Sonnet 4.5 juga menunjukkan keahlian khusus di bidang-bidang yang membutuhkan pengetahuan mendalam. Model ini memiliki pemahaman domain yang jauh lebih baik di sektor keamanan siber, analisis keuangan, dan riset ilmiah dibandingkan pendahulunya. Dilansir ZDNET, para ahli dari berbagai bidang yang telah mencobanya mengakui adanya peningkatan dramatis dalam penalaran dan pengetahuan spesifik model ini.

Keunggulannya juga diakui oleh para pengguna awal dari perusahaan teknologi besar yang telah mencoba model ini. Perusahaan seperti Canva, GitHub, dan Cursor memuji peningkatan kecerdasan dan kecepatan model ini untuk tugas-tugas kompleks. Raksasa teknologi seperti Apple dan Meta juga telah menggunakan model-model Claude secara internal untuk kebutuhan mereka.

CEO Cursor, Michael Truell, menyatakan bahwa Sonnet 4.5 merupakan model coding termutakhir, terutama untuk tugas jangka panjang. Sementara itu, Kepala Produk AI di Canva, Danny Wu, menyebut model ini terasa lebih cerdas dan sangat membantu dalam pengembangan fitur untuk ratusan penggunanya. Pujian serupa datang dari Netflix, yang memuji kemampuan Sonnet 4.5 dalam debugging kode sehingga meningkatkan kecepatan produksi mereka.

3. Sonnet 4.5 juga andal di berbagai bidang ilmu

Di bidang perkantoran, Sonnet 4.5 dapat berfungsi layaknya staf yang andal untuk tugas-tugas bisnis. AI ini mampu membuat dan menyunting berbagai dokumen seperti slide presentasi, spreadsheet, dan dokumen teks secara langsung dari percakapan. Selain itu, ia juga bisa membantu menganalisis data dari dasbor, menulis laporan status, hingga menjadwalkan rapat dengan memeriksa kalender banyak orang, dilansir The Verge.

Kegunaannya meluas ke sektor-sektor yang lebih spesifik dan menuntut akurasi tinggi. Dalam bidang keamanan siber, agen AI yang ditenagai Sonnet 4.5 bisa secara otonom menemukan dan menambal celah keamanan sebelum dieksploitasi. Di sektor keuangan, model ini dapat melakukan analisis prediktif hingga memantau perubahan regulasi global secara terus-menerus untuk menjaga kepatuhan.

Salah satu contoh penggunaan menarik datang dari Dianne Penn, seorang manajer produk di Anthropic sendiri. Ia menggunakan Sonnet 4.5 untuk membantunya dalam proses rekrutmen karyawan baru. AI tersebut diminta untuk menjelajahi internet, mencari kandidat dengan kriteria tertentu, lalu menyusun hasilnya dalam sebuah spreadsheet lengkap dengan profil LinkedIn mereka.

Sonnet 4.5 juga diklaim mampu membangun aplikasi yang benar-benar siap produksi. Kemampuan ini diharapkan dapat membantu developer untuk mempercepat pengembangan produk secara signifikan.

4. Sudah tersedia di berbagai platform

ilustrasi kecerdasan buatan (unsplash.com/Steve Johnson)
ilustrasi kecerdasan buatan (unsplash.com/Steve Johnson)

Kabar baiknya, Claude Sonnet 4.5 sudah bisa diakses oleh publik secara luas sejak hari peluncurannya. Pengguna bisa mencobanya melalui chatbot di situs Claude.ai, aplikasi iOS dan Android, serta melalui API untuk para developer. Model ini juga tersedia di platform cloud populer seperti Amazon Bedrock dan Google Cloud Vertex AI.

Menariknya, Anthropic tidak menaikkan harga untuk model yang lebih cerdas ini. Harganya tetap sama dengan versi sebelumnya, yaitu 3 dolar AS (sekitar Rp50 ribu) per satu juta token input dan 15 dolar AS (sekitar Rp250 ribu) per satu juta token output. Ini membuat Sonnet 4.5 menjadi pilihan yang menarik bagi pengguna yang ingin mencari keseimbangan antara performa dengan harga.

Bersamaan dengan model baru, Anthropic juga merilis serangkaian alat bantu untuk para developer. Salah satunya adalah Claude Agent SDK, sebuah toolkit yang berisi infrastruktur yang sama dengan yang digunakan untuk membangun produk andalan Anthropic, Claude Code. Dengan SDK ini, para developer kini bisa lebih mudah menciptakan agen-agen AI canggih mereka sendiri untuk berbagai keperluan.

Produk Claude Code juga mendapatkan pembaruan signifikan, termasuk fitur checkpoints yang sangat dinantikan. Fitur ini memungkinkan pengguna menyimpan proses pekerjaan mereka dan kembali ke versi sebelumnya jika terjadi kesalahan. Selain itu, antarmuka terminalnya diperbarui, ekstensi VS Code dirilis, dan kemampuan membuat file seperti spreadsheet kini tersedia untuk semua pengguna berbayar.

5. Peningkatan kepatuhan dibanding model sebelumnya

Selain performa, Anthropic rilis Claude 4.5 dengan sangat memperhatikan aspek keamanan dan etika pada Sonnet 4.5. Mereka menyebutnya sebagai model paling selaras (aligned), yang berarti AI ini lebih patuh pada instruksi manusia dan tujuan yang diinginkan. Perilaku buruk seperti kecenderungan berbohong atau kepatuhan berlebih (sycophancy) telah berhasil dikurangi secara substansial.

Dari sisi keamanan teknis, model ini telah diperkuat untuk melawan serangan prompt injection, salah satu kerentanan serius pada sistem AI saat ini. Sonnet 4.5 dirilis di bawah kerangka AI Safety Level 3 (ASL-3), yang mencakup filter untuk mendeteksi dan mencegah input atau output berbahaya. Filter ini dirancang untuk menangani topik sensitif seperti yang berkaitan dengan senjata kimia, biologi, dan nuklir.

Peluncuran ini terjadi di tengah persaingan industri AI yang semakin ketat antara Anthropic, OpenAI, Google, dan pemain besar lainnya. Sonnet 4.5 sendiri bahkan dirilis kurang dari dua bulan setelah model terakhir dari Anthropic, Opus 4.1. Model-model AI baru bermunculan hampir setiap bulan, sehingga setiap perusahaan sulit untuk mempertahankan keunggulannya dalam waktu lama. Namun, Anthropic saat ini masih mendominasi pasar coding dengan pangsa pasar 42 persen, dua kali lipat dari OpenAI.

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Debby Utomo
EditorDebby Utomo
Follow Us

Latest in Tech

See More

Cara Menyembunyikan DM di Instagram agar Privasi Terjamin

02 Okt 2025, 18:28 WIBTech