Baca artikel IDN Times lainnya di IDN App
For
You

Anthropic Rilis Claude 3.5 Haiku dan Fitur Computer Use    

demo fitur computer use dari Claude. (dok. Anthropic)
demo fitur computer use dari Claude. (dok. Anthropic)
Intinya sih...
  • Anthropic merilis model AI terbaru, Claude 3.5 Sonnet dan Claude 3.5 Haiku dengan fitur "computer use" yang memungkinkan AI mengoperasikan komputer seperti manusia.
  • Peningkatan performa Claude 3.5 Sonnet di berbagai tes membuatnya menjadi model AI dengan skor tertinggi di antara yang lain, sementara Claude 3.5 Haiku mampu menyamai performa Claude 3 Opus.
  • "Computer use" memungkinkan AI melakukan aktivitas dasar hingga kompleks seperti pengisian formulir online dan pengevaluasian aplikasi, namun masih dalam tahap eksperimental dan perlu perhatian keamanan.

Anthropic kembali menggebrak dunia kecerdasan buatan (AI) setelah merilis dua model terbarunya pada, Kamis (24/10/2024). Perusahaan ini menghadirkan upgrade untuk Claude 3.5 Sonnet dan memperkenalkan model baru bernama Claude 3.5 Haiku. Menariknya, kedua model ini hadir dengan fitur revolusioner bernama "computer use" yang memungkinkan AI mengoperasikan komputer layaknya manusia.

Melansir situs resmi Anthropic, fitur "computer use" masih dalam tahap beta publik. Meski begitu, fitur ini sudah memungkinkan AI untuk melakukan berbagai aktivitas dasar, seperti melihat layar, menggerakkan kursor, mengklik tombol, dan mengetik teks. Claude 3.5 Sonnet tercatat sebagai model AI frontier pertama yang menawarkan kemampuan ini kepada publik. Mari simak lebih detail mengenai berbagai inovasi terbaru dari Anthropic dalam artikel berikut!

1. Claude 3.5 Sonnet kini lebih pintar dalam coding

Peningkatan terbaru membuat Claude 3.5 Sonnet semakin andal dalam berbagai tugas, terutama coding. Menurut Anthropic, model ini mengalami peningkatan performa di SWE-bench Verified dari 33,4 persen menjadi 49 persen. Pencapaian ini bikin Claude 3.5 Sonnet sebagai model dengan skor tertinggi di antara semua model AI yang tengah tersedia untuk publik.

Peningkatan performa Claude 3.5 Sonnet juga terlihat dalam pengujian oleh GitLab. Perusahaan ini melaporkan bahwa model terbaru menunjukkan kemampuan penalaran yang lebih kuat hingga 10 persen tanpa ada tambahan waktu proses. Selain itu, Claude 3.5 Sonnet juga mencatatkan peningkatan performa di TAU-bench, sebuah tes untuk kemampuan penggunaan tools. Skor model ini naik dari 62,6 persen menjadi 69,2 persen untuk tugas terkait retail dan dari 36 persen menjadi 46 persen untuk tugas bidang penerbangan yang lebih menantang.

2. Rilis Claude 3.5 Haiku, model AI tercepat dari Anthropic

Perbandingan hasil evaluasi Claude Haiku 3.5 dengan model lain di kelasnya. (dok. Anthropic)
Perbandingan hasil evaluasi Claude Haiku 3.5 dengan model lain di kelasnya. (dok. Anthropic)

Claude 3.5 Haiku hadir sebagai generasi terbaru dari model tercepat Anthropic. Menariknya, bermodal biaya dan kecepatan yang setara dengan generasi Haiku sebelumnya, model ini mampu menyamai performa Claude 3 Opus yang merupakan model terbesar dari generasi sebelumnya. Dalam pengujian coding, Claude 3.5 Haiku mencatatkan skor 40,6 persen di SWE-bench Verified. Ia mengalahkan banyak model AI publik termasuk versi awal Claude 3.5 Sonnet.

Model ini dirancang khusus untuk aplikasi yang membutuhkan respons cepat dan akurat. Dengan latensi rendah dan kemampuan mengikuti instruksi yang lebih baik, Claude 3.5 Haiku sangat cocok untuk produk yang berhadapan langsung dengan pengguna. Anthropic berencana merilis Claude 3.5 Haiku akhir bulan ini melalui API Anthropic, Amazon Bedrock, dan Google Cloud Vertex AI. Awalnya, model ini akan tersedia untuk teks saja, sementara kemampuan input gambar akan menyusul kemudian.

3. Claude kini bisa pakai komputer seperti manusia

Anthropic membuat terobosan dengan menghadirkan "computer use", sebuah fitur yang mengajarkan AI untuk menggunakan komputer seperti manusia. Sebagai contoh, Claude kini bisa membantu mengisi formulir online dengan mengambil data dari spreadsheet, mencari informasi di internet, hingga menggabungkan data tersebut secara otomatis. Perusahaan seperti Replit bahkan menggunakan kemampuan ini untuk mengevaluasi aplikasi yang sedang dikembangkan.

Dalam pengujian di OSWorld, platform yang mengevaluasi kemampuan AI menggunakan komputer, Claude 3.5 Sonnet mencatatkan skor 14,9 persen untuk kategori screenshot-only. Angka ini jauh melampaui sistem AI lain yang hanya mencapai 7,8 persen. Meski begitu, Anthropic mengakui bahwa fitur ini masih dalam tahap eksperimental dan terkadang masih mengalami kesalahan. Beberapa tindakan yang mudah bagi manusia, seperti menggulir, menyeret, dan memperbesar tampilan masih menjadi tantangan bagi Claude.

Anthropic memastikan pengembangan "computer use" tetap memperhatikan aspek keamanan. Pasalnya, fitur ini berisiko disalahgunakan untuk hal buruk, misalnya menyebarkan spam secara masif. Karena itu, Anthropic telah mengembangkan sistem khusus untuk mendeteksi dan mencegah penyalahgunaan fitur ini.

Berbekal inovasi ini, masa depan interaksi antara manusia dan AI tampaknya akan semakin menarik. Bagaimana menurutmu? Apakah kamu tertarik mencoba kemampuan baru dari Claude atau justru kamu merasa fitur ini seharusnya tidak dibuat sama sekali?

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.
Share
Editor’s Picks
Topics
Editorial Team
Leo Manik
EditorLeo Manik
Follow Us