Meta Luncurkan Llama 3.1, Model AI Open Source Tercanggih di Dunia

28 Jul 2024, 17:28 WIB

Leo Manik

News

Channel

Add as Preferred source

Meta Luncurkan Llama 3.1, Model AI Open Source Tercanggih di Dunia

logo Meta. (unsplash.com/Mariia Shalabaieva)

Meta kembali menggemparkan dunia kecerdasan buatan (AI) dengan meluncurkan Llama 3.1, serangkaian model AI open source yang diklaim tercanggih hingga saat ini. Keluarga Llama 3.1 hadir dalam tiga varian, yakni 8B, 70B, dan yang terbesar, 405B. Dengan kemampuan yang diklaim menyaingi bahkan melampaui model-model AI terkemuka seperti GPT-4o dari OpenAI dan Claude 3.5 Sonnet dari Anthropic, Llama 3.1 menandai era baru dalam perkembangan AI open source.

Langkah berani Meta ini berpotensi mengubah lanskap AI global secara signifikan. Llama 3.1 menjanjikan akses yang lebih luas terhadap teknologi AI canggih bagi para pengembang dan peneliti di seluruh dunia. Mau tahu informasi lebih lanjut dari Meta luncurkan Llama 3.1? Berikut penjelasan terkait kemampuan, fitur dan manfaat dari Llama 3.1 besutan Meta ini!

1. Llama 3.1 405B jadi raksasa AI open source

Llama 3.1 405B menjadi sorotan utama dalam peluncuran ini sebagai model AI open source terbesar yang pernah ada. Melansir dari blog resmi Meta, dengan 405 miliar parameter, model ini dilatih menggunakan lebih dari 16.000 GPU Nvidia H100. Ini merupakan sebuah investasi yang luar biasa dalam sumber daya komputasi. Dataset pelatihannya mencapai 15 triliun token, setara dengan sekitar 750 miliar kata dan mencakup data hingga tahun 2024.

Kemampuan Llama 3.1 405B sungguh mengesankan dengan jendela konteks 128.000 token, setara dengan buku setebal 50 halaman. Ini memungkinkan model untuk memahami dan mengolah teks yang sangat panjang, membuka peluang baru dalam analisis dokumen dan percakapan kompleks. Model ini mendukung delapan bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai, menjadikannya alat yang sangat berguna untuk komunikasi lintas budaya dan analisis teks multibahasa.

Dalam hal performa, Meta mengklaim bahwa Llama 3.1 405B mengungguli GPT-4 dalam beberapa benchmark dan menunjukkan "hasil campuran" dibandingkan dengan GPT-4o dan Claude 3.5 Sonnet. Secara spesifik, model ini lebih unggul dalam eksekusi kode dan pembuatan plot dibandingkan GPT-4o, meskipun kemampuan multibahasanya secara keseluruhan lebih lemah. Dibandingkan dengan Claude 3.5 Sonnet, Llama 3.1 405B masih tertinggal dalam pemrograman dan penalaran umum.

Llama 3.1 405B juga dilengkapi dengan kemampuan menggunakan alat pihak ketiga. Model ini dapat memanfaatkan Brave Search untuk menjawab pertanyaan tentang peristiwa terkini, API Wolfram Alpha untuk query terkait matematika dan sains, serta interpreter Python untuk memvalidasi kode. Kemampuan ini membuat Llama 3.1 405B menjadi alat yang sangat serbaguna untuk berbagai aplikasi AI.

Meskipun sangat kuat, Llama 3.1 405B memiliki kebutuhan sumber daya yang besar. Meta merekomendasikan penggunaan setidaknya satu node server untuk menjalankan model ini, yang mungkin menjadi pertimbangan bagi pengembang atau perusahaan yang ingin menggunakannya secara langsung. Namun, Meta mengklaim bahwa biaya operasional Llama 3.1 405B hanya sekitar setengah dari GPT-4o milik OpenAI, menjadikannya pilihan yang lebih ekonomis untuk aplikasi skala besar.

2. Varian yang lebih kecil ada Llama 3.1 8B dan 70B

perbandingan hasil evaluasi Llama 3.1 405B dengan model AI lain. (ai.meta.com)

Selain model raksasa 405B, Meta juga merilis Llama 3.1 8B dan 70B, yang mengalami peningkatan signifikan dari pendahulunya. Kedua model ini memiliki jendela konteks 128.000 token dan mendukung delapan bahasa seperti versi 405B.

Llama 3.1 8B, dengan hanya 8 miliar parameter, dirancang untuk tugas yang memerlukan respons cepat. Meskipun kemampuannya tidak seluas model yang lebih besar, Llama 3.1 8B tetap kompetitif dalam tugas-tugas dasar yang lebih sederhana. Sementara itu, Llama 3.1 70B menawarkan keseimbangan antara kecerdasan dan kecepatan respons. Dengan 70 miliar parameter, model ini mampu menangani tugas-tugas yang lebih kompleks dari varian 8B.

Dalam hal performa, Meta melakukan evaluasi ekstensif menggunakan lebih dari 150 dataset benchmark yang mencakup berbagai bahasa. Hasilnya menunjukkan bahwa Llama 3.1 70B dan 8B kompetitif dengan model-model tertutup dan terbuka yang memiliki jumlah parameter serupa. Namun, perlu dicatat bahwa evaluasi ini dilakukan oleh Meta sendiri, dan validasi independen masih diperlukan untuk mengkonfirmasi klaim-klaim ini.

Aplikasi potensial untuk model-model yang lebih kecil ini sangat beragam. Llama 3.1 8B dan 70B dapat digunakan untuk pengembangan asisten virtual, sistem tanya-jawab otomatis dan pemrograman. Keunggulan utama mereka adalah efisiensi dan fleksibilitas. Ini memungkinkan pengembang untuk menyesuaikan model dengan kebutuhan spesifik mereka tanpa memerlukan sumber daya komputasi yang terlalu besar.

3. Llama 3.1 bersifat open source dan tersedia luas

perbandingan hasil evaluasi Llama 3.1 8B dan 70B dengan model AI lain. (ai.meta.com)

Langkah Meta merilis Llama 3.1 sebagai model open source menunjukkan komitmen perusahaan terhadap demokratisasi AI. Open source dalam konteks ini berarti bahwa kode sumber dan bobot model tersedia untuk diakses dan dimodifikasi oleh siapa saja. Ini membuka peluang bagi peneliti, pengembang, dan perusahaan untuk menggunakan, mempelajari, dan bahkan meningkatkan model sesuai kebutuhan mereka.

Mark Zuckerberg, CEO Meta, dalam sebuah surat terbuka menyatakan keyakinannya bahwa model AI open source akan melampaui model-model tertutup. Ia membandingkan potensi ini dengan dominasi Linux di dunia teknologi saat ini. Zuckerberg berpendapat bahwa pendekatan open source akan memastikan lebih banyak orang di seluruh dunia memiliki akses ke manfaat dan peluang AI. Hal ini dilakukan untuk mencegah konsentrasi kekuatan di tangan segelintir pihak.

Model-model Llama 3.1 tersedia untuk diunduh di situs resmi Meta (llama.meta.com) dan platform Hugging Face. Pengembang dapat mengunduh bobot model dan menggunakannya sesuai kebutuhan mereka. Selain itu, Meta bekerja sama dengan lebih dari 25 perusahaan terkenal seperti AWS, Microsoft Azure, Google Cloud, NVIDIA, Databricks, Snowflake, dan lainnya untuk menyediakan layanan berbasis Llama 3.1 sejak hari pertama peluncuran.

Meta mendukung aksesibilitas Llama 3.1 melalui beberapa inisiatif. Mereka merilis "sistem referensi" dengan aplikasi contoh dan komponen baru, termasuk Llama Guard 3 untuk keamanan multibahasa dan Prompt Guard untuk menyaring masukan yang tidak diinginkan. Meta juga mengusulkan "Llama Stack", standar antarmuka untuk pengembangan alat dan aplikasi AI. Semua ini bertujuan memudahkan pengembang menggunakan Llama 3.1 dalam proyek mereka.

4. Rencana Meta kedepannya terkait Llama 3.1

tampilan meta.ai (ai.meta.com)

Peluncuran Llama 3.1 hanyalah awal dari visi jangka panjang Meta untuk AI. Perusahaan tersebut juga sedang mengembangkan model Llama yang dapat mengenali gambar, video, serta memahami dan menghasilkan suara. Langkah awal sudah diambil dengan memperkenalkan "Imagine Me", fitur yang memungkinkan pengguna menyisipkan kemiripan mereka ke dalam gambar yang dihasilkan AI.

Meta AI, asisten berbasis Llama, akan tersedia di lebih banyak negara dan bahasa. Mark Zuckerberg bahkan memprediksi Meta AI akan menjadi asisten yang paling banyak digunakan pada akhir tahun ini, melampaui ChatGPT. Ini adalah klaim yang ambisius mengingat dominasi ChatGPT saat ini, namun menunjukkan kepercayaan diri Meta terhadap potensi Llama 3.1.

Dengan Meta luncurkan Llama 3.1, perusahaan teknologi tersebut telah mengambil langkah besar dalam demokratisasi teknologi AI. Seri model ini menjanjikan era baru di mana AI mutakhir tidak lagi eksklusif untuk perusahaan-perusahaan besar, tapi bisa diakses dan dikembangkan oleh komunitas luas. Menarik untuk melihat bagaimana Llama 3.1 akan membentuk lanskap AI di masa depan, dan apakah prediksi Mark Zuckerberg tentang dominasi Meta AI akan terwujud.

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.