5 Fakta Menarik Llama 3, Model AI Open Source Terbaru dari Meta

20 Apr 2024, 09:37 WIB

Leo Manik

News

Channel

Add as Preferred source

5 Fakta Menarik Llama 3, Model AI Open Source Terbaru dari Meta

logo perusahaan Meta (unsplash.com/Dima Solomin)

Meta, perusahaan induk Facebook, baru saja meluncurkan generasi terbaru model AI open source mereka yang diberi nama Llama 3. Model ini merupakan penerus dari Llama 2 yang dirilis tahun 2023 lalu dengan berbagai peningkatan kemampuan. Saat ini, Llama 3 tersedia dalam dua varian, yaitu Llama 3 8B dan Llama 3 70B.

Menariknya, Meta mengklaim bahwa Llama 3 merupakan model AI terbaik di kelasnya yang mampu mengungguli model populer seperti GPT-3.5 dari OpenAI serta Claude dari Anthropic. Sifatnya yang open source juga membuat komunitas AI antusias dengan perilisan ini.

1. Unggul dalam berbagai uji kemampuan standar

Dalam dunia AI, kemampuan sebuah model biasanya diukur melalui berbagai uji kemampuan baku yang disebut benchmark. Meta dengan bangga menyatakan bahwa Llama 3 8B, varian dengan 8 miliar parameter, berhasil mengungguli beberapa model lain yang setara, seperti Mistral 7B dan Gemma 7B. Keunggulan Llama 3 8B terlihat di setidaknya 9 benchmark, termasuk MMLU untuk menilai pengetahuan umum, ARC untuk mengukur kemampuan pemecahan masalah, dan DROP untuk menguji pemahaman bacaan.

Lebih mengesankan lagi, Llama 3 70B, varian dengan 70 miliar parameter diklaim mampu bersaing dengan model-model AI terbaik saat ini. Beberapa model tersebut seperti Gemini 1.5 Pro dari Google dan Claude 3 Sonnet dari Anthropic. Bahkan, pada beberapa benchmark seperti MMLU, HumanEval (mengukur kemampuan pemrograman), dan GSM-8K (menguji keterampilan matematika), Llama 3 70B dilaporkan unggul dari kedua model tersebut. Hal menarik lainnya adalah Meta juga mengembangkan serangkaian uji kemampuan mereka sendiri untuk membandingkan performa Llama 3 70B dengan model-model lainnya. Dalam uji ini, Llama 3 70B dilaporkan unggul dalam berbagai tugas, mulai dari pemrograman, penulisan kreatif, hingga meringkas teks.

2. Kualitas dan kuantitas data latih yang ditingkatkan

perbandingan benchmark Llama 3 dengan model AI lain. (ai.meta.com)

Seperti halnya manusia yang belajar dari pengalaman, kemampuan suatu AI juga sangat dipengaruhi oleh kualitas dan kuantitas data yang digunakan saat proses pelatihan. Dalam pengembangan Llama 3, Meta menggunakan dataset yang jauh lebih besar dibandingkan versi sebelumnya; peningkatan hingga 7 kali lipat. Total data yang digunakan untuk melatih Llama 3 setara dengan 750 miliar kata, suatu jumlah yang luar biasa besar.

Tak hanya dari segi kuantitas, data latih Llama 3 juga lebih beragam. Misalnya, porsi data yang mengandung kode komputer meningkat hingga 4 kali lipat dibandingkan Llama 2. Selain itu, terdapat pula data dalam 30 bahasa selain bahasa Inggris yang mencakup 5 persen dari total data latih. Untuk memastikan Llama 3 belajar dari contoh-contoh terbaik, Meta juga mengembangkan sistem khusus yang dapat menyaring dan memilih data berkualitas tinggi secara otomatis.

3. Arsitektur model dan metode pelatihan yang disempurnakan

hasil tes benchmark Llama 3 400B. (ai.meta.com)

Dalam mengembangkan Llama 3, Meta tidak hanya berfokus pada peningkatan kuantitas data, tetapi juga kualitas arsitektur model dan metode pelatihan. Salah satu inovasi yang diterapkan adalah sistem encoding kata yang lebih efisien untuk mengubah teks menjadi representasi numerik yang dapat diproses oleh AI. Teknik attention, yang berperan dalam menentukan bagian mana dari data yang perlu mendapat perhatian lebih, juga dioptimasi untuk meningkatkan performa Llama 3.

Proses fine-tuning, yaitu pengaturan akhir model AI agar dapat mengikuti instruksi dengan lebih baik, juga mendapatkan sentuhan inovasi. Sejumlah metode mutakhir dipadukan untuk menghasilkan model yang lebih terampil dan fleksibel. Tak hanya dari sisi algoritma, Meta juga mengembangkan hardware dan software yang mendukung proses pelatihan Llama 3. Hasilnya, waktu yang dibutuhkan untuk melatih Llama 3 menjadi 3 kali lebih singkat dibandingkan pendahulunya.

4. Peningkatan sistem keamanan

Seiring dengan meningkatnya kemampuan Llama 3, Meta juga semakin menekankan pentingnya aspek keamanan dan tanggung jawab dalam mengembangkan AI. Untuk mendeteksi konten berbahaya yang mungkin dihasilkan oleh Llama 3, Meta menghadirkan dua perangkat canggih yaitu Llama Guard 2 dan CyberSecEval 2. Kedua perangkat ini juga dapat mengenali potensi celah keamanan siber dalam sistem AI.

Meta tidak hanya fokus pada konten berbahaya, tetapi juga pada kode yang mungkin berdampak negatif. Code Shield adalah perangkat terbaru dari Meta yang berfungsi sebagai filter pintar untuk mengenali dan mencegah kode berbahaya yang dapat dihasilkan oleh Llama 3. Sebagai pelengkap, Meta juga merilis panduan komprehensif bertajuk Responsible Use Guide yang memuat praktik-praktik terbaik dalam menerapkan AI secara etis dan bertanggung jawab.

5. Meta sedang melatih Llama 3 400B

tampilan meta.ai (ai.meta.com)

Meta berkomitmen untuk terus mengembangkan Llama 3 agar makin canggih dan bermanfaat. Dalam waktu dekat, Meta berencana untuk menyediakan Llama 3 di berbagai platform cloud terkenal dan penyedia API model AI. Untuk saat ini, Llama 3 telah dapat diakses di meta.ai. Namun, platform ini belum tersedia untuk pengguna di Indonesia.

Di balik layar, tim Meta sedang sibuk mengembangkan model Llama 3 dengan skala yang jauh lebih besar. Saat ini, mereka tengah melatih model dengan lebih dari 400 miliar parameter; jauh melampaui varian Llama 3 70B. Varian mendatang diharapkan akan memiliki kemampuan yang semakin canggih, seperti pemahaman multibahasa, pemrosesan berbagai jenis data, serta memori yang lebih panjang untuk menangani konteks yang lebih luas.

Sebagai model open-source, Llama 3 memungkinkan para peneliti dan pengembang untuk mempelajari, memodifikasi, dan mengadaptasi teknologinya secara bebas. Hal ini dapat mendorong inovasi yang lebih cepat dan kolaborasi yang lebih luas dalam komunitas AI. Manfaat dari kehadiran Llama 3 pun diharapkan dapat dirasakan oleh khalayak lebih luas lagi dalam waktu dekat.

This article is written by our community writers and has been carefully reviewed by our editorial team. We strive to provide the most accurate and reliable information, ensuring high standards of quality, credibility, and trustworthiness.