TUTUP
SCROLL UNTUK MELANJUTKAN MEMBACA
Gabung di IDN Times

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa Daerah

Mulai dari bahasa Aceh sampai bahasa Bali

Perilisan Komodo-7B di acara Conversate 2024 di Jakarta, Kamis, (7/3/2024) (linkedin.com/louisowen)

Large language model (LLM) adalah model artificial intelligence (AI) yang dilatih dengan data teks dalam jumlah yang sangat besar. Model ini mampu memahami, memproses, dan menghasilkan teks dalam bahasa alami manusia. Jenis model ini makin marak dikembangkan seiring populernya produk LLM, seperti chatbot dari OpenAI, yakni ChatGPT.

Kemampuan bahasa LLM bergantung pada data pelatihannya. Sebagian besar LLM terkemuka telah dilatih dengan data multibahasa sehingga memahami beragam bahasa, termasuk bahasa Indonesia. Namun, kemampuan model tersebut dalam bahasa lain, terutama yang minim sumber daya publikasi, tentu tidak sebaik bahasa Inggris yang masif digunakan. Oleh karena itu, penelitian LLM dengan data selain bahasa Inggris turut berkembang pesat.

LLM untuk bahasa Indonesia sendiri telah berhasil dikembangkan oleh beberapa pihak. Bahkan, baru-baru ini terdapat model dengan dukungan bahasa Indonesia dan bahasa daerah yang diluncurkan. Model tersebut bernama Komodo-7B. Ingin tahu detail informasinya? Simak enam fakta yang akan dipaparkan di bawah ini, ya!

1. Komodo-7B diluncurkan oleh Yellow.ai pada Conversate 2024

Sesi foto bersama pada acara Converse 2024 di Jakarta, Kamis, (7/3/2024) (linkedin.com/yellowdotai)

Yellow.ai adalah penyedia otomasi layanan pelanggan berbasis AI generatif. Perusahaan ini berkantor pusat di San Mateo, Amerika Serikat, dengan lima kantor lain di luar Amerika, termasuk Indonesia. Mereka mengembangkan berbagai inovasi AI untuk keperluan produk, layanan, dan solusi yang mereka tawarkan.

Satu dari sekian inovasi tersebut adalah LLM Komodo-7B. Model ini dirilis pada Conversate 2024 di Jakarta, Kamis, (7/3/2024). Acara tersebut merupakan konferensi eksklusif yang menghadirkan para pakar industri dari perusahaan ternama, seperti Flip.id, Ajaib, Bank Jago, dan lainnya. Dengan tema Scaling Support Automation with Generative AI, Converse 2024 menyoroti penggunaan AI generatif untuk meningkatkan otomasi layanan pelanggan.

Baca Juga: 3 Fakta Microsoft VASA-1, AI yang Bisa Ubah Foto Jadi Video

2. Komodo-7B merupakan famili LLM dengan dua varian model

Proses evolusi model Komodo-7B-Base menjadi Komodo-7B-Instruct (tech.yellow.ai)

Melansir tech.yellow.ai, Komodo-7B adalah famili LLM yang terdiri atas Komodo-7B-Base dan Komodo-7B-Instruct. Varian Komodo-7B-Base dibangun dari model Llama-2-7B-Base melalui incremental pretraining dan vocabulary expansion. Model dengan 7 miliar parameter ini dilatih dengan dataset yang mencakup bahasa Indonesia, Inggris, dan 11 bahasa daerah di Indonesia dengan total 8,5 miliar token.

Model Komodo-7B-Base dapat disempurnakan untuk tugas dan domain tertentu melalui supervised fine-tuning (SFT). Komodo-7B-Instruct adalah varian hasil penyempurnaan yang dikembangkan oleh tim riset NLP Yellow.ai. Penyempurnaan Komodo-7B-Base semacam ini dapat dilakukan oleh berbagai pihak lain karena varian dasar tersebut telah dirilis ke publik.

3. Komodo-7B-Instruct unggul dalam tugas generatif dan diskriminatif

Komparasi performa Komodo-7B dan model lain dalam tugas generatif dan diskriminatif (linkedin.com/louisowen)

Terdapat dua macam tugas (task) pada model AI, yakni generatif dan diskriminatif. Tugas generatif berarti model AI berfokus pada penciptaan teks, seperti penerjemahan, tanya-jawab, dan peringkasan. Sementara itu, tugas diskriminatif berfokus pada pembedaan teks, seperti penalaran logika, klasifikasi maksud, deteksi ragam cakapan, dan analisis sentimen.

Komodo-7B-Instruct mampu menyeimbangkan antara penciptaan konten yang bermakna dan diskriminasi yang akurat di berbagai tantangan bahasa. Model varian ini hanya tertinggal sedikit dari model GPT-4-1106-preview dalam tugas diskriminatif. Hal ini menunjukkan bahwa Komodo-7B-Instruct memiliki kinerja yang kuat dan keserbagunaan dalam menangani berbagai tugas bahasa.

4. Komodo-7B-Instruct berpotensi menangani tantangan keberagaman bahasa dan meningkatkan aksesibilitas dalam pendidikan

Komparasi Google Translate dan Komodo-7b-Instruct (tech.yellow.ai)

Kemampuan terjemahan dan cakupan bahasa daerah Komodo-7B lebih luas daripada Google Translate. Komodo-7B menawarkan kemampuan terjemahan langsung dari bahasa Inggris ke 11 bahasa daerah Indonesia. Ini merupakan peningkatan besar dibandingkan Google Translate yang hanya mendukung empat bahasa; Indonesia, Inggris, Jawa, dan Sunda.

Cakupan Komodo-7B-Instruct yang lebih luas memungkinkan individu di berbagai wilayah di Indonesia dapat memperoleh manfaat dari pendidikan dalam bahasa ibu mereka. Hal ini tidak hanya meningkatkan aksesibilitas, tetapi juga mengatasi tantangan keberagaman bahasa di lingkungan pendidikan. Model ini menjadi solusi menjanjikan untuk menjembatani kesenjangan pendidikan dan mendorong inklusivitas dalam pembelajaran bahasa.

5. Komodo-7B menjadi solusi layanan pelanggan dengan fitur canggih dan inklusif di Indonesia

ilustrasi layanan pelanggan dengan Komodo-7B (yellow.ai)

Produk Komodo-7B yang ditawarkan pada platform Yellow.ai diklaim menjadi LLM pertama di industri yang mengakomodasi keberagaman bahasa di Indonesia. Model ini mampu memahami bahasa Indonesia, Inggris, dan 11 bahasa daerah di Indonesia, meliputi bahasa Aceh, Bali, Banjar, Batak Toba, Bugis, Dayak Ngaju, Jawa, Lampung, Madura, Minangkabau, dan Sunda. Pemahaman tersebut pun mencakup bahasa Indonesia informal dan campuran bahasa Inggris maupun dialek daerah. 

Sebagai solusi layanan pelanggan, Komodo-7B menawarkan serangkaian fitur yang canggih. Misalnya, fitur pencarian dan peringkasan lanjutan untuk pertanyaan bahasa daerah, pemahaman multibahasa dalam ragam cakapan, dan asistensi agen yang efisien dan berempati berdasarkan analisis sentimen. LLM ini diklaim akan menampilkan hasil yang relevan secara kontekstual, akurat, dan mampu menangkap nuansa bahasa.

Dengan Komodo-7B, pelaku usaha dapat melayani pelanggan dari berbagai wilayah Indonesia tanpa perlu agen khusus yang menguasai setiap bahasa daerah. Keterbatasan bahasa tidak akan lagi jadi hambatan dalam layanan pelanggan. LLM ini pun akan memungkinkan pelaku usaha untuk merespons dengan akurat dan lebih cepat sekaligus mengurangi biaya operasional.

Verified Writer

R. Damanhuri

Seorang awam dalam dunia tulis menulis.

IDN Times Community adalah media yang menyediakan platform untuk menulis. Semua karya tulis yang dibuat adalah sepenuhnya tanggung jawab dari penulis.

Rekomendasi Artikel

Berita Terkini Lainnya