6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa Daerah

Mulai dari bahasa Aceh sampai bahasa Bali

Large language model (LLM) adalah model artificial intelligence (AI) yang dilatih dengan data teks dalam jumlah yang sangat besar. Model ini mampu memahami, memproses, dan menghasilkan teks dalam bahasa alami manusia. Jenis model ini makin marak dikembangkan seiring populernya produk LLM, seperti chatbot dari OpenAI, yakni ChatGPT.

Kemampuan bahasa LLM bergantung pada data pelatihannya. Sebagian besar LLM terkemuka telah dilatih dengan data multibahasa sehingga memahami beragam bahasa, termasuk bahasa Indonesia. Namun, kemampuan model tersebut dalam bahasa lain, terutama yang minim sumber daya publikasi, tentu tidak sebaik bahasa Inggris yang masif digunakan. Oleh karena itu, penelitian LLM dengan data selain bahasa Inggris turut berkembang pesat.

LLM untuk bahasa Indonesia sendiri telah berhasil dikembangkan oleh beberapa pihak. Bahkan, baru-baru ini terdapat model dengan dukungan bahasa Indonesia dan bahasa daerah yang diluncurkan. Model tersebut bernama Komodo-7B. Ingin tahu detail informasinya? Simak enam fakta yang akan dipaparkan di bawah ini, ya!

1. Komodo-7B diluncurkan oleh Yellow.ai pada Conversate 2024

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa DaerahSesi foto bersama pada acara Converse 2024 di Jakarta, Kamis, (7/3/2024) (linkedin.com/yellowdotai)

Yellow.ai adalah penyedia otomasi layanan pelanggan berbasis AI generatif. Perusahaan ini berkantor pusat di San Mateo, Amerika Serikat, dengan lima kantor lain di luar Amerika, termasuk Indonesia. Mereka mengembangkan berbagai inovasi AI untuk keperluan produk, layanan, dan solusi yang mereka tawarkan.

Satu dari sekian inovasi tersebut adalah LLM Komodo-7B. Model ini dirilis pada Conversate 2024 di Jakarta, Kamis, (7/3/2024). Acara tersebut merupakan konferensi eksklusif yang menghadirkan para pakar industri dari perusahaan ternama, seperti Flip.id, Ajaib, Bank Jago, dan lainnya. Dengan tema Scaling Support Automation with Generative AI, Converse 2024 menyoroti penggunaan AI generatif untuk meningkatkan otomasi layanan pelanggan.

Baca Juga: 3 Fakta Microsoft VASA-1, AI yang Bisa Ubah Foto Jadi Video

2. Komodo-7B merupakan famili LLM dengan dua varian model

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa DaerahProses evolusi model Komodo-7B-Base menjadi Komodo-7B-Instruct (tech.yellow.ai)

Melansir tech.yellow.ai, Komodo-7B adalah famili LLM yang terdiri atas Komodo-7B-Base dan Komodo-7B-Instruct. Varian Komodo-7B-Base dibangun dari model Llama-2-7B-Base melalui incremental pretraining dan vocabulary expansion. Model dengan 7 miliar parameter ini dilatih dengan dataset yang mencakup bahasa Indonesia, Inggris, dan 11 bahasa daerah di Indonesia dengan total 8,5 miliar token.

Model Komodo-7B-Base dapat disempurnakan untuk tugas dan domain tertentu melalui supervised fine-tuning (SFT). Komodo-7B-Instruct adalah varian hasil penyempurnaan yang dikembangkan oleh tim riset NLP Yellow.ai. Penyempurnaan Komodo-7B-Base semacam ini dapat dilakukan oleh berbagai pihak lain karena varian dasar tersebut telah dirilis ke publik.

3. Komodo-7B-Instruct unggul dalam tugas generatif dan diskriminatif

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa DaerahKomparasi performa Komodo-7B dan model lain dalam tugas generatif dan diskriminatif (linkedin.com/louisowen)

Terdapat dua macam tugas (task) pada model AI, yakni generatif dan diskriminatif. Tugas generatif berarti model AI berfokus pada penciptaan teks, seperti penerjemahan, tanya-jawab, dan peringkasan. Sementara itu, tugas diskriminatif berfokus pada pembedaan teks, seperti penalaran logika, klasifikasi maksud, deteksi ragam cakapan, dan analisis sentimen.

Komodo-7B-Instruct mampu menyeimbangkan antara penciptaan konten yang bermakna dan diskriminasi yang akurat di berbagai tantangan bahasa. Model varian ini hanya tertinggal sedikit dari model GPT-4-1106-preview dalam tugas diskriminatif. Hal ini menunjukkan bahwa Komodo-7B-Instruct memiliki kinerja yang kuat dan keserbagunaan dalam menangani berbagai tugas bahasa.

4. Komodo-7B-Instruct berpotensi menangani tantangan keberagaman bahasa dan meningkatkan aksesibilitas dalam pendidikan

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa DaerahKomparasi Google Translate dan Komodo-7b-Instruct (tech.yellow.ai)

Kemampuan terjemahan dan cakupan bahasa daerah Komodo-7B lebih luas daripada Google Translate. Komodo-7B menawarkan kemampuan terjemahan langsung dari bahasa Inggris ke 11 bahasa daerah Indonesia. Ini merupakan peningkatan besar dibandingkan Google Translate yang hanya mendukung empat bahasa; Indonesia, Inggris, Jawa, dan Sunda.

Cakupan Komodo-7B-Instruct yang lebih luas memungkinkan individu di berbagai wilayah di Indonesia dapat memperoleh manfaat dari pendidikan dalam bahasa ibu mereka. Hal ini tidak hanya meningkatkan aksesibilitas, tetapi juga mengatasi tantangan keberagaman bahasa di lingkungan pendidikan. Model ini menjadi solusi menjanjikan untuk menjembatani kesenjangan pendidikan dan mendorong inklusivitas dalam pembelajaran bahasa.

5. Komodo-7B menjadi solusi layanan pelanggan dengan fitur canggih dan inklusif di Indonesia

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa Daerahilustrasi layanan pelanggan dengan Komodo-7B (yellow.ai)

Produk Komodo-7B yang ditawarkan pada platform Yellow.ai diklaim menjadi LLM pertama di industri yang mengakomodasi keberagaman bahasa di Indonesia. Model ini mampu memahami bahasa Indonesia, Inggris, dan 11 bahasa daerah di Indonesia, meliputi bahasa Aceh, Bali, Banjar, Batak Toba, Bugis, Dayak Ngaju, Jawa, Lampung, Madura, Minangkabau, dan Sunda. Pemahaman tersebut pun mencakup bahasa Indonesia informal dan campuran bahasa Inggris maupun dialek daerah. 

Sebagai solusi layanan pelanggan, Komodo-7B menawarkan serangkaian fitur yang canggih. Misalnya, fitur pencarian dan peringkasan lanjutan untuk pertanyaan bahasa daerah, pemahaman multibahasa dalam ragam cakapan, dan asistensi agen yang efisien dan berempati berdasarkan analisis sentimen. LLM ini diklaim akan menampilkan hasil yang relevan secara kontekstual, akurat, dan mampu menangkap nuansa bahasa.

Dengan Komodo-7B, pelaku usaha dapat melayani pelanggan dari berbagai wilayah Indonesia tanpa perlu agen khusus yang menguasai setiap bahasa daerah. Keterbatasan bahasa tidak akan lagi jadi hambatan dalam layanan pelanggan. LLM ini pun akan memungkinkan pelaku usaha untuk merespons dengan akurat dan lebih cepat sekaligus mengurangi biaya operasional.

6. Komodo-7B masih akan terus dikembangkan lebih lanjut

6 Fakta Komodo-7B, Model AI Indonesia dengan Dukungan 11 Bahasa DaerahRencana pengembangan Komodo-7B (yellow.ai)

Komodo-7B masih akan terus dikembangkan. Tim riset NLP Yellow.ai telah memiliki beberapa rencana pengembangan lebih lanjut. Pertama, rencana pelatihan model Komodo-7B-Base menjadi LLM untuk tugas spesifik. Model tugas spesifik akan disesuaikan dan dilatih untuk tugas tertentu agar unggul dalam tugas tersebut.

Kedua, penyempurnaan Komodo-7B-Instruct dengan menciptakan varian model percakapan. Varian model ini akan dilatih untuk memahami tidak hanya percakapan satu putaran, tetapi juga percakapan multiputaran sehingga memungkinkannya memahami konteks dialog. Pemahaman nuansa percakapan ini diharapkan dapat meningkatkan kemampuan model dalam memberikan respons yang akurat dan relevan secara kontekstual.

Terakhir, terdapat rencana untuk melatih LLM Komodo dengan versi lebih besar. Parameter model kemungkinan akan ditambah hingga sebanyak 13 miliar, 33 miliar, atau bahkan 70 miliar. Upaya ini didorong oleh aspirasi untuk meningkatkan kualitas model dengan memiliki lebih banyak parameter.

Baca Juga: Microsoft Luncurkan Phi-3 Mini, Model AI Cerdas dengan Ukuran Mungil 

R. Damanhuri Photo Verified Writer R. Damanhuri

Seorang awam dalam dunia tulis menulis.

IDN Times Community adalah media yang menyediakan platform untuk menulis. Semua karya tulis yang dibuat adalah sepenuhnya tanggung jawab dari penulis.

Topik:

  • Kidung Swara Mardika

Berita Terkini Lainnya