Large language model (LLM) adalah model artificial intelligence (AI) yang dilatih dengan data teks dalam jumlah yang sangat besar. Model ini mampu memahami, memproses, dan menghasilkan teks dalam bahasa alami manusia. Jenis model ini makin marak dikembangkan seiring populernya produk LLM, seperti chatbot dari OpenAI, yakni ChatGPT.
Kemampuan bahasa LLM bergantung pada data pelatihannya. Sebagian besar LLM terkemuka telah dilatih dengan data multibahasa sehingga memahami beragam bahasa, termasuk bahasa Indonesia. Namun, kemampuan model tersebut dalam bahasa lain, terutama yang minim sumber daya publikasi, tentu tidak sebaik bahasa Inggris yang masif digunakan. Oleh karena itu, penelitian LLM dengan data selain bahasa Inggris turut berkembang pesat.
LLM untuk bahasa Indonesia sendiri telah berhasil dikembangkan oleh beberapa pihak. Bahkan, baru-baru ini terdapat model dengan dukungan bahasa Indonesia dan bahasa daerah yang diluncurkan. Model tersebut bernama Komodo-7B. Ingin tahu detail informasinya? Simak enam fakta yang akan dipaparkan di bawah ini, ya!