Mengenal DeepSeek v3, Model AI Open Source Raksasa dari China

Persaingan di kalangan perusahaan teknologi kecerdasan buatan (AI) kembali memanas dengan hadirnya DeepSeek v3. Model AI open source ini resmi dirilis pada Desember 2024 oleh perusahaan teknologi asal China, DeepSeek. DeepSeek v3 hadir sebagai penantang tangguh atas dominasi model-model besar tertutup seperti GPT-4o dari OpenAI dan Claude dari Anthropic.
DeepSeek v3 membawa sejumlah terobosan dalam dunia AI open source. Model ini memiliki total 671 miliar parameter, menjadikannya model AI open source terbesar yang pernah ada. Jumlah parameter tersebut bahkan 1,6 kali lebih besar dari Llama 3.1 yang memiliki 405 miliar parameter. Penasaran dengan model penantang dari China ini? Yuk baca artikel ini sampai habis!
1. Keunggulan DeepSeek v3 dibanding model lain
DeepSeek v3 menunjukkan performa ciamik dalam berbagai pengujian. Model ini berhasil mengungguli model-model open source lainnya seperti Llama 3.1 405B dan Qwen 2.5 72B dalam berbagai benchmark. DeepSeek v3 bahkan mampu melampaui performa GPT-4o dalam mayoritas pengujian. Melansir dari TechCrunch, model ini mampu menangani berbagai tugas berbasis teks seperti pemrograman, penerjemahan, penulisan esai, hingga pembuatan email.
Keunggulan model ini paling menonjol dalam pengujian matematika dan bahasa Mandarin. Pada tes Math-500, DeepSeek v3 meraih skor 90,2, jauh mengungguli model Qwen yang hanya mencapai skor 80. Model ini juga menunjukkan performa impresif dalam tes pemrograman kompetitif di platform Codeforces.
Model ini memiliki kemampuan memahami konteks yang sangat baik hingga 128 ribu token. Jumlah ini setara dengan kemampuan memproses sekitar 100 ribu kata dalam sekali eksekusi. Kemampuan ini memungkinkan model memahami dan menganalisis teks panjang seperti dokumen atau kode program secara lebih komprehensif.
Melansir VentureBeat, satu-satunya model yang mampu menandingi DeepSeek v3 adalah Claude 3.5 Sonnet dari Anthropic. Model Anthropic ini unggul dalam beberapa pengujian standar kemampuan AI seperti tes pengetahuan umum dan akademik (MMLU-Pro), dan tes pemrograman (SWE Verified). Namun, perbedaan terletak pada aksesibilitas, karena DeepSeek v3 tersedia secara open source.