ilustrasi kecerdasan buatan (unsplash.com/Steve Johnson)
Pencapaian tim DeepSeek dalam mengembangkan model ini patut diapresiasi. Mereka berhasil melatih model raksasa ini menggunakan pusat data GPU Nvidia H800 hanya dalam waktu dua bulan. Padahal, China baru-baru ini menghadapi pembatasan akses terhadap GPU tersebut dari Kementerian Perdagangan Amerika Serikat.
Proses pengembangan model ini hanya menghabiskan biaya sekitar 5,57 juta dolar AS (sekitar Rp90 miliar). Nominal ini dinilai jauh lebih rendah dibandingkan model-model besar lainnya. Sebagai perbandingan, pengembangan Llama 3.1 diperkirakan memakan biaya lebih dari 500 juta dolar AS (sekitar Rp8,1 triliun).
DeepSeek v3 kini tersedia melalui berbagai platform. Kode model ini dapat diakses di GitHub dengan lisensi MIT, sementara modelnya tersedia di platform Hugging Face. Pengguna juga dapat mencoba model ini melalui DeepSeek Chat, platform serupa ChatGPT yang dikembangkan perusahaan.
Para pengembang bisa mengakses API DeepSeek v3 untuk penggunaan komersial. Perusahaan menawarkan harga kompetitif sebesar 0,27 dolar AS (sekitar Rp4.300) per satu juta token input dan 1,10 dolar AS (sekitar Rp17.800) per satu juta token output. Harga khusus 0,07 dolar AS (sekitar Rp1.100) per satu juta token tersedia saat menggunakan fitur cache hits.
Melansir TestingCatalog, DeepSeek juga disebut sedang mengembangkan fitur menarik bernama Deep Roles. Fitur ini nantinya memungkinkan pengguna mengeksplorasi atau membuat "peran" kustom dalam bahasa Inggris dan Mandarin. Fitur ini diprediksi akan mirip seperti Custom GPTs dari OpenAI. Perkembangan model AI open source seperti DeepSeek v3 tidak kalah menarik untuk diikuti. Kedepannya, bukan tidak mungkin jurang antara model terbuka dan tertutup akan semakin menyempit.