3 Fakta Menarik Gemini 1.5 Pro, AI Super Cerdas Terbaru dari Google 

Mampu memproses hingga 700 ribu kata

Google kembali membuat terobosan di bidang kecerdasan buatan (AI). Kamis (15/2/2024) lalu, Google memperkenalkan model AI terbarunya bernama Gemini 1.5 Pro. Model ini merupakan bagian dari keluarga model Gemini dan penerus dari versi 1.0 Pro.

Gemini 1.5 Pro disebut memiliki jendela konteks sekitar 128 ribu token yang mampu ditingkatkan hingga satu juta token. Selain itu, model ini juga tergolong model multimodal yang mampu mengolah berbagai format data seperti teks, audio, gambar, hingga video. Apa saja fakta menarik dari AI terbaru milik Google Gemini 1.5 Pro yang perlu kamu ketahuI?

1. Jendela konteks hingga satu juta token

Hal paling menarik dari Gemini 1.5 Pro ini adalah limit jendela konteksnya. Sebagai informasi, jendela konteks merujuk kepada seberapa banyak informasi yang dapat diproses oleh AI dalam satu waktu. Gemini 1.5 Pro sendiri memiliki jendela konteks standar sebesar 128 ribu token yang mampu ditingkatkan hingga satu juta token. 

Sebagai perbandingan, model AI ini mampu mengekstrak informasi dari dokumen teks yang mengandung 700 ribu kata. Mengapa ini penting? Jadi, semakin besar jendela konteks suatu model AI maka semakin banyak informasi yang dapat diproses. Langkah ini akan membuat output dari AI tersebut semakin konsisten, bermanfaat, dan relevan.

Gemini 1.5 Pro disebut mampu menganalisis, mengklasifikasi, dan merangkum dokumen panjang dengan baik. Kemampuan ini ditunjukkan dalam demonstrasi Google yang memberi input berupa dokumen transkrip dari misi Apollo 11 ke bulan. Hasilnya, model ini mampu menganalisis detail percakapan dan peristiwa yang tercatat dalam dokumen sepanjang 402 halaman tersebut. Bahkan, dalam penelitannya, Google mengklaim berhasil mengetes model ini dengan 10 juta token.

Baca Juga: 5 Cara Cerdas Memanfaatkan ChatGPT untuk YouTuber 

2. Gemini merupakan model multimodal

https://www.youtube.com/embed/wa0MT8OwHuk

Gemini 1.5 Pro adalah sebuah model AI yang multimodal. Artinya, model ini dapat menerima berbagai jenis input, seperti teks, gambar, audio, hingga video. Gemini dapat memproses video dengan durasi hingga satu jam, 11 jam audio dan 30 ribu baris kode. 

Google menggunakan film bisu berjudul "Sherlock Jr." yang berdurasi sekitar 45 menit untuk mengetes model ini. Hasilnya, Gemini berhasil mencari adegan spesifik dari film tersebut dengan baik. Bukan hanya itu, model ini juga berhasil mencari skenario yang mirip dengan sketsa sederhana yang diberi oleh tim peneliti. 

3. Memiliki kemampuan problem solving dan belajar yang baik

https://www.youtube.com/embed/SSnsmqIj1MI

Gemini juga memiliki kemampuan pemecahan masalah yang sangat baik. Dalam demonstrasinya, tampak model ini dapat mengerjakan berbagai tugas coding kompleks dengan input hingga 100 ribu baris kode. Model ini juga memiliki kemampuan belajar yang impresif.

Dalam suatu pengujian, peneliti Google memberi input berupa buku panduan bahasa Kalamang ke Gemini. Bahasa Kalamang merupakan bahasa langka dari Papua Nugini yang hanya memiliki sekitar 200 penutur. Hasilnya, Gemini berhasil belajar bahasa tersebut dengan cukup baik hanya dari satu buku. Model ini berhasil menerjemahkan bahasa Inggris ke Kalamang dengan level yang sama baiknya dengan orang yang belajar dari buku sama. 

Saat ini, Gemini 1.5 Pro masih belum dirilis untuk publik. Model ini masih hanya tersedia secara terbatas untuk kalangan pengembang melalui Google AI Studio dan Vertex AI. Apakah kamu tertarik mencoba Gemini 1.5 Pro ketika dirilis nanti?

Baca Juga: Google Gemini vs ChatGPT, Mana Lebih Baik?

Leo Manik Photo Verified Writer Leo Manik

...

IDN Times Community adalah media yang menyediakan platform untuk menulis. Semua karya tulis yang dibuat adalah sepenuhnya tanggung jawab dari penulis.

Topik:

  • Kidung Swara Mardika

Berita Terkini Lainnya