TUTUP
SCROLL UNTUK MELANJUTKAN MEMBACA
Gabung di IDN Times

3 Fakta Menarik Gemini 1.5 Pro, AI Super Cerdas Terbaru dari Google 

Mampu memproses hingga 700 ribu kata

Gemini 1.5 (Blog.Google.com)

Google kembali membuat terobosan di bidang kecerdasan buatan (AI). Kamis (15/2/2024) lalu, Google memperkenalkan model AI terbarunya bernama Gemini 1.5 Pro. Model ini merupakan bagian dari keluarga model Gemini dan penerus dari versi 1.0 Pro.

Gemini 1.5 Pro disebut memiliki jendela konteks sekitar 128 ribu token yang mampu ditingkatkan hingga satu juta token. Selain itu, model ini juga tergolong model multimodal yang mampu mengolah berbagai format data seperti teks, audio, gambar, hingga video. Apa saja fakta menarik dari AI terbaru milik Google Gemini 1.5 Pro yang perlu kamu ketahuI?

1. Jendela konteks hingga satu juta token

Hal paling menarik dari Gemini 1.5 Pro ini adalah limit jendela konteksnya. Sebagai informasi, jendela konteks merujuk kepada seberapa banyak informasi yang dapat diproses oleh AI dalam satu waktu. Gemini 1.5 Pro sendiri memiliki jendela konteks standar sebesar 128 ribu token yang mampu ditingkatkan hingga satu juta token. 

Sebagai perbandingan, model AI ini mampu mengekstrak informasi dari dokumen teks yang mengandung 700 ribu kata. Mengapa ini penting? Jadi, semakin besar jendela konteks suatu model AI maka semakin banyak informasi yang dapat diproses. Langkah ini akan membuat output dari AI tersebut semakin konsisten, bermanfaat, dan relevan.

Gemini 1.5 Pro disebut mampu menganalisis, mengklasifikasi, dan merangkum dokumen panjang dengan baik. Kemampuan ini ditunjukkan dalam demonstrasi Google yang memberi input berupa dokumen transkrip dari misi Apollo 11 ke bulan. Hasilnya, model ini mampu menganalisis detail percakapan dan peristiwa yang tercatat dalam dokumen sepanjang 402 halaman tersebut. Bahkan, dalam penelitannya, Google mengklaim berhasil mengetes model ini dengan 10 juta token.

Baca Juga: 5 Cara Cerdas Memanfaatkan ChatGPT untuk YouTuber 

2. Gemini merupakan model multimodal

Gemini 1.5 Pro adalah sebuah model AI yang multimodal. Artinya, model ini dapat menerima berbagai jenis input, seperti teks, gambar, audio, hingga video. Gemini dapat memproses video dengan durasi hingga satu jam, 11 jam audio dan 30 ribu baris kode. 

Google menggunakan film bisu berjudul "Sherlock Jr." yang berdurasi sekitar 45 menit untuk mengetes model ini. Hasilnya, Gemini berhasil mencari adegan spesifik dari film tersebut dengan baik. Bukan hanya itu, model ini juga berhasil mencari skenario yang mirip dengan sketsa sederhana yang diberi oleh tim peneliti. 

Verified Writer

Leo Manik

...

IDN Times Community adalah media yang menyediakan platform untuk menulis. Semua karya tulis yang dibuat adalah sepenuhnya tanggung jawab dari penulis.

Rekomendasi Artikel

Berita Terkini Lainnya