Google Rilis Model AI Penerjemah yang Cepat dan Natural

- Google meluncurkan Gemini 3.5 Live Translate, model AI penerjemah suara instan yang mampu menerjemahkan lebih dari 70 bahasa secara near real-time dengan suara alami dan penyaringan kebisingan.
- DeepMind menguji model ini melalui tiga tahap: akurasi terjemahan, kecepatan respons, dan kealamian suara untuk memastikan hasil yang konsisten serta pengalaman komunikasi yang mulus.
- Gemini 3.5 Live Translate tersedia di Google Translate dan platform bisnis, mendukung percakapan lintas bahasa di layanan pelanggan, pendidikan, transportasi, hingga rapat daring dengan keamanan watermark SynthID.
Impian untuk bisa mengobrol lancar dengan orang asing tanpa terhalang kendala bahasa akhirnya perlahan menjadi kenyataan. Google baru saja meluncurkan teknologi kecerdasan buatan (AI) teranyar mereka yang diberi nama Gemini 3.5 Live Translate. Berbeda dengan alat penerjemah biasa, model pintar ini menjanjikan pengalaman komunikasi lintas bahasa yang terasa jauh lebih hidup dan natural.
Kehadiran teknologi penerjemah suara instan ini langsung mencuri perhatian pencinta teknologi. Pasalnya, Google menanamkan berbagai peningkatan yang membuat proses alih bahasa berjalan mulus. Berikut spesifikasi dan fitur unggulan Gemini 3.5 Live Translate!
1. Ditenagai oleh Gemini 3 Pro untuk terjemahan near real-time

Rahasia utama di balik kelancaran alat ini ternyata berasal dari fondasi arsitektur Gemini 3 Pro yang andal. Berkat dukungan mesin cerdas tersebut, model ini mampu menampung jendela konteks token audio hingga 128 ribu masukan. Sementara itu, kapasitas output-nya mencapai 64 ribu token dalam bentuk teks maupun suara.
Daya tarik paling menonjol dari Gemini versi ini terletak pada kemampuannya menerjemahkan ucapan secara terus-menerus (near real-time). Sistem lama biasanya memaksa kita menunggu lawan bicara selesai merangkai kalimat sebelum alat mulai bekerja mencari padanan katanya. Kini, AI akan langsung menyerap kalimat dan menerjemahkannya ke dalam bahasa tujuan hanya dengan jeda waktu beberapa detik saja.
Kecerdasan model ini makin terasa lewat kemampuannya mengenali lebih dari 70 bahasa tanpa perlu diatur manual. Tidak sekadar mengubah bahasa, suara yang dihasilkan tetap mempertahankan intonasi, kecepatan, dan nada asli dari pembicara aslinya. Bahkan, sistem secara pintar akan menyaring suara bising di latar belakang agar percakapan tetap jernih di lingkungan yang ramai.
2. Lulus tiga tahap pengujian demi kualitas maksimal

Demi memastikan pengalaman pengguna yang sempurna, DeepMind melakukan evaluasi menyeluruh terhadap model ini menggunakan tiga tolok ukur utama. Tahap pertama berfokus pada kualitas terjemahan itu sendiri dengan mengandalkan alat otomatis berbasis kesalahan yang dinamakan AutoMQM. Pengujian ini menjamin akurasi makna tetap konsisten di berbagai jenis pasangan bahasa dan konteks pembicaraan.
Aspek krusial kedua yang tidak luput dari perhatian para pengembang Google adalah masalah latensi. Para ahli mengukur seberapa cepat sistem merespons sejak suara pertama kali masuk hingga munculnya terjemahan di perangkat pendengar. Mereka juga menghitung sinkronisasi tingkat kata agar jarak antara ucapan asli dan suara terjemahan terasa pas di telinga.
Pengujian ketiga menyasar tingkat kealamian suara yang dihasilkan oleh AI. Evaluasi ini bertujuan menekan risiko kemunculan suara yang tiba-tiba terputus, penyimpangan karakter vokal, maupun gangguan audio lainnya. Namun, Google mengakui karakter suara AI terkadang masih bisa tidak konsisten atau berubah gender setelah ada jeda panjang
3. Hadirkan solusi praktis untuk ragam aktivitas harian

Kehadiran Gemini 3.5 Live Translate membuka berbagai peluang pemanfaatan yang luas. Model pintar ini cocok disematkan pada layanan pelanggan, kelas pendidikan, hingga siaran langsung berkat kecepatannya. Perusahaan transportasi seperti Grab bahkan sudah mengujinya untuk menjembatani komunikasi jutaan penumpang dan pengemudi.
Pengguna Android dan iOS kini bisa mencobanya lewat pembaruan aplikasi Google Translate. Pengguna hanya tinggal menghubungkan perangkat dengan headset untuk memulai percakapan lintas bahasa. Khusus pengguna Android, terdapat mode mendengarkan baru yang memungkinkan suara terjemahan keluar langsung dari lubang suara HP.
Sektor korporat juga mendapatkan keuntungan lewat integrasi sistem ke dalam layanan panggilan video. Pekerja kantoran dapat mengadakan rapat daring dengan ribuan kombinasi bahasa berbeda secara bersamaan di dalam satu ruangan. Inovasi tersebut menghapus batasan bisnis yang selama ini selalu mengandalkan bahasa Inggris sebagai pengantar utama.
4. Ketersediaan Gemini 3.5 Live Translate

Peluncuran Gemini 3.5 Live Translate dilakukan secara bertahap melalui berbagai macam platform digital milik Google. Para pengembang perangkat lunak sudah bisa mengaksesnya lewat API serta AI Studio. Pelanggan bisnis khusus juga mulai menerima pembaruan di platform pertemuan virtual sebelum akhirnya dirilis secara lebih luas.
Ekspansi model ini dibarengi dengan penerapan protokol perlindungan untuk mencegah penyalahgunaan. Setiap audio yang dihasilkan akan selalu ditandai menggunakan teknologi watermark digital yang bernama SynthID. Tanda tersebut melekat pada gelombang audio, tetapi tidak akan terdengar di telinga pengguna. Penerapan keamanan ini menjadi langkah antisipasi yang vital guna menekan risiko penyebaran misinformasi.

![[QUIZ] Jenis Aplikasi Favoritmu Bisa Ungkap Prioritas Hidupmu](https://image.idntimes.com/post/20250603/rami-al-zayat-w33-zg-dnl4-unsplash-a5544ac6e438978a52774589906c8ddb-c965c1354252b0a80d30b8c0c790ab63.jpg)
















