Google kembali menghadirkan inovasi terbaru di bidang kecerdasan buatan (AI) dengan meluncurkan Gemini 3.5 Live Translate, teknologi penerjemahan suara ke suara (speech-to-speech translation) yang mampu bekerja hampir secara real-time. Teknologi terbaru dari Google ini memungkinkan pengguna berkomunikasi lintas bahasa dengan lebih alami, cepat, dan minim jeda.

Menariknya, Gemini 3.5 Live Translate mendukung lebih dari 70 bahasa dan mampu mempertahankan karakter suara asli pembicara, termasuk intonasi, tempo bicara, hingga nada suara. Saat ini, model AI terbaru tersebut sudah tersedia bagi para developer melalui Gemini Live API dan Google AI Studio dalam versi public preview.
Sementara itu, pengguna enterprise dapat mencobanya melalui Google Meet dalam program private preview mulai bulan ini. Google juga mulai menghadirkan teknologi tersebut ke aplikasi Google Translate di Android dan iOS. Berbeda dengan teknologi penerjemahan suara konvensional, Gemini 3.5 Live Translate dirancang untuk menghasilkan terjemahan yang terdengar lebih alami dan nyaman didengar.
Model AI ini dapat mendeteksi lebih dari 70 bahasa secara otomatis tanpa memerlukan pengaturan manual dari pengguna. Selain itu, sistem mampu menerjemahkan percakapan secara berkelanjutan dengan tetap menjaga konteks pembicaraan.
Google menjelaskan bahwa Gemini 3.5 Live Translate mampu menyeimbangkan antara kecepatan penerjemahan dan kualitas hasil terjemahan. Dengan demikian, pengguna dapat menikmati percakapan yang lebih lancar tanpa jeda canggung yang sering terjadi pada layanan terjemahan real-time lainnya.
Keunggulan lain dari teknologi terbaru Google ini adalah kemampuannya beroperasi di lingkungan yang bising. Sistem telah dirancang agar tetap mampu menangkap dan menerjemahkan suara secara akurat meski berada di tempat ramai atau penuh gangguan suara. Google menyebutkan bahwa Gemini 3.5 Live Translate dapat dimanfaatkan untuk berbagai kebutuhan komunikasi multibahasa, mulai dari rapat bisnis, panggilan video, pembelajaran online, hingga siaran langsung.
Melalui Gemini Live API, sejumlah platform pengembang seperti Agora, Fishjam, LiveKit, Pipecat, dan Vision Agents kini dapat membangun aplikasi penerjemahan suara berbasis AI dengan lebih mudah.
Menariknya, perusahaan teknologi transportasi Grab juga dikabarkan telah mulai menguji coba teknologi ini.
Nantinya, Gemini 3.5 Live Translate akan membantu pengemudi dan penumpang berkomunikasi dalam berbagai bahasa secara hampir real-time saat proses penjemputan berlangsung.
Google Meet Segera Didukung Gemini 3.5 Live Translate
Google juga mengonfirmasi bahwa fitur Speech Translation di Google Meet akan segera menggunakan Gemini 3.5 Live Translate.
Pembaruan ini akan menghadirkan dukungan lebih dari 70 bahasa sekaligus memungkinkan percakapan lintas lebih dari 2.000 kombinasi bahasa dalam satu pertemuan virtual.
Sumber: Tabloid Pulsa