Компанія Google оголосила про запуск нової моделі Gemini 3.5 Live Translate. Це аудіомодель, розроблена для перекладу мовлення в реальному часі, яка покликана зробити спілкування різними мовами більш природним і безперервним.
На відміну від традиційних систем, що працюють за принципом покрокового перекладу, Gemini 3.5 Live Translate забезпечує безперервний потоковий переклад. Як зазначають розробники, модель генерує переклад, поки співрозмовник ще говорить, відстаючи лише на кілька секунд. Такий підхід дає змогу уникнути незручних пауз і підтримувати природний ритм діалогу.
Також заявлено про автоматичне розпізнавання понад 70 мов, збереження інтонації, темпу та висоти голосу, а також стійкість до фонового шуму.
Запуск технології відбувається поетапно в різних продуктах Google. Для корпоративних користувачів оновлення з’явиться в Google Meet. Для широкого кола користувачів технологія стане доступною в застосунку Google Translate для Android та iOS.
Під час використання режиму живого перекладу з підключеними навушниками користувачі зможуть чути плавніше та природніше мовлення. Крім того, для власників Android-пристроїв запроваджується новий режим прослуховування. Він дає змогу піднести телефон до вуха, як під час звичайної телефонної розмови, і прослуховувати перекладене мовлення безпосередньо через динамік.
