IT-фахівці створили модель штучного інтелекту, яка перекладає текст з однієї мови іншою в чотирьох різних режимах і робить це точніше попередників. Розробка буде доступною для некомерційного використання. Згідно з останніми дослідженнями, так званий штучний інтелект стрімко розвивається. Наприклад, він здатний обманювати користувачів, навіть якщо це заборонили розробники, а моделі ChatGPT вдалося пройти п’ятихвилинний тест Тьюринга. При цьому нейромережі, які вміють писати вірші, створили такі тексти, які не тільки легко сплутати з людською поезією, а і які сподобалися читачам більше, ніж творчість письменників-класиків.
Міжнародна команда вчених з кількох IT-компаній та університетів представила нову модель штучного інтелекту, яка дозволяє перекладати з однієї мови на інший текст і мову, що звучить опис проекту, якість роботи якого перевершує існуючі системи.
Модель під назвою SEAMLESSM4T працює у кількох режимах:
- speech-to-speech (отримує на вхід промову, що звучить, і видає переклад репліки, озвучений голосом автора запиту або будь-яким іншим голосом залежно від завдання),
- speech-to-text (перетворює звучання на текст і перекладає іншою мовою, не озвучуючи)
- text-to-speech (перетворює текст однією мовою на мову іншою),
- text-to-text (отримує на вхід текст і перекладає його іншою мовою, не перетворюючи на мову, що звучить),
- automatic speech recognition (автоматичне розпізнавання мови; модель перетворює мову, що звучить в текст без перекладу).
Якість роботи нової моделі визнали вищою порівняно із системами, які існували до цього. Для перекладу speech-to-speech значення метрики accuracy, яка показує частку правильних відповідей нейромережі серед усіх передбачень, виявилося на 23% більше, ніж в аналогів. У цьому режимі SEAMLESSM4T здатна перекладати зі 101 мови на 36 мов. Для інших режимів також підтримується велика кількість мов. Переклад speech-to-text здійснюється зі 101 мови на 96 мов, text-to-speech — з 96 мов на 36 мов.
SEAMLESSM4T має функції, що дозволяють на 50% краще аналогів приглушувати фоновий шум і підлаштовуватися під зміни гучності голосу. Крім того, модель пройшла перевірку на безпеку перекладу: її можна вважати нетоксичною і не схильною до гендерних стереотипів.
Новий ШІ-перекладач планують зробити доступним для некомерційного використання. На думку розробників, модель здатна полегшити міжнародне спілкування, так само як вавилонська рибка допомагала героям із серії фантастичних творів «Автостопом по галактиці» англійського письменника Дугласа Адамса «перемикатися» з однієї мови на іншу.
Comments