Технології

VALL-E від Microsoft може відтворити будь-який голос за три секунди

1

Технології штучного інтелекту розвиваються неймовірною швидкістю. Після моделей штучного інтелекту, які можуть створювати зображення з ваших слів і спілкуватися з вами, тепер Microsoft розробила VALL-E, штучний інтелект, який може імітувати будь-який звук, який він чує, лише за три секунди. На відміну від багатьох інструментів штучного інтелекту, VALL-E може відтворювати емоції та тон мовця, навіть створюючи запис слів, які оригінальний мовець ніколи не говорив. Ось подробиці…

VALL-E: інструмент ШІ, який може відтворити будь-який голос

Microsoft нещодавно випустила інструмент штучного інтелекту, відомий як VALL-E, який може відтворювати голоси людей. Інструмент використовує лише 3-секундний запис певного голосу як підказку для створення вмісту, і його було навчено на 60 000 годинах даних англійської мови. Модель штучного інтелекту здатна відтворювати емоції та тон оратора, навіть створюючи запис слів, які оригінальний оратор ніколи не говорив.

Це значний прогрес у сфері мовлення, створеного штучним інтелектом, оскільки попередні моделі могли відтворювати лише голос, але не емоції чи тон мовця. Доповідь Корнельського університету використовувала VALL-E для синтезу кількох голосів, і деякі приклади роботи доступні на GitHub. У той час як зразки голосу, надані корпорацією Майкрософт, різняться за якістю, деякі звучать природно, а інші явно створені машиною та звучать як роботизоване. Однак у міру того, як технологія штучного інтелекту продовжує вдосконалюватися, згенеровані записи, ймовірно, стануть переконливішими.

Проте є занепокоєння щодо етичних наслідків цієї технології. Оскільки штучний інтелект стає потужнішим, голоси, створювані VALL-E та подібними технологіями, ставатимуть переконливішими, що може відкрити двері для реалістичних спам-дзвінків, які повторюють голоси реальних людей, яких знає потенційна жертва. Політики та інші громадські діячі також могли видаватися за себе, що могло призвести до поширення неправдивої інформації в соціальних мережах.

Крім того, є проблеми з безпекою. Деякі банки використовують технологію розпізнавання голосу для перевірки особи абонента, але якщо голоси, згенеровані штучним інтелектом, стають переконливішими, може стати важче виявити, чи використовує абонент голос VALL-E. Крім того, технологія також може вплинути на голосових акторів, оскільки їхні послуги можуть більше не знадобитися, якщо створені ШІ голоси стануть більш реалістичними.

VALL-E — це вражаючий інструмент штучного інтелекту, який може революціонізувати сферу синтезу голосу. Однак це також викликає кілька проблем етики та безпеки. Для таких компаній, як Microsoft, буде важливо розробити заходи щодо регулювання використання VALL-E, щоб переконатися, що він використовується для блага, а не для зловмисних цілей.

1 Comment

  1. … [Trackback]

    […] Find More here on that Topic: portaltele.com.ua/news/technology/vall-e-vid-microsoft-mozhe-vidtvoryty-bud-yakyj-golos-za-try-sekundy.html […]

Comments are closed.