Технології

Ця модель ШІ може генерувати зразки звуку на основі текстових підказок

0

ШІ тепер має можливість генерувати музичні зразки з текстових підказок за допомогою нейронних мереж. Це справді чудово для створення композицій на основі наданих описів, таких як настрій чи стиль. Ці моделі штучного інтелекту можна використовувати для створення звукових доріжок відеоігор або просто для подолання творчого блоку, покладаючись на якісні дані та постійні вдосконалення штучного інтелекту. 

Інноваційна технічна команда Samplab представила TextToSample, плагін VST3 (технологія віртуальної студії), який дозволяє користувачам перетворювати текстові підказки в згенеровані аудіосемпли. Інструмент, доступний безкоштовно, працює як незалежно, так і в DAW (цифрова аудіоробоча станція) і може стати відповіддю на створення унікальної «мелодії» прямо з ваших думок. Уявіть собі можливості.

Плагін дійсно використовує багато ресурсів під час створення кліпу навіть середнього розміру

Спираючись на потенціал відкритого програмного забезпечення MusicGen від Meta, пакета для генерації звуку на основі штучного інтелекту, TextToSample було розроблено з використанням даних, отриманих за допомогою цього вдосконаленого алгоритму. Додатково до своїх можливостей плагін може приймати завантажені звуки, аналізувати їх і генерувати пов’язані аудіосемпли, окрім обробки текстових інструкцій.

Однак із дуже мінімалістичним інтерфейсом TextToSample має кілька проблем. Відповіді не завжди точні, і вам доводиться боротися та боротися з кількома підказками, щоб справді потрапити туди, куди вам потрібно. Отже, досконалість може бути не відразу, але є шанс, що ви можете її досягти.

Незважаючи на ці обмеження, TextToSample може бути дуже веселим. Це чудовий приклад можливостей генеративного штучного інтелекту, особливо щодо створення музики у 2023 році, хоча він не позбавлений частки помилок. Деякі користувачі зіткнулися з небажаними доповненнями, наприклад ударними, коли вони спеціально відмовилися від перкусії. Я особисто користувався цією програмою, і вона використовувала величезну кількість ресурсів для створення 10-секундного аудіокліпу, який був у кращому випадку посередньої якості, уповільнюючи роботу моєї машини.

Comments

Comments are closed.