Google створила ШІ для перевірки фактів у відповідях інших ШІ

Компанія Google розробила ШІ-систему “оцінки фактів на основі пошукової видачі ” (Search-Augmented Factuality Evaluator, SAFE), завдання якої знаходити помилки у відповідях сервісів на базі великих мовних моделей (LLM) на кшталт ChatGPT.

LLM використовуються в різних цілях, аж до написання наукових праць, проте вони нерідко помиляються, наводячи недостовірні відомості, і навіть наполягаючи на їхній істинності (галюцинуючи). Нова розробка команди Google DeepMind виокремлює з виведення нейромережі окремі факти, формує запит до пошукової системи та намагається знайти підтвердження викладених відомостей.

Під час тестування SAFE перевірила 16 тисяч відповідей кількох сервісів на базі великих мовних моделей, серед яких Gemini, ChatGPT, Claude та PaLM-2, після чого дослідники порівняли результати з висновками людей, які робили це вручну. Висновки SAFE на 72% збіглися з думками людей, причому під час аналізу розбіжностей у 76% істина опинялася за ШІ.

Код SAFE опубліковано на GitHub і доступний всім бажаючим перевірити надійність відповідей LLM.

Google створила ШІ для перевірки фактів у відповідях інших ШІ

Apple готує нову модель продажу пристроїв

OLED-панелі Samsung для ноутбуків отримали стандарт True Black 1400

Samsung почала розповсюджувати липневе оновлення One UI для Galaxy Z Fold7 та Z Flip7

Смартфони можуть знову подорожчати: TSMC планує підняти ціни на чипи

Наука про мозок під питанням: вчені виявили проблему з повторенням експериментів

iPhone 18 Pro вже у виробництві: Foxconn нарощує потужності перед запуском нової серії Apple

Tesla анонсувала масштабне оновлення для своїх електрокарів

Google створила ШІ для перевірки фактів у відповідях інших ШІ

Читайте також

Apple готує нову модель продажу пристроїв

OLED-панелі Samsung для ноутбуків отримали стандарт True Black 1400

Samsung почала розповсюджувати липневе оновлення One UI для Galaxy Z Fold7 та Z Flip7

Смартфони можуть знову подорожчати: TSMC планує підняти ціни на чипи

Наука про мозок під питанням: вчені виявили проблему з повторенням експериментів

iPhone 18 Pro вже у виробництві: Foxconn нарощує потужності перед запуском нової серії Apple

Tesla анонсувала масштабне оновлення для своїх електрокарів