Сімейство моделей Gemini поповнюється. Цього разу компанія представляє Gemini 2.5 Flash-Lite у режимі попереднього перегляду, починаючи відсьогодні, а також робить потужніші моделі 2.5 Pro та 2.5 Flash загальнодоступними для виробничого використання. Google зазначає, що Flash-Lite кращий за своїх попередників версії 2.0 у тестах кодування, математики та мислення. Основна ідея полягає в тому, щоб він обробляв такі речі, як переклад або класифікація, у великих масштабах, де швидкість є важливою.
Ціноутворення, безумовно, відображає цю зосередженість на обсягах. Flash-Lite є найдешевшим варіантом з великим відривом, коштуючи $0,10 за 1 млн вхідних токенів та $0,40 за 1 млн вихідних токенів, але його базова продуктивність у складних завданнях мислення досить низька, набравши лише 5,1% на Humanity’s Last Exam.
Однак найцікавішою особливістю є режим «Мислення». Коли ви його ввімкнули, моделі потрібно більше часу для обробки запиту, а її можливості значно покращилися. Наприклад, її продуктивність у складному математичному бенчмарку під назвою AIME 2025 зростає з поважних 49,8% до набагато сильніших 63,1%. Така ж закономірність спостерігається під час тестування здатності знаходити інформацію у великому документі, де її здатність до запам’ятовування майже подвоюється. Ось таблиця бенчмарків, надана Google:

Google заявляє, що розробники можуть негайно розпочати експерименти з цією новою моделлю. Попередня версія Gemini 2.5 Flash-Lite тепер доступна через Google AI Studio та орієнтовану на розробників платформу Vertex AI. Більш потужні та стабільні версії 2.5 Flash та Pro доступні в тих самих місцях, але також інтегровані в основний додаток Gemini для споживачів. Компанія навіть зазначила, що користувацькі версії Flash-Lite та Flash вже використовуються для роботи частин власної пошукової системи.
Коментарі