Обновление 19 мая 2026 — после Google I/O
Gemini 3.5 Flash официально представлен на Google I/O 2026. Слухи подтвердились — это первая модель в серии 3.5. Ниже — короткое резюме, дальше идёт исходный разбор от 18 мая.
Что подтвердилось на I/O 2026
- Gemini 3.5 Flash вышел и работает уже сегодня — в Gemini-приложении (дефолтная модель), Search AI Mode, Antigravity 2.0 и через Gemini API.
- Превосходит Gemini 3.1 Pro в coding, agentic и multimodal-бенчмарках — при цене и скорости уровня Flash.
- Сундар Пичаи: модель сопоставима с leading frontier-моделями по производительности, но значительно дешевле.
- Gemini 3.5 Pro сейчас в тестировании, выйдет в следующем месяце.
- Также представлены: Gemini Omni (нативная генерация видео), Gemini Spark (личный агент), Antigravity 2.0, Daily Brief, Search-апдейт.
Что было со слухом про LM Arena
До I/O в сети ходили скриншоты «Gemini 3.5 на LM Arena». Публичного релиза действительно не было — модель тестировалась внутри. Сейчас, после официального запуска 3.5 Flash, спор о «слухах» закрыт: модель есть, и она быстро попадает на публичные лидерборды.
Полный разбор всех анонсов Google I/O 2026 — в отдельном материале:
Google I/O 2026: все анонсы — Gemini Omni, 3.5 Flash, Spark, Antigravity 2.0 и ещё 20+ обновлений
Технические факты после I/O 2026
Gemini 3.5 Flash — что подтверждено
- Дефолтная модель в Gemini-приложении начиная с 19 мая 2026.
- Превосходит Gemini 3.1 Pro в coding, agentic и multimodal-бенчмарках — при сохранении скорости и цены Flash-класса.
- Сопоставима с leading frontier-моделями (Claude Opus 4.7, GPT-5-класс) по производительности, но значительно дешевле — слова Сундара Пичаи на keynote.
- Поддерживается полный набор thinking-уровней (minimal, low, medium, high) для тонкой настройки трейд-оффа цена/качество.
- Работает в Search AI Mode, Antigravity 2.0, Google Spark и через Gemini API.
- Gemini 3.5 Pro — в тестировании, выйдет в следующем месяце с тем же фокусом.
Что вышло вместе с 3.5 Flash
- Gemini Omni — первая unified omni-модель: текст/аудио/видео/изображения на входе, видео (10 сек, 4K) на выходе. Понимает физику, рендерит CJK-текст внутри видео, синхронно генерит аудио.
- Gemini Spark — личный 24/7-агент на Gemini 3.5 Flash + Antigravity-харнесс. Интегрирован с Gmail, Docs, Sheets, Drive. Сторонние MCP — летом 2026.
- Daily Brief — утренний дайджест по Gmail/Calendar/Drive внутри Gemini-приложения.
- Antigravity 2.0 — ответ Claude Code и Codex. Глобально для всех с 19 мая, работает на 3.5 Flash.
- Search получил крупнейшее обновление за 30 лет — AI Mode с агентскими действиями.
Масштаб и инфраструктура
- Gemini app: 900 миллионов активных пользователей в месяц.
- 9.7 триллионов токенов в месяц обрабатывается на платформе Google.
- Два поколения видео в Omni съедают 86% дневной квоты AI Pro плана — цена за качество ощутимая.
Что показали на демо
- Профессор пишет тригонометрическое доказательство мелом — текст внутри сгенерированного видео читаемый. Впервые в AI-видео.
- Spaghetti test: двое едят спагетти у моря — улучшенная координация рук и естественные взаимодействия с объектами (бывшая болевая точка диффузионок).
- Spark организует block party: собирает RSVP из Sheets, трекает кто что принесёт, пишет follow-up в Gmail — пример long-horizon задачи.
Конкурентный контекст
- OpenAI закрыл Sora в апреле 2026 — рынок consumer AI-видео освободился, Google заходит с Omni.
- Anthropic держит позицию на Claude Opus 4.7 и Sonnet 4.6 — frontier-уровень, но дороже Flash в разы.
- xAI Grok 4.3 — конкурент в reasoning ($1.25/M input, $2.50/M output), но без своей экосистемы Search/Workspace.
- Mistral Medium 3.5 — open-weights альтернатива, self-hostable на 4 GPU.
Полный разбор Google I/O 2026 →
Все 24+ анонса с keynote 19 мая: Gemini Omni (нативное видео), 3.5 Flash, агент Spark, Antigravity 2.0, Search-апдейт, умные очки, Universal Cart, Gmail Live и далее. Читать полный разбор →
Что в итоге со слухом про LM Arena
К моменту утечки скриншотов модель действительно тестировалась — но не в публичном открытом доступе, а во внутреннем прогоне для финальной калибровки. После анонса 19 мая Gemini 3.5 Flash вышла на публичные лидерборды штатным путём.
Вывод: слух был частично прав по сути (модель существовала, тестировалась) и неправ по форме (публичной арены на тот момент не было). Через сутки спор закрылся официальным релизом.
Исходный материал от 18 мая 2026
Дальше — оригинальный разбор, написанный до keynote. Сохраняем как есть для контекста: какие были слухи, источники и ожидания за день до I/O.
Дата проверки: 18 мая 2026
По сети ходит утверждение: «Gemini 3.5 уже тестируется на LM Arena». В русскоязычном AI-комьюнити это разошлось быстро, с уверенными формулировками и скриншотами. Мы прошлись по официальным источникам Google и DeepMind, публичным страницам Arena, GitHub issues, Reddit и X — и вот что нашли.
Короткий вывод: публичный релиз Gemini 3.5 не подтвержден. Но слух возник на реальной почве. Разбираем всё по порядку.

TL;DR для тех, кто читает с конца
- Публичный Gemini 3.5 на Arena: не подтвержден
- Скрытый тест Google checkpoint на Arena: возможен и правдоподобен
- Что реально новое у Google сейчас: Gemini 3.1 Pro и 3.1 Flash-Lite, плюс развитие Deep Think и agentic/multimodal workflow
- Когда выйдет 3.5: официальной даты нет. Ближайшее окно — Google I/O 19-20 мая 2026
Что официально существует у Google прямо сейчас

Прежде чем говорить о слухах — зафиксируем то, что подтверждено.
Gemini 3 Pro
Google анонсировал начало эпохи Gemini 3, выпустив Gemini 3 Pro в preview и отдельно представив Gemini 3 Deep Think. В официальных материалах Google и DeepMind Gemini 3 Pro описывается как флагман по reasoning, multimodal и agentic coding с контекстом 1M токенов. Официальные цифры: 1501 Elo на LM Arena, 37.5% на Humanity's Last Exam, 91.9% на GPQA Diamond, 81.0% на MMMU-Pro, 56.9% на Terminal-Bench 2.0, 76.2% на SWE-Bench Verified.

Gemini 3 Flash
Официально выпущен 17 декабря 2025 года. Google позиционирует его как модель с Pro-grade reasoning при latency/cost-профиле Flash. Официальная цена: $0.50 / $3.00 за 1M input/output токенов. По данным Artificial Analysis, примерно в 3 раза быстрее Gemini 2.5 Pro. Работает с 1M token context. Есть бесплатный тир через Google AI Studio.
Gemini 3.1 Pro
Официально анонсирован 19 февраля 2026 года как следующий шаг поверх Gemini 3. Это не просто патч — Google прямо называет его upgrade core reasoning. Цена та же, что у 3 Pro: $2.00 / $12.00 за 1M токенов (при промптах до 200K). Для длинных промптов — $4.00 / $18.00. Доступен через AI Studio, Vertex AI, Gemini CLI, Google Antigravity, Android Studio, NotebookLM.
Ключевые бенчмарки по официальной таблице DeepMind (февраль 2026):
| Бенчмарк | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| ARC-AGI-2 | 31.1% | 77.1% |
| Humanity's Last Exam | 37.5% | 44.4% |
| GPQA Diamond | 91.9% | 94.3% |
| Terminal-Bench 2.0 | 56.9% | 68.5% |
| SWE-Bench Verified | 76.2% | 80.6% |
| LiveCodeBench Pro Elo | 2439 | 2887 |
Цифра ARC-AGI-2 — 77.1% против 31.1% у предшественника — самый заметный прыжок. По данным NxCode, это крупнейший single-generation reasoning gain среди всех frontier-моделей на момент публикации. Google Artificial Analysis Intelligence Index ставит 3.1 Pro на #1 из 116 оцененных моделей со score 57.
Но у 3.1 Pro есть и слабые стороны. TTFT (Time to First Token) — около 29 секунд по данным Artificial Analysis, это на верхней границе для reasoning-модели такого класса. Claude Opus 4.6 держит преимущество на SWE-Bench Verified (80.8% против 80.6%), на GDPval-AA (Elo 1606 против 1317 у Gemini 3.1 Pro) и на multi-agent orchestration через Agent Teams. GPT-5.3-Codex лидирует на Terminal-Bench 2.0 и SWE-Bench Pro.
Gemini 3.1 Flash-Lite
Анонсирован 3 марта 2026 года — самый дешёвый и быстрый вариант серии. Цена: $0.25 / $1.50 за 1M токенов. По данным Artificial Analysis — 2.5x faster Time to First Answer Token и +45% output speed относительно 2.5 Flash. Бенчмарки: GPQA Diamond 86.9%, MMMU-Pro 76.8%, LiveCodeBench 72.0%, Arena Elo 1432.
Что видно на Arena публично
В свежем публичном снапшоте Text Arena gemini-3.1-pro-preview — около #4 overall со score 1492. gemini-3-pro — около #7 со score 1486. gemini-3-flash — около #16.
На Creative Writing gemini-3-pro стоит примерно на #2, gemini-3.1-pro-preview — на #3. Google-модели 3.x реально сильны в open-ended задачах. В Search Arena в топе видны gemini-3.1-pro-grounding, gemini-3-flash-grounding и gemini-3-pro-grounding.
Публичного лейбла Gemini 3.5 в этих снапшотах нет.
Почему слух выглядит правдоподобным
Arena прямо указывает, что через платформу прошли 300+ pre-release тестов. Отдельная страница Arena по experiments говорит: пользователи могут видеть экспериментальные функции и поведения, сроки публичного открытия не обещаются. Скрытый Google checkpoint на Arena — нормальный сценарий, не исключение.
Именно поэтому community регулярно пытается «угадать» скрытые Google-модели по стилю ответов, качеству SVG и webdev output, latency и поведению на reasoning-задачах. И вот что сейчас происходит по факту.
Сигнал 1: Gemini 3.5 Flash уже заметили на Arena. По данным TestingCatalog и нескольких YouTube-тестов (каналы с аудиторией 100K+), новый Flash checkpoint появился на Arena под именем gemini-3.0-flash и по ранним impressions обгоняет Gemini 3.1 Pro и Claude Opus 4.7 на ряде задач. Google это не подтвердил.
Сигнал 2: Gemini 3.2 Flash в Gemini iOS app. 5 мая 2026 пользователь @Waguri_Kaoruko8 опубликовал скриншот из Gemini iOS app (build 1.2026.1710205): в model selector появился пункт «Gemini 3.2 Flash», простоял около 40 минут — и исчез после backend rollback. По данным разработчиков с preview-доступом к AI Studio, в тот же вечер в internal API logs появились ценовые данные: $0.25 input / $2.00 output за 1M токенов. Это 50% дешевле по input и 33% по output относительно Gemini 3 Flash ($0.50/$3.00).

Сигнал 3: Vertex AI deprecation notice. Клиенты Vertex AI, ещё работающие на Gemini 2 Flash, получили письмо о выводе из эксплуатации — с предложением мигрировать на Gemini 3 Flash или 3.1 Flash-Lite. Тот же notice ссылается на forthcoming GA release. Это паттерн, который Google использует перед чистым анонсом.
Сигнал 4: Google I/O 2026 — 19-20 мая. Leaks указывают на возможный анонс Gemini 3.5 Pro, Gemini 3.2 Flash (или Gemini 3.5 Flash, название ещё не устоялось) и других продуктов. По данным Abacus.AI CEO Bindu Reddy, Gemini 3.2 Flash может достигать 92% производительности GPT-5.5 на coding/reasoning при стоимости в 15-20 раз ниже. Ответ Google на эту информацию — молчание.
Максим: «Когда вышел DeepSeek R1 в январе 2025, сначала тоже был скандал — "это слух или нет". Оказалось правдой. Сейчас с Gemini похожая история: сигналов несколько, они сходятся в одном направлении, но официального подтверждения нет. Я бы наблюдал за Arena и AI Studio — там появится раньше всего.»
Что можно считать подтверждённым, а что — нет
Подтверждено
- Gemini 3 Pro, Gemini 3 Flash, Gemini 3.1 Pro и Gemini 3.1 Flash-Lite — официально существуют с документированными бенчмарками и ценами
- В публичных снапшотах Arena есть Gemini 3 и 3.1, но не публичный
Gemini 3.5 - Arena регулярно проводит скрытые/пре-релизные тесты моделей
- Новый Flash checkpoint видели на Arena — но без официального имени
- В Gemini iOS app мелькнул
gemini-3.2-flashс ценой $0.25/$2.00
Не подтверждено
- Что hidden-модель на Arena точно является Gemini 3.5
- Что у Gemini 3.5 уже есть официальная дата релиза
- Что codenames Snow Bunny, Cappuccino, Skyhawk, Seahawk — подтверждены Google. В официальных страницах таких имён нет, только в community-постах и слухах
- Что Gemini 3.5 именно Pro, а не Flash — или наоборот
Новое в API-механиках Gemini 3.x
Для разработчиков важен не только маркетинг, но и то, что изменилось под капотом. Google добавил для Gemini 3.x несколько значимых API-механик:
thinking_levelвместо legacythinking_budget— три режима: Low, Medium, High. Новый Medium режим позволяет балансировать латентность и глубину рассуждений. Предыдущие версии работали только на Low/Highmedia_resolution— контроль качества обработки визуального ввода- Более строгая работа с thought signatures
- Multimodal function responses — агент теперь может передавать результаты с изображениями и аудио в tool call responses
- Streaming function calling
- Рекомендация держать temperature = 1.0 по умолчанию для Gemini 3
Официальный API endpoint для agentic workflow: gemini-3.1-pro-preview-customtools — оптимизирован под bash и кастомные инструменты типа view_file или search_code.
Официальные кейсы и партнёрские данные
Google показывает для Gemini 3/3.1 следующие use cases: анализ больших мультимодальных наборов данных и research papers; генерация interactive guides и code-based visualizations; zero-shot web UI / vibe coding; генерация animated SVG и сложных интерактивных интерфейсов; agentic terminal/browser workflows.
По официальным блогам Google Cloud (это self-reported данные партнёров, не независимый аудит):
- Harvey — +7% improvement на BigLaw Bench против Gemini 2.5 Flash
- Geotab — +10% baseline improvement на agentic coding tasks
- Warp — +8% lift in fix accuracy
- JetBrains — качество, близкое к Gemini 3 Pro, при меньших latency/cost
- Wayfair — Gemini 3 Pro лучше справляется со structured business tasks, чем Gemini 2.5 Pro
В январе 2026 Google отдельно представил Agentic Vision для Gemini 3 Flash: модель может «исследовать» изображение через code execution. PlanCheckSolver сообщает о +5% accuracy на проверке строительных планов. Это не «доказательство 3.5», но хороший сигнал того, что Google быстро наращивает capabilities внутри публичной 3.x-линейки.
Что говорят форумы, GitHub, Reddit, X
На developer-форумах и GitHub вокруг preview-моделей Gemini 3.x — живая инженерная активность: репорты про HTML token leakage, truncated/garbage output, tool calling issues, 404/availability problems, thought signature incompatibilities, таймауты у gemini-3.1-pro-preview.
Всё это выглядит нормально для быстро итерируемой preview-линейки. Но не как признак того, что уже состоялся чистый и публичный релиз отдельного 3.5-семейства.
В X и Reddit есть волны обсуждений про «new Gemini checkpoints», «Gemini 3.2/3.5», «Snow Bunny», «Cappuccino». Но эти посты опираются на скриншоты, субъективные тесты и догадки по hidden checkpoints, а не на официальные Google docs или публичные Arena model IDs. Часть обсуждений на Reddit прямо считает, что такие «3.2/3.5 leaks» — это просто 3.1 Flash или переинтерпретация.
На YouTube за последние две недели вышло несколько видео с прямыми тестами новых Gemini checkpoint («Gemini 3.5 Flash Beats Opus 4.7», «Gemini 3.5 Flash + Pro: Fully Tested») — но все они тестируют anonymous Arena models, не публично объявленные релизы.
Текущая позиция линейки Gemini в сравнении
| Модель | Цена input/output ($1M) | Контекст | Ключевой бенчмарк |
|---|---|---|---|
| Gemini 3.1 Pro | $2.00 / $12.00 | 1M | ARC-AGI-2: 77.1% |
| Gemini 3 Flash | $0.50 / $3.00 | 1M | SWE-Bench Verified: ~76% |
| Gemini 3.1 Flash-Lite | $0.25 / $1.50 | 1M | GPQA Diamond: 86.9% |
| Gemini 3.2 Flash (leaks) | $0.25 / $2.00 | 1M | нет официальных данных |
| Claude Sonnet 4.6 | $3.00 / $15.00 | 1M | SWE-Bench Verified: 79.6% |
| Kimi K2.6 | $0.60 / $2.50 | 256K | SWE-Bench Pro: 58.6% |
Цифры Gemini 3.2 Flash — из leaked AI Studio metadata, не официальные данные.
Что значит «Gemini 3.5» для вайбкодера
Линейка Gemini 3.x уже сейчас интересна по соотношению цена/качество. Gemini 3.1 Pro при той же цене что и 3 Pro даёт двукратный прыжок на ARC-AGI-2 и лидирует на BrowseComp (85.9%) — это прямой измеритель качества веб-ресёрча и агентских задач. Для задач вайб-кодинга: SVG-генерация, interactive HTML, agentic coding workflow — Gemini 3.x конкурентоспособен.
Если слухи про Gemini 3.2 Flash / 3.5 Flash подтвердятся на Google I/O (19-20 мая), вайбкодеры получают ещё один мощный вариант в стеке: Flash-уровень по скорости и цене, Pro-уровень по качеству на coding-задачах. По данным Abacus.AI, это 92% от GPT-5.5 при стоимости в 15-20 раз ниже — если верить source.
Когда выйдет Gemini 3.5

Официальной даты выхода Gemini 3.5 нет.
Подтверждённая хронология публичной линейки:
- Gemini 3 Flash — 17 декабря 2025
- Gemini 3.1 Pro — 19 февраля 2026
- Gemini 3.1 Flash-Lite — 3 марта 2026
Если смотреть на official model pages и DeepMind materials, текущий «latest public step» — это 3.1 Pro / 3.1 Flash-Lite. Следующее логичное окно для официального анонса нового поколения — Google I/O 2026, 19-20 мая. По паттерну прошлого года (Gemini 2.5 был анонсирован на I/O 2025), именно там ждут или Gemini 3.2 Flash, или Gemini 3.5, или оба.
Глоссарий
LM Arena / Chatbot Arena — платформа для сравнения AI-моделей в «слепых» тестах. Пользователи голосуют за лучший ответ без знания, какая модель что написала. Результаты формируют Elo-рейтинг.
Hidden checkpoint — pre-release модель, которую тестируют на Arena без публичного раскрытия имени. Появляется как anonymous model в случайных сравнениях.
ARC-AGI-2 — бенчмарк от ARC Prize, тестирует способность решать принципиально новые логические паттерны, не виданные на обучении. Считается одним из самых честных измерителей reasoning.
SWE-Bench Verified — бенчмарк на resolution реальных GitHub Issues. Измеряет способность AI-модели самостоятельно исправлять баги в production-кодовых базах.
thinking_level — параметр API Gemini 3.x, аналог «бюджета на размышление». Low — быстрее, High — глубже, Medium — баланс.
MoE (Mixture of Experts) — архитектура, где из всего числа параметров активируется только часть на каждый запрос. Позволяет масштабировать модели без пропорционального роста вычислений.
FAQ
Есть ли Gemini 3.5 прямо сейчас?
Публично — нет. Название «Gemini 3.5» встречается только в слухах и community-атрибуции. Официальная текущая ступень — Gemini 3.1 Pro и 3.1 Flash-Lite. Hidden checkpoint на Arena возможен, но его имя и характеристики не подтверждены.
Что лучше сейчас использовать — Gemini 3.1 Pro или Claude Sonnet 4.6?
Зависит от задачи. Gemini 3.1 Pro лидирует на ARC-AGI-2, GPQA Diamond, BrowseComp и agentic research workflow при той же цене ($2/$12 против $3/$15). Claude Sonnet 4.6 держит преимущество на GDPval-AA и multi-agent orchestration. Для веб-ресёрча и reasoning — Gemini. Для knowledge-intensive профессиональных задач — Claude.
Gemini 3 Flash бесплатный?
Частично. Через Google AI Studio есть бесплатный тир без привязки карты. Платный тир — $0.50/$3.00 за 1M токенов. Gemini 3.1 Pro бесплатного тира не имеет.
Как подключить Gemini 3.1 Pro к своему агенту?
Через Gemini API (Google AI Studio), Vertex AI или Gemini CLI. Для agentic workflow — endpoint gemini-3.1-pro-preview-customtools. Для streaming и tool calling — стандартный gemini-3.1-pro-preview.
Snow Bunny, Cappuccino — это реальные кодовые имена?
Не подтверждено официально. В верифицированных Google/Arena документах таких названий нет. Они фигурируют только в community-постах и Medium-статьях с «leaked checkpoint».
Когда Arena публикует официальные имена скрытых моделей?
После официального анонса от компании. До этого — только как anonymous model в результатах голосований.
Как следить за новыми Gemini релизами?
Официальный blog.google, страница deepmind.google/models и Google AI Studio — там появляется раньше всего. Из community-источников — TestingCatalog (X/Telegram) и Arena Leaderboard.
Итог
Слух про «Gemini 3.5 уже на Arena» не подтверждён как публичный факт. Но он возник не из воздуха: Arena действительно тестирует hidden checkpoints, Google реально быстро выкатывает новые модели внутри 3.x-линейки, и несколько независимых сигналов (iOS app, AI Studio metadata, Vertex AI notices, Arena anonymous model) указывают в одном направлении. Конкретная привязка к названию «Gemini 3.5» — пока community attribution, не подтверждённый релиз.
Что точно актуально прямо сейчас: Gemini 3.1 Pro с его 77.1% на ARC-AGI-2 и $2/$12 pricing — реальный вариант для вайбкодерской рабочей нагрузки. Если официальный анонс 3.5/3.2 Flash случится на Google I/O (19-20 мая), мы обновим эту статью сразу.
Посмотреть все актуальные AI-инструменты — каталог AI-инструментов. Обсудить стек под конкретные задачи — запишитесь на консультацию к Максиму.
Обновлено: май 2026. Данные по бенчмаркам и ценам актуальны на дату публикации — проверяйте current values на официальных страницах Google AI и deepmind.google.