Дата исследования: 18 мая 2026 Повод: Инсайдерская информация о выходе Gemini 3.5 на LM Arena Google I/O 2026: 19–20 мая (завтра!) Статус: НЕ анонсирован официально, активно тестируется
400 000+ органических переходов за 3 месяца. Со-основатель GoBanana (231K пользователей, 12+ млн ₽ без рекламы) и NeuroScribe (65K пользователей). SEO/GEO-стратегии для AI-поисковиков, 1 700+ единиц контента, 17+ реализованных стратегий.
Об авторе →Google I/O 2026: все анонсы — Gemini Omni, 3.5 Flash, Spark агент, Antigravity 2.0 и ещё 20+ обновлений
Полный разбор Google I/O 2026: Gemini Omni с нативной генерацией видео, Gemini 3.5 Flash быстрее конкурентов в 4 раза, личный агент Spark, Antigravity 2.0, умные очки Samsung, Universal Cart и всё остальное с keynote 19 мая 2026.
Gemini 3.5 на LM Arena 2026: правда, слух или что-то среднее
По сети ходит утверждение: «Gemini 3.5 уже тестируется на LM Arena». В русскоязычном AI-комьюнити это разошлось быстро, с уверенными формулировками и скриншотами. Мы прошлись по официальным источникам Google и DeepMind, публичным страницам Arena, Git…
Gemini 3.5: что это такое и почему об этом говорит весь AI-интернет
Если вы видели в последние дни посты про «Gemini 3.5 уже вышел» — вы не одни. Тема взорвала X, Reddit и русскоязычные AI-каналы. Но правда немного сложнее, чем кажется. Разбираем без технического жаргона: что происходит, что уже можно использовать и…
Gemini 3 для кода: что изменилось и стоит ли переходить прямо сейчас
Google выпустил Gemini 3 в ноябре 2025, и это серьезный скачок. По SWE-bench Verified модель набрала 76.2% против 56.6% у Gemini 2.5 Pro. Потом вышел Flash, разогнавший эту цифру до 78%. А в феврале 2026 появился Gemini 3.1 Pro с результатом 80.6% на…
DeepSeek Coder API как подключить к своему проекту за 15 минут
DeepSeek API подключается через тот же OpenAI Python SDK — меняете только два параметра: base_url и api_key. Стоит $0.14 за миллион входных токенов для V4 Flash, новые аккаунты получают несколько миллионов бесплатных токенов. Один $2 депозит — это де…
DeepSeek R1 Coder чем он отличается от обычного Coder и когда его использовать
DeepSeek R1 — это reasoning-модель: перед тем как ответить, она проходит внутреннюю цепочку рассуждений через <think>...</think> блоки. На сложных алгоритмических задачах R1 пишет более корректный код, чем специализированный Coder. На простых задачах…
Gemini 3.5 Flash официально представлен на Google I/O 2026. Слухи подтвердились — это первая модель в серии 3.5. Ниже — короткое резюме, дальше идёт исходный разбор от 18 мая.
На 18 мая ответ был «не анонсирован официально, активно тестируется». На 19 мая — Gemini 3.5 Flash официально вышел. Pro — следующим месяцем.
Полный разбор всех анонсов Google I/O 2026 — в отдельном материале:
Google I/O 2026: все анонсы — Gemini Omni, 3.5 Flash, Spark, Antigravity 2.0 и ещё 20+ обновлений
Все 24+ анонса с keynote 19 мая: Gemini Omni (нативное видео), 3.5 Flash, агент Spark, Antigravity 2.0, Search-апдейт, умные очки, Universal Cart, Gmail Live и далее. Читать полный разбор →
Да, Gemini 3.5 вышла. Точнее — Gemini 3.5 Flash. Это первая модель новой серии. Pro — следующим месяцем. Все слухи про LM Arena, Antigravity 2.0 и анонс на I/O подтвердились в течение 24 часов после публикации этой статьи.
Если читаете спустя время после I/O — модель уже работает дефолтной в Gemini-приложении, в Search AI Mode и доступна через Gemini API.
Дальше — оригинальный разбор, написанный до keynote. Сохраняем как есть для контекста: какие были слухи, источники и ожидания за день до I/O.
Дата исследования: 18 мая 2026
Повод: Инсайдерская информация о выходе Gemini 3.5 на LM Arena
Google I/O 2026: 19–20 мая (завтра!)
Статус: НЕ анонсирован официально, активно тестируется

Фактчек: Модель не анонсирована Google официально, но:
Gemini 3 Flash (техническое имя: Gemini 3.0 0 flash). Качество вывода драматически лучше обычного Flash — сообщество уверено, что это Gemini 3.5 Flash.| Кодовое имя | Период | Что это | Статус |
|---|---|---|---|
| Snow Bunny (DN9, D13) | Январь–Февраль 2026 | Ранний Internal build Gemini 3.5 Pro. 3000 строк кода, Game Boy эмулятор. System 2 reasoning. | Утёк через AI Studio A/B тесты. Возможно = ранний Cappuccino. |
| Fierce Falcon | Январь–Февраль 2026 | Под-модель Snow Bunny: прецизионная логика, код, математика | Слухи |
| Ghost Falcon | Январь–Февраль 2026 | Под-модель Snow Bunny: дизайн, SVG, аудио, креатив | Слухи |
| Fanta / Sprite / Cola | Апрель–Май 2026 | Ранние чекпоинты 3.2 Flash thinking → underwhelming | Переименованы в 3.5 family |
| Cappuccino | Май 2026 | Текущий сильнейший чекпоинт Gemini 3.5 Pro. Генерирует full-on Minecraft clone. | Тестируется, предположительно покажут на I/O |
Ноя 2025 — Gemini 3 Pro (preview)
Дек 2025 — Gemini 3 Flash
Янв 2026 — Snow Bunny утекает через AI Studio (DN9/D13)
Фев 2026 — Gemini 3.1 Pro (preview) + Gemini 3 Deep Think
Мар 2026 — Gemini 3.1 Flash-Lite preview
Апр 2026 — Claude Opus 4.7 (16 апр), GPT-5.5 (23 апр)
Май 2-3 — Аномальные результаты "Gemini 3 Flash" на Arena
Май 5 — 3.2 Flash появляется в iOS app + AI Studio → отозван
Май 7 — Gemini 3.1 Flash-Lite GA
Май 14 — Gemini Spark BETA обнаружен в Google App v17.23
Май 17 — TechTimes: новый Gemini на I/O, ожидается 3.2 или 3.5
Май 18 — СЕГОДНЯ: YouTube-обзоры вскрывают детали
Май 19-20 — GOOGLE I/O 2026 🎯⚠️ Важно: Arena — это «vibes benchmark», измеряет human preference, а не raw capability. Стиль и «agreeableness» могут завышать позиции.
| Модель | Elo | Организация |
|---|---|---|
| claude-opus-4-6-thinking | 1500 | Anthropic |
| claude-opus-4-6 | 1497 | Anthropic |
| gemini-3.1-pro-preview | 1487 | |
| claude-opus-4-7-thinking | 1487 | Anthropic |
| gemini-3-pro | 1479 | |
| claude-opus-4-7 | 1478 | Anthropic |
| gpt-5.5-high | 1473 | OpenAI |
| gemini-3-flash | 1467 |
Gemini 3.5 Flash пока НЕТ в официальной таблице (тестируется скрыто), но наблюдатели ставят его между 3.1 Pro и Opus 4.7.
| Проблема | Описание |
|---|---|
| Overtraining на SaaS UI | Модель добавляет лишние HUD/панели даже при явном запрете. Перетренирована на современных UI-эстетиках. |
| Prompt adherence | Игнорирует инструкции «не использовать веб-доступ». Слабая адгезия к промпту. |
| Hallucination rate | Gemini 3 Flash: 91% на бенчмарках «незнания» — модель врёт вместо признания незнания. |
| Повторяющийся UI | Как и GPT-5.4, генерирует одинаковые панели для фронтенда. |
| 3D-слабости | Горный рельеф в 3JS — неудачная генерация. |
| Vibes benchmark | Arena-рейтинг может быть завышен из-за «приятного» стиля ответов, а не реальной компетенции. |
«Gemini will share necessary info with third parties. This could include your name, contact information, files, preferences, and info you might find sensitive.»
«While it is designed to ask for your permission before taking sensitive actions, it may do things like share your info or make purchases without asking.»
AGENT_MODE_FG_SERVICE — постоянно работает в фонеagent_schedules — планировщик задачagent_skills — модульные навыкиМай 16-17 → Gemini 3.1 Flash GA (Vertex AI release notes)
Май 19-20 → GOOGLE I/O:
- Gemini 3.5 Pro анонс (Cappuccino)
- Gemini Spark BETA
- Gemini Intelligence (proactive assistant)
- Android XR glasses
Июнь/Июль → Gemini 3.5 Flash публичный релизОснование: Google historically выпускает Flash-модели через Vertex за пару дней до I/O, а Pro — на самой конференции.
| Модель | Input (/1M) | Output (/1M) | Контекст | |
|---|---|---|---|
| Gemini 3 Flash (публичный) | $0.50 | $3.00 | 1M |
| Gemini 3.2 Flash (утёк) | $0.25 | $2.00 | 1M |
| Gemini 3.1 Pro | $2.00 | $12.00 | 1M |
| Gemini 3.1 Flash-Lite | ~$0.25 | ~$1.00 | 1M |
| Claude Opus 4.7 | $15.00 | $75.00 | 1M |
| GPT-5.5 Standard | $15.00 | $60.00 | 256K |
Gemini в 30–60 раз дешевле Claude Opus 4.7 на output-токенах. Это ключевое преимущество.
| Бенчмарк | Gemini 3.1 Pro | Gemini 3 Pro | Claude Opus 4.7 | GPT-5.5 | Gemini 3.5 (слухи) |
|---|---|---|---|---|---|
| GPQA Diamond | 94.3% | 91.9% | 94.2% | 93.6% | >90% |
| HLE (no tools) | 44.4% | 37.5% | 46.9% | ~40% | — |
| ARC-AGI-2 | 77.1% | 31.1% | 68.8% | 52.9% | — |
| SWE-bench Verified | 80.6% | 76.2% | 80.8% | 80.0% | — |
| Hieroglyph (Lateral) | — | — | ~60% | 55% | 80-88% 🚀 |
| MMLU | 92.6% | — | 91.1% | 89.6% | — |
| Terminal-Bench 2.0 | 68.5% | 56.9% | 69-72% | 82.7% | — |
Ключевой инсайт: Snow Bunny якобы показал 80-88% на Hieroglyph (латеральное мышление) — это прорыв, т.к. конкуренты застревают на 55%.
Досье от VibeCoderz.ru составлено 18 мая 2026. Все данные основаны на утечках, Arena-тестах и публикациях. Официальные спецификации ожидаются 19-20 мая на Google I/O.