Модели и сравнения2026/05/1811 мин чтения

Gemini 3.5 на LM Arena 2026: правда, слух или что-то среднее

По сети ходит утверждение: «Gemini 3.5 уже тестируется на LM Arena». В русскоязычном AI-комьюнити это разошлось быстро, с уверенными формулировками и скриншотами. Мы прошлись по официальным источникам Google и DeepMind, публичным страницам Arena, Git…

Содержание (24)+

Обновление 19 мая 2026 — после Google I/O

Gemini 3.5 Flash официально представлен на Google I/O 2026. Слухи подтвердились — это первая модель в серии 3.5. Ниже — короткое резюме, дальше идёт исходный разбор от 18 мая.

Что подтвердилось на I/O 2026

Gemini 3.5 Flash вышел и работает уже сегодня — в Gemini-приложении (дефолтная модель), Search AI Mode, Antigravity 2.0 и через Gemini API.
Превосходит Gemini 3.1 Pro в coding, agentic и multimodal-бенчмарках — при цене и скорости уровня Flash.
Сундар Пичаи: модель сопоставима с leading frontier-моделями по производительности, но значительно дешевле.
Gemini 3.5 Pro сейчас в тестировании, выйдет в следующем месяце.
Также представлены: Gemini Omni (нативная генерация видео), Gemini Spark (личный агент), Antigravity 2.0, Daily Brief, Search-апдейт.

Что было со слухом про LM Arena

До I/O в сети ходили скриншоты «Gemini 3.5 на LM Arena». Публичного релиза действительно не было — модель тестировалась внутри. Сейчас, после официального запуска 3.5 Flash, спор о «слухах» закрыт: модель есть, и она быстро попадает на публичные лидерборды.

Полный разбор всех анонсов Google I/O 2026 — в отдельном материале:

Google I/O 2026: все анонсы — Gemini Omni, 3.5 Flash, Spark, Antigravity 2.0 и ещё 20+ обновлений

Технические факты после I/O 2026

Gemini 3.5 Flash — что подтверждено

Дефолтная модель в Gemini-приложении начиная с 19 мая 2026.
Превосходит Gemini 3.1 Pro в coding, agentic и multimodal-бенчмарках — при сохранении скорости и цены Flash-класса.
Сопоставима с leading frontier-моделями (Claude Opus 4.7, GPT-5-класс) по производительности, но значительно дешевле — слова Сундара Пичаи на keynote.
Поддерживается полный набор thinking-уровней (minimal, low, medium, high) для тонкой настройки трейд-оффа цена/качество.
Работает в Search AI Mode, Antigravity 2.0, Google Spark и через Gemini API.
Gemini 3.5 Pro — в тестировании, выйдет в следующем месяце с тем же фокусом.

Что вышло вместе с 3.5 Flash

Gemini Omni — первая unified omni-модель: текст/аудио/видео/изображения на входе, видео (10 сек, 4K) на выходе. Понимает физику, рендерит CJK-текст внутри видео, синхронно генерит аудио.
Gemini Spark — личный 24/7-агент на Gemini 3.5 Flash + Antigravity-харнесс. Интегрирован с Gmail, Docs, Sheets, Drive. Сторонние MCP — летом 2026.
Daily Brief — утренний дайджест по Gmail/Calendar/Drive внутри Gemini-приложения.
Antigravity 2.0 — ответ Claude Code и Codex. Глобально для всех с 19 мая, работает на 3.5 Flash.
Search получил крупнейшее обновление за 30 лет — AI Mode с агентскими действиями.

Масштаб и инфраструктура

Gemini app: 900 миллионов активных пользователей в месяц.
9.7 триллионов токенов в месяц обрабатывается на платформе Google.
Два поколения видео в Omni съедают 86% дневной квоты AI Pro плана — цена за качество ощутимая.

Что показали на демо

Профессор пишет тригонометрическое доказательство мелом — текст внутри сгенерированного видео читаемый. Впервые в AI-видео.
Spaghetti test: двое едят спагетти у моря — улучшенная координация рук и естественные взаимодействия с объектами (бывшая болевая точка диффузионок).
Spark организует block party: собирает RSVP из Sheets, трекает кто что принесёт, пишет follow-up в Gmail — пример long-horizon задачи.

Конкурентный контекст

OpenAI закрыл Sora в апреле 2026 — рынок consumer AI-видео освободился, Google заходит с Omni.
Anthropic держит позицию на Claude Opus 4.7 и Sonnet 4.6 — frontier-уровень, но дороже Flash в разы.
xAI Grok 4.3 — конкурент в reasoning ($1.25/M input, $2.50/M output), но без своей экосистемы Search/Workspace.
Mistral Medium 3.5 — open-weights альтернатива, self-hostable на 4 GPU.

Полный разбор Google I/O 2026 →

Все 24+ анонса с keynote 19 мая: Gemini Omni (нативное видео), 3.5 Flash, агент Spark, Antigravity 2.0, Search-апдейт, умные очки, Universal Cart, Gmail Live и далее. Читать полный разбор →

Что в итоге со слухом про LM Arena

К моменту утечки скриншотов модель действительно тестировалась — но не в публичном открытом доступе, а во внутреннем прогоне для финальной калибровки. После анонса 19 мая Gemini 3.5 Flash вышла на публичные лидерборды штатным путём.

Вывод: слух был частично прав по сути (модель существовала, тестировалась) и неправ по форме (публичной арены на тот момент не было). Через сутки спор закрылся официальным релизом.

Исходный материал от 18 мая 2026

Дальше — оригинальный разбор, написанный до keynote. Сохраняем как есть для контекста: какие были слухи, источники и ожидания за день до I/O.

Дата проверки: 18 мая 2026

Короткий вывод: публичный релиз Gemini 3.5 не подтвержден. Но слух возник на реальной почве. Разбираем всё по порядку.

TL;DR для тех, кто читает с конца

Публичный Gemini 3.5 на Arena: не подтвержден
Скрытый тест Google checkpoint на Arena: возможен и правдоподобен
Что реально новое у Google сейчас: Gemini 3.1 Pro и 3.1 Flash-Lite, плюс развитие Deep Think и agentic/multimodal workflow
Когда выйдет 3.5: официальной даты нет. Ближайшее окно — Google I/O 19-20 мая 2026

Что официально существует у Google прямо сейчас

Прежде чем говорить о слухах — зафиксируем то, что подтверждено.

Gemini 3 Pro

Google анонсировал начало эпохи Gemini 3, выпустив Gemini 3 Pro в preview и отдельно представив Gemini 3 Deep Think. В официальных материалах Google и DeepMind Gemini 3 Pro описывается как флагман по reasoning, multimodal и agentic coding с контекстом 1M токенов. Официальные цифры: 1501 Elo на LM Arena, 37.5% на Humanity's Last Exam, 91.9% на GPQA Diamond, 81.0% на MMMU-Pro, 56.9% на Terminal-Bench 2.0, 76.2% на SWE-Bench Verified.

Gemini 3 Flash

Официально выпущен 17 декабря 2025 года. Google позиционирует его как модель с Pro-grade reasoning при latency/cost-профиле Flash. Официальная цена: $0.50 / $3.00 за 1M input/output токенов. По данным Artificial Analysis, примерно в 3 раза быстрее Gemini 2.5 Pro. Работает с 1M token context. Есть бесплатный тир через Google AI Studio.

Gemini 3.1 Pro

Официально анонсирован 19 февраля 2026 года как следующий шаг поверх Gemini 3. Это не просто патч — Google прямо называет его upgrade core reasoning. Цена та же, что у 3 Pro: $2.00 / $12.00 за 1M токенов (при промптах до 200K). Для длинных промптов — $4.00 / $18.00. Доступен через AI Studio, Vertex AI, Gemini CLI, Google Antigravity, Android Studio, NotebookLM.

Ключевые бенчмарки по официальной таблице DeepMind (февраль 2026):

Бенчмарк	Gemini 3 Pro	Gemini 3.1 Pro
ARC-AGI-2	31.1%	77.1%
Humanity's Last Exam	37.5%	44.4%
GPQA Diamond	91.9%	94.3%
Terminal-Bench 2.0	56.9%	68.5%
SWE-Bench Verified	76.2%	80.6%
LiveCodeBench Pro Elo	2439	2887

Цифра ARC-AGI-2 — 77.1% против 31.1% у предшественника — самый заметный прыжок. По данным NxCode, это крупнейший single-generation reasoning gain среди всех frontier-моделей на момент публикации. Google Artificial Analysis Intelligence Index ставит 3.1 Pro на #1 из 116 оцененных моделей со score 57.

Но у 3.1 Pro есть и слабые стороны. TTFT (Time to First Token) — около 29 секунд по данным Artificial Analysis, это на верхней границе для reasoning-модели такого класса. Claude Opus 4.6 держит преимущество на SWE-Bench Verified (80.8% против 80.6%), на GDPval-AA (Elo 1606 против 1317 у Gemini 3.1 Pro) и на multi-agent orchestration через Agent Teams. GPT-5.3-Codex лидирует на Terminal-Bench 2.0 и SWE-Bench Pro.

Gemini 3.1 Flash-Lite

Анонсирован 3 марта 2026 года — самый дешёвый и быстрый вариант серии. Цена: $0.25 / $1.50 за 1M токенов. По данным Artificial Analysis — 2.5x faster Time to First Answer Token и +45% output speed относительно 2.5 Flash. Бенчмарки: GPQA Diamond 86.9%, MMMU-Pro 76.8%, LiveCodeBench 72.0%, Arena Elo 1432.

Что видно на Arena публично

В свежем публичном снапшоте Text Arena gemini-3.1-pro-preview — около #4 overall со score 1492. gemini-3-pro — около #7 со score 1486. gemini-3-flash — около #16.

На Creative Writing gemini-3-pro стоит примерно на #2, gemini-3.1-pro-preview — на #3. Google-модели 3.x реально сильны в open-ended задачах. В Search Arena в топе видны gemini-3.1-pro-grounding, gemini-3-flash-grounding и gemini-3-pro-grounding.

Публичного лейбла Gemini 3.5 в этих снапшотах нет.

Почему слух выглядит правдоподобным

Arena прямо указывает, что через платформу прошли 300+ pre-release тестов. Отдельная страница Arena по experiments говорит: пользователи могут видеть экспериментальные функции и поведения, сроки публичного открытия не обещаются. Скрытый Google checkpoint на Arena — нормальный сценарий, не исключение.

Именно поэтому community регулярно пытается «угадать» скрытые Google-модели по стилю ответов, качеству SVG и webdev output, latency и поведению на reasoning-задачах. И вот что сейчас происходит по факту.

Сигнал 1: Gemini 3.5 Flash уже заметили на Arena. По данным TestingCatalog и нескольких YouTube-тестов (каналы с аудиторией 100K+), новый Flash checkpoint появился на Arena под именем gemini-3.0-flash и по ранним impressions обгоняет Gemini 3.1 Pro и Claude Opus 4.7 на ряде задач. Google это не подтвердил.

Сигнал 2: Gemini 3.2 Flash в Gemini iOS app. 5 мая 2026 пользователь @Waguri_Kaoruko8 опубликовал скриншот из Gemini iOS app (build 1.2026.1710205): в model selector появился пункт «Gemini 3.2 Flash», простоял около 40 минут — и исчез после backend rollback. По данным разработчиков с preview-доступом к AI Studio, в тот же вечер в internal API logs появились ценовые данные: $0.25 input / $2.00 output за 1M токенов. Это 50% дешевле по input и 33% по output относительно Gemini 3 Flash ($0.50/$3.00).

Сигнал 3: Vertex AI deprecation notice. Клиенты Vertex AI, ещё работающие на Gemini 2 Flash, получили письмо о выводе из эксплуатации — с предложением мигрировать на Gemini 3 Flash или 3.1 Flash-Lite. Тот же notice ссылается на forthcoming GA release. Это паттерн, который Google использует перед чистым анонсом.

Сигнал 4: Google I/O 2026 — 19-20 мая. Leaks указывают на возможный анонс Gemini 3.5 Pro, Gemini 3.2 Flash (или Gemini 3.5 Flash, название ещё не устоялось) и других продуктов. По данным Abacus.AI CEO Bindu Reddy, Gemini 3.2 Flash может достигать 92% производительности GPT-5.5 на coding/reasoning при стоимости в 15-20 раз ниже. Ответ Google на эту информацию — молчание.

Максим: «Когда вышел DeepSeek R1 в январе 2025, сначала тоже был скандал — "это слух или нет". Оказалось правдой. Сейчас с Gemini похожая история: сигналов несколько, они сходятся в одном направлении, но официального подтверждения нет. Я бы наблюдал за Arena и AI Studio — там появится раньше всего.»

Что можно считать подтверждённым, а что — нет

Подтверждено

Gemini 3 Pro, Gemini 3 Flash, Gemini 3.1 Pro и Gemini 3.1 Flash-Lite — официально существуют с документированными бенчмарками и ценами
В публичных снапшотах Arena есть Gemini 3 и 3.1, но не публичный Gemini 3.5
Arena регулярно проводит скрытые/пре-релизные тесты моделей
Новый Flash checkpoint видели на Arena — но без официального имени
В Gemini iOS app мелькнул gemini-3.2-flash с ценой $0.25/$2.00

Не подтверждено

Что hidden-модель на Arena точно является Gemini 3.5
Что у Gemini 3.5 уже есть официальная дата релиза
Что codenames Snow Bunny, Cappuccino, Skyhawk, Seahawk — подтверждены Google. В официальных страницах таких имён нет, только в community-постах и слухах
Что Gemini 3.5 именно Pro, а не Flash — или наоборот

Новое в API-механиках Gemini 3.x

Для разработчиков важен не только маркетинг, но и то, что изменилось под капотом. Google добавил для Gemini 3.x несколько значимых API-механик:

thinking_level вместо legacy thinking_budget — три режима: Low, Medium, High. Новый Medium режим позволяет балансировать латентность и глубину рассуждений. Предыдущие версии работали только на Low/High
media_resolution — контроль качества обработки визуального ввода
Более строгая работа с thought signatures
Multimodal function responses — агент теперь может передавать результаты с изображениями и аудио в tool call responses
Streaming function calling
Рекомендация держать temperature = 1.0 по умолчанию для Gemini 3

Официальный API endpoint для agentic workflow: gemini-3.1-pro-preview-customtools — оптимизирован под bash и кастомные инструменты типа view_file или search_code.

Официальные кейсы и партнёрские данные

Google показывает для Gemini 3/3.1 следующие use cases: анализ больших мультимодальных наборов данных и research papers; генерация interactive guides и code-based visualizations; zero-shot web UI / vibe coding; генерация animated SVG и сложных интерактивных интерфейсов; agentic terminal/browser workflows.

По официальным блогам Google Cloud (это self-reported данные партнёров, не независимый аудит):

Harvey — +7% improvement на BigLaw Bench против Gemini 2.5 Flash
Geotab — +10% baseline improvement на agentic coding tasks
Warp — +8% lift in fix accuracy
JetBrains — качество, близкое к Gemini 3 Pro, при меньших latency/cost
Wayfair — Gemini 3 Pro лучше справляется со structured business tasks, чем Gemini 2.5 Pro

В январе 2026 Google отдельно представил Agentic Vision для Gemini 3 Flash: модель может «исследовать» изображение через code execution. PlanCheckSolver сообщает о +5% accuracy на проверке строительных планов. Это не «доказательство 3.5», но хороший сигнал того, что Google быстро наращивает capabilities внутри публичной 3.x-линейки.

Что говорят форумы, GitHub, Reddit, X

На developer-форумах и GitHub вокруг preview-моделей Gemini 3.x — живая инженерная активность: репорты про HTML token leakage, truncated/garbage output, tool calling issues, 404/availability problems, thought signature incompatibilities, таймауты у gemini-3.1-pro-preview.

Всё это выглядит нормально для быстро итерируемой preview-линейки. Но не как признак того, что уже состоялся чистый и публичный релиз отдельного 3.5-семейства.

В X и Reddit есть волны обсуждений про «new Gemini checkpoints», «Gemini 3.2/3.5», «Snow Bunny», «Cappuccino». Но эти посты опираются на скриншоты, субъективные тесты и догадки по hidden checkpoints, а не на официальные Google docs или публичные Arena model IDs. Часть обсуждений на Reddit прямо считает, что такие «3.2/3.5 leaks» — это просто 3.1 Flash или переинтерпретация.

На YouTube за последние две недели вышло несколько видео с прямыми тестами новых Gemini checkpoint («Gemini 3.5 Flash Beats Opus 4.7», «Gemini 3.5 Flash + Pro: Fully Tested») — но все они тестируют anonymous Arena models, не публично объявленные релизы.

Текущая позиция линейки Gemini в сравнении

Модель	Цена input/output ($1M)	Контекст	Ключевой бенчмарк
Gemini 3.1 Pro	$2.00 / $12.00	1M	ARC-AGI-2: 77.1%
Gemini 3 Flash	$0.50 / $3.00	1M	SWE-Bench Verified: ~76%
Gemini 3.1 Flash-Lite	$0.25 / $1.50	1M	GPQA Diamond: 86.9%
Gemini 3.2 Flash (leaks)	$0.25 / $2.00	1M	нет официальных данных
Claude Sonnet 4.6	$3.00 / $15.00	1M	SWE-Bench Verified: 79.6%
Kimi K2.6	$0.60 / $2.50	256K	SWE-Bench Pro: 58.6%

Цифры Gemini 3.2 Flash — из leaked AI Studio metadata, не официальные данные.

Что значит «Gemini 3.5» для вайбкодера

Линейка Gemini 3.x уже сейчас интересна по соотношению цена/качество. Gemini 3.1 Pro при той же цене что и 3 Pro даёт двукратный прыжок на ARC-AGI-2 и лидирует на BrowseComp (85.9%) — это прямой измеритель качества веб-ресёрча и агентских задач. Для задач вайб-кодинга: SVG-генерация, interactive HTML, agentic coding workflow — Gemini 3.x конкурентоспособен.

Если слухи про Gemini 3.2 Flash / 3.5 Flash подтвердятся на Google I/O (19-20 мая), вайбкодеры получают ещё один мощный вариант в стеке: Flash-уровень по скорости и цене, Pro-уровень по качеству на coding-задачах. По данным Abacus.AI, это 92% от GPT-5.5 при стоимости в 15-20 раз ниже — если верить source.

Когда выйдет Gemini 3.5

Официальной даты выхода Gemini 3.5 нет.

Подтверждённая хронология публичной линейки:

Gemini 3 Flash — 17 декабря 2025
Gemini 3.1 Pro — 19 февраля 2026
Gemini 3.1 Flash-Lite — 3 марта 2026

Если смотреть на official model pages и DeepMind materials, текущий «latest public step» — это 3.1 Pro / 3.1 Flash-Lite. Следующее логичное окно для официального анонса нового поколения — Google I/O 2026, 19-20 мая. По паттерну прошлого года (Gemini 2.5 был анонсирован на I/O 2025), именно там ждут или Gemini 3.2 Flash, или Gemini 3.5, или оба.

Глоссарий

LM Arena / Chatbot Arena — платформа для сравнения AI-моделей в «слепых» тестах. Пользователи голосуют за лучший ответ без знания, какая модель что написала. Результаты формируют Elo-рейтинг.

Hidden checkpoint — pre-release модель, которую тестируют на Arena без публичного раскрытия имени. Появляется как anonymous model в случайных сравнениях.

ARC-AGI-2 — бенчмарк от ARC Prize, тестирует способность решать принципиально новые логические паттерны, не виданные на обучении. Считается одним из самых честных измерителей reasoning.

SWE-Bench Verified — бенчмарк на resolution реальных GitHub Issues. Измеряет способность AI-модели самостоятельно исправлять баги в production-кодовых базах.

thinking_level — параметр API Gemini 3.x, аналог «бюджета на размышление». Low — быстрее, High — глубже, Medium — баланс.

MoE (Mixture of Experts) — архитектура, где из всего числа параметров активируется только часть на каждый запрос. Позволяет масштабировать модели без пропорционального роста вычислений.

FAQ

Есть ли Gemini 3.5 прямо сейчас?
Публично — нет. Название «Gemini 3.5» встречается только в слухах и community-атрибуции. Официальная текущая ступень — Gemini 3.1 Pro и 3.1 Flash-Lite. Hidden checkpoint на Arena возможен, но его имя и характеристики не подтверждены.

Что лучше сейчас использовать — Gemini 3.1 Pro или Claude Sonnet 4.6?
Зависит от задачи. Gemini 3.1 Pro лидирует на ARC-AGI-2, GPQA Diamond, BrowseComp и agentic research workflow при той же цене ($2/$12 против $3/$15). Claude Sonnet 4.6 держит преимущество на GDPval-AA и multi-agent orchestration. Для веб-ресёрча и reasoning — Gemini. Для knowledge-intensive профессиональных задач — Claude.

Gemini 3 Flash бесплатный?
Частично. Через Google AI Studio есть бесплатный тир без привязки карты. Платный тир — $0.50/$3.00 за 1M токенов. Gemini 3.1 Pro бесплатного тира не имеет.

Как подключить Gemini 3.1 Pro к своему агенту?
Через Gemini API (Google AI Studio), Vertex AI или Gemini CLI. Для agentic workflow — endpoint gemini-3.1-pro-preview-customtools. Для streaming и tool calling — стандартный gemini-3.1-pro-preview.

Snow Bunny, Cappuccino — это реальные кодовые имена?
Не подтверждено официально. В верифицированных Google/Arena документах таких названий нет. Они фигурируют только в community-постах и Medium-статьях с «leaked checkpoint».

Когда Arena публикует официальные имена скрытых моделей?
После официального анонса от компании. До этого — только как anonymous model в результатах голосований.

Как следить за новыми Gemini релизами?
Официальный blog.google, страница deepmind.google/models и Google AI Studio — там появляется раньше всего. Из community-источников — TestingCatalog (X/Telegram) и Arena Leaderboard.

Итог

Слух про «Gemini 3.5 уже на Arena» не подтверждён как публичный факт. Но он возник не из воздуха: Arena действительно тестирует hidden checkpoints, Google реально быстро выкатывает новые модели внутри 3.x-линейки, и несколько независимых сигналов (iOS app, AI Studio metadata, Vertex AI notices, Arena anonymous model) указывают в одном направлении. Конкретная привязка к названию «Gemini 3.5» — пока community attribution, не подтверждённый релиз.

Что точно актуально прямо сейчас: Gemini 3.1 Pro с его 77.1% на ARC-AGI-2 и $2/$12 pricing — реальный вариант для вайбкодерской рабочей нагрузки. Если официальный анонс 3.5/3.2 Flash случится на Google I/O (19-20 мая), мы обновим эту статью сразу.

Посмотреть все актуальные AI-инструменты — каталог AI-инструментов. Обсудить стек под конкретные задачи — запишитесь на консультацию к Максиму.

Обновлено: май 2026. Данные по бенчмаркам и ценам актуальны на дату публикации — проверяйте current values на официальных страницах Google AI и deepmind.google.

All Posts

Автор

Максим Наговицын

Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу

2026/05/18

10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.

Об авторе →

Читать далее

📄 Статья

Google I/O 2026: все анонсы — Gemini Omni, 3.5 Flash, Spark агент, Antigravity 2.0 и ещё 20+ обновлений

Полный разбор Google I/O 2026: Gemini Omni с нативной генерацией видео, Gemini 3.5 Flash быстрее конкурентов в 4 раза, личный агент Spark, Antigravity 2.0, умные очки Samsung, Universal Cart и всё остальное с keynote 19 мая 2026.

2026/05/1914 мин

📄 Статья

Gemini 3.5 - вышла или нет? Разбираемся

Дата исследования: 18 мая 2026 Повод: Инсайдерская информация о выходе Gemini 3.5 на LM Arena Google I/O 2026: 19–20 мая (завтра!) Статус: НЕ анонсирован официально, активно тестируется

2026/05/186 мин

📄 Статья

Gemini 3.5: что это такое и почему об этом говорит весь AI-интернет

Если вы видели в последние дни посты про «Gemini 3.5 уже вышел» — вы не одни. Тема взорвала X, Reddit и русскоязычные AI-каналы. Но правда немного сложнее, чем кажется. Разбираем без технического жаргона: что происходит, что уже можно использовать и…

2026/05/184 мин

📄 Статья

Gemini 3 для кода: что изменилось и стоит ли переходить прямо сейчас

Google выпустил Gemini 3 в ноябре 2025, и это серьезный скачок. По SWE-bench Verified модель набрала 76.2% против 56.6% у Gemini 2.5 Pro. Потом вышел Flash, разогнавший эту цифру до 78%. А в феврале 2026 появился Gemini 3.1 Pro с результатом 80.6% на…

2026/05/136 мин

📄 Статья

DeepSeek Coder API как подключить к своему проекту за 15 минут

DeepSeek API подключается через тот же OpenAI Python SDK — меняете только два параметра: base_url и api_key. Стоит $0.14 за миллион входных токенов для V4 Flash, новые аккаунты получают несколько миллионов бесплатных токенов. Один $2 депозит — это де…

2026/05/078 мин

📄 Статья

DeepSeek R1 Coder чем он отличается от обычного Coder и когда его использовать

DeepSeek R1 — это reasoning-модель: перед тем как ответить, она проходит внутреннюю цепочку рассуждений через <think>...</think> блоки. На сложных алгоритмических задачах R1 пишет более корректный код, чем специализированный Coder. На простых задачах…

2026/05/079 мин