Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
DeepSeek выпустила V4 Pro, которая обошла Claude 4 и GPT-5 в кодинге. Теперь лучшую модель для разработки можно захостить на своем железе.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Бенчмарк AI-агентов: Qwen3 и DeepSeek Chat взяли планку 90% почти бесплатно
Свежий тест 10 моделей на агентских задачах выявил новых лидеров по соотношению цены и качества. Qwen3 Coder и оригинальный DeepSeek Chat доминируют, а LFM 2 ставит рекорды дешевизны.
Обзор Qwen 3.6: опенсорсная модель, которая догнала Claude 4.6 и GPT-5.4
Alibaba выпустила Qwen 3.6. В свежих бенчмарках версия 27B на старой видеокарте за $200 выдает код уровня платных подписок за $20/мес.
Qwen3.6-27B: Компактная модель, которая обходит гигантов в кодинге
Alibaba выпустила Qwen3.6-27B — плотную модель, которая на задачах кодинга побеждает MoE-монстров весом в 400 миллиардов параметров.
Alibaba представила Qoder 1.0: полноценный «автопилот» для разработки на базе агентов
Alibaba Cloud выпустила мажорное обновление Qoder 1.0. Это больше не просто IDE, а полноценная среда для управления командами автономных AI-агентов с поддержкой мультизадачности.
Quest Software представила облачный дата-моделер и расширенный пакет QuestAI
Quest Software объединила проектирование данных и AI-ассистентов в единую SaaS-платформу, решая проблему фрагментированных метаданных.
Coder представил self-hosted агентов: полный контроль над кодом и моделями
Компания Coder выпустила бету Coder Agents — нативную архитектуру для запуска ИИ-агентов на собственной инфраструктуре без передачи данных вовне.
DeepSeek официально представила V4 Pro — топовую версию своей новой линейки моделей. Главная сенсация: модель набрала 80.6% на бенчмарке SWE-Bench Verified, что делает её не просто лучшей среди open-weight решений, но и лидером общего зачета, включая закрытые проприетарные модели.
Для контекста: на май 2026 года Claude Sonnet 4 показывает 77.2%, а GPT-5 — около 74.9%. DeepSeek V4 Pro стала первой открытой моделью, которая системно доминирует в решении реальных GitHub-тикетов.
Главное изменение — теперь «мозги» топового уровня можно запустить локально или в своем облаке. Это закрывает вопрос безопасности данных для тех, кто не хочет скармливать свой проприетарный код API-провайдерам.
Ключевые характеристики:
Эпоха HumanEval закончилась — топовые модели давно пробили там потолок в 97%. SWE-Bench Verified сегодня является единственным адекватным мерилом, так как проверяет способность модели писать работающие патчи к реальным багам. Тот факт, что open-weight модель лидирует здесь, меняет экономику разработки: вместо оплаты токенов по прайсу Anthropic или OpenAI, команды могут инвестировать в собственные GPU-кластеры.
Однако стоит помнить: отрыв в 3% на публичном бенчмарке может нивелироваться на специфическом стеке или внутреннем DSL компании. Перед тем как закупать H100, стоит прогнать V4 Pro на собственном бэклоге багов.
В линейку V4 также вошла облегченная версия V4 Flash, но именно Pro-версия меняет правила игры для профессионального использования в агентских пайплайнах.