Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Платформа для слепого тестирования LLM привлекла $150 млн. Рассказываем, почему вайбкодерам важно следить за Chatbot Arena.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →BMAD + Claude Code: Новый фреймворк для системной iOS-разработки
Разбираем связку BMAD и Claude Code для создания iOS-приложений на SwiftUI: от генерации PRD до чистого кода.
Anthropic выпустила Claude Opus 4.8: рекорд в SWE-Bench и контроль усилий
Новая версия Opus 4.8 ставит рекорды в агентном кодинге, вводит ручное управление «усилиями» модели и динамические воркфлоу для Claude Code.
BMAD v6: как превратить Claude Code в полноценную команду разработки
Фреймворк BMAD преодолел отметку в 40 000 звезд на GitHub. Рассказываем, как метод Spec-Driven разработки решает проблему «галлюцинаций» и потери контекста в больших AI-проектах.
Canyon Code привлекла $5 млн на создание ОС для мультиагентных систем
Стартап Canyon Code вышел из стелс-режима с инвестициями в $5 млн. Команда разрабатывает слой «интеллектуального воркфлоу» для управления сложными AI-агентами.
Релиз BMAD-METHOD v6.8.0: новый стандарт планирования для AI-разработки
Крупное обновление методологии BMAD: разделение UX на дизайн и опыт, запуск Web Bundles для ChatGPT и Gemini, а также новый инструмент дистилляции идей bmad-spec.
BMAD: опенсорс-фреймворк для перехода от хаотичного кодинга к ADLC
Вайбкодинг сталкивается с проблемой масштабирования. Новый фреймворк BMAD внедряет агентов в классический цикл SDLC, превращая его в управляемый Agentic Development Life Cycle.
Проект LMArena (известный многим как Chatbot Arena), созданный соседями по комнате из Беркли, официально стал «единорогом». Стартап закрыл раунд серии A на сумму $150 млн при оценке в $1,7 млрд. Это произошло всего через семь месяцев после запуска, что делает компанию одной из самых быстрорастущих в истории AI-инфраструктуры.
Раунд возглавили Felicis и UC Investments при участии a16z, Kleiner Perkins и Lightspeed. Общий объем привлеченного капитала достиг $250 млн.
LMArena решила главную проблему рынка — кризис доверия к бенчмаркам. Пока OpenAI, Google и Anthropic рисуют красивые графики в своих whitepapers, вайбкодеры знают: синтетические тесты часто не отражают реальную работу в кодинге или логике.
Механика LMArena проста и честна:
На основе этих «слепых» тестов формируется рейтинг Эло (Elo rating), который стал де-факто стандартом индустрии. Когда Claude 3.5 Sonnet или GPT-4o выходят в топ Arena, это значит, что они действительно лучше справляются с живыми задачами, а не просто «зазубрили» тестовые датасеты.
Несмотря на академические корни (проект вырос из Sky Computing Lab в Беркли), LMArena — это уже серьезный бизнес:
Для тех, кто строит продукты на базе AI-агентов, успех LMArena — хороший знак. Огромные инвестиции в независимую оценку означают, что у нас будет надежный инструмент для выбора стека.
Когда вы выбираете модель для Cursor или Windsurf, данные Chatbot Arena — это самый объективный способ понять, какая модель сейчас реально «тащит» в кодинге, а какая просто хорошо распиарена. Деньги инвесторов пойдут на масштабирование платформы, а значит, оценка новых моделей (включая специализированные кодинг-модели) будет происходить еще быстрее.