Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Платформа Chatbot Arena привлекла $150 млн инвестиций. Рассказываем, почему «народный» рейтинг моделей стал главным инструментом для выбора стека.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Project Headroom: как инженер Netflix экономит 90% затрат на токены LLM
Инженер Netflix Теджас Чопра представил open-source инструмент Headroom, который вырезает лишние данные из промптов и экономит тысячи долларов на API.
Как экономить 80% на токенах в Aider: кэширование и умный роутинг через Lynkr
Разбираем, как сократить расходы на AI-разработку с помощью промпт-кэширования, локальных моделей и шлюза Lynkr.
Gate AI: новый шлюз безопасности для защиты от промпт-инъекций
Компания Constellation Network представила Gate AI — защитный слой для AI-приложений с рекордными показателями точности и задержкой всего 53 мс.
Flexprice привлекла $1,5 млн на развитие биллинга для AI-сервисов
Open-source платформа Flexprice получила инвестиции на масштабирование инфраструктуры для тарификации токенов, API-вызовов и GPU-часов.
Релиз Qoder 1.0: от AI IDE к автономному десктопу для разработки
Qoder официально вышел из беты. Версия 1.0 превращает IDE в автономную среду, где агенты сами пишут, тестируют и деплоят код.
Революция цен: стоимость AI-токенов упала на 67% благодаря Open Source
Отчет AI.cc за 2026 год подтверждает: эра доминирования дорогих проприетарных моделей закончилась. Open Source захватил 38% рынка.
Проект LMArena (известный многим как Chatbot Arena), созданный исследователями из Беркли, официально перешел в лигу тяжеловесов. Стартап закрыл раунд серии A на сумму $150 млн при оценке в $1,7 млрд. И все это спустя всего семь месяцев после запуска.
В раунде участвовали топовые фонды: Andreessen Horowitz, Kleiner Perkins и Lightspeed. Но важнее цифр капитализации — операционные показатели: платформа обрабатывает 60 миллионов диалогов в месяц, а годовая выручка (ARR) уже достигла $30 млн.
Для тех, кто собирает продукты на базе Cursor, Claude Code или Windsurf, выбор модели — это не вопрос симпатии к бренду, а вопрос качества генерации кода и следования инструкциям. Традиционные бенчмарки (вроде MMLU) давно дискредитированы: разработчики моделей подгоняют веса под тесты, из-за чего цифры в пресс-релизах не бьются с реальностью.
LMArena предложила «слепое» тестирование: пользователь вводит промпт, получает два анонимных ответа и выбирает лучший. Это единственный масштабный источник данных о том, как модели ведут себя в реальных задачах, включая кодинг и сложные рассуждения.
Деньги пойдут на развитие коммерческих продуктов для энтерпрайза. Сейчас CTO крупных компаний не знают, на что пересаживать команды — на Claude 3.5 Sonnet, GPT-4o или локальные Llama 3. LMArena становится тем самым независимым арбитром, который помогает выбрать модель на основе живого фидбека, а не маркетинговых графиков.
Для нас это означает, что лидерборд Chatbot Arena останется главным ориентиром при обновлении конфигов в наших IDE. Если новая модель «выстреливает» в Arena, значит, пора менять API-ключ.