Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Фреймворк SGLang показывает невероятные результаты производительности, обеспечивая 25-кратный прирост на новом железе NVIDIA и Day-0 поддержку топовых моделей.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →GigaCode в GitVerse: Сбер запустил ИИ-агентов для управления репозиториями
Сбер интегрировал ИИ-помощника GigaCode в платформу GitVerse. Теперь нейросеть умеет настраивать пайплайны, писать коммиты и разворачивать статические сайты через GitVerse Pages.
GigaCode в GitVerse: Сбер превращает платформу в полноценный AI-хаб
Сбер обновил GitVerse, внедрив чат GigaCode для автоматизации CI/CD и генерации коммитов, а также запустил бесплатный хостинг GitVerse Pages.
GigaCode стал полноценным AI-агентом внутри платформы GitVerse
Сбер интегрировал AI-ассистента GigaCode в GitVerse. Теперь нейросеть умеет автономно создавать репозитории, писать коммиты и проверять код на уязвимости.
Сбер представил GigaStudio: AI-агенты для генерации приложений на GitVerse
Сбер запустил GigaStudio — инструмент для создания веб и мобильных приложений по текстовому запросу, а также обновил GitVerse и нейросеть Kandinsky Video.
Gigasoft победила галлюцинации AI в коде графиков с помощью pe_query.py
Компания Gigasoft представила инструмент pe_query.py для ProEssentials v10, который валидирует AI-код напрямую через бинарные файлы DLL, исключая ошибки в именах свойств.
Сбер представил GigaChat Max: 512k контекста и прорыв в кодинге
Обновление GigaChat Max принесло четырехкратный рост контекстного окна, поддержку CAD-файлов и точность в Python на уровне 86.8%. Разбираемся, что это значит для вайбкодеров.
Если вы строите сложные AI-агенты и упираетесь в задержки инференса, присмотритесь к SGLang. Этот высокопроизводительный фреймворк для обслуживания LLM и мультимодальных моделей сейчас находится на пике формы, привлекая внимание как независимых вайбкодеров, так и гигантов индустрии.
Последние обновления SGLang впечатляют масштабами оптимизации. В феврале команда объявила о достижении 25-кратного прироста производительности инференса на архитектуре NVIDIA GB300 NVL72. Для тех, кто работает с видео и изображениями, в январе была запущена поддержка SGLang Diffusion, которая значительно ускоряет генеративный пайплайн.
Проект активно поддерживается сообществом (более 24 000 звезд на GitHub) и получил грант от фонда a16z. Сейчас SGLang де-факто становится стандартом для деплоя тяжелых моделей, обрабатывая триллионы токенов ежедневно.
Для тех, кто использует Cursor или Windsurf для создания AI-сервисов, SGLang решает главную проблему — скорость отклика и стоимость ресурсов:
Проект написан преимущественно на Python (81%), но критически важные для производительности части реализованы на Rust (8.7%) и CUDA (4.7%). Версия v0.4 принесла zero-overhead планировщик батчей и кэш-ориентированный балансировщик нагрузки, что критично при масштабировании ваших приложений.
Если вы планируете переходить с OpenAI API на собственные инстансы или использовать open-source модели в своих продуктах, SGLang — это, пожалуй, самый быстрый способ заставить ваши промпты «летать».