Команда Илона Маска продолжает агрессивно обновлять свою флагманскую модель. 3 марта 2026 года вышла Grok 4.20 Beta 2. Это не революционный скачок, а точечная работа над ошибками, которая делает инструмент гораздо пригоднее для реальной разработки и технических задач.
Главный фокус обновления — надежность. Разработчики из xAI сосредоточились на пяти ключевых зонах, которые больше всего раздражали «пауэр-юзеров» в предыдущих сборках.
Что изменилось в Beta 2
- Следование инструкциям (Instruction Following): Модель стала лучше удерживать контекст в сложных многошаговых промптах. Теперь Grok реже «забывает» про заданный формат вывода или специфические ограничения в середине диалога.
- Борьба с галлюцинациями: Внедрена система внутреннего «рецензирования». Архитектура Grok 4.20 теперь состоит из четырех специализированных агентов, которые проверяют ответы друг друга перед выдачей пользователю. Это должно минимизировать случаи, когда ИИ уверенно врет о своих возможностях.
- Научный текст и LaTeX: Исправлен рендеринг формул и технической документации. Для тех, кто использует Grok для разбора сложных математических алгоритмов или написания документации, это критический апдейт.
- Работа с изображениями: Улучшен поиск по картинкам и корректное отображение нескольких изображений в одном чате.
Технические характеристики
| Метрика | Детали | | :--- | :--- | | Контекстное окно | 2 миллиона токенов (идеально для огромных репозиториев) | | Инфраструктура | Суперкомпьютер Colossus (200,000 GPU) | | Доступность | SuperGrok и X Premium+ (~$30/мес) | | API | В статусе «Coming Soon» |
Контекст для вайбкодеров
Для нас самое важное здесь — контекстное окно в 2 млн токенов и работа над галлюцинациями. Когда вы «скармливаете» ИИ-агенту весь проект целиком, критически важно, чтобы он не выдумывал методы, которых нет в библиотеках, и четко следовал структуре проекта.
Хотя API все еще находится в режиме ожидания, архитектурный подход с мульти-агентным «peer-review» внутри самой модели — это сильный сигнал. Grok метит в нишу надежного инструмента для инженеров, где точность важнее красноречия. Ждем открытия API, чтобы проверить, как Beta 2 справится с кодингом в связке с Cursor или Windsurf.