Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Разбор GLM 4.7: тесты кодинга, режим Thinking, создание клона Photoshop и Tool Calling. Узнайте, как использовать новую MIT-модель для ваших AI-проектов.
Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов
Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.
YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026
Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.
Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода
Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.
Vk Fast Cash Strategy
Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех
Visual Prompt Engineering: Как создавать предсказуемый ИИ-дизайн в Nano Banana и Gemini
Методика Visual Prompt Engineering для создания профессионального дизайна: управление оптикой, текстом и материалами в связке Gemini и Nano Banana Pro.
Viral AI Apps Strategy 2026
Анализ более 100 виральных AI-приложений (Lerna, Cali, Reframe) показывает, что сложность продукта не коррелирует с доходом. Большинство лидеров рынка с выручкой от $300k до $2M в месяц — это простые утилиты с ОДНОЙ ключевой функцией. Весь
GLM-5.1 от Z.ai: новый лидер SWE-bench Pro, обученный без NVIDIA
Модель GLM-5.1 заняла первое место в сложнейшем бенчмарке для инженеров, используя железо Huawei вместо привычных H100. Разбираемся, как работает «break-and-repair» и почему это важно для вайбкодинга.
Z.AI представила GLM-5.1: open-weight модель на 754B параметров для AI-агентов
Новая модель GLM-5.1 установила рекорд на SWE-Bench Pro, обойдя GPT-5 и Claude 4.6, и способна на 8-часовую автономную работу.
Z.ai представила GLM-5.1: автономный кодинг до 8 часов подряд
Новая open-source модель GLM-5.1 обходит решения от OpenAI и Anthropic на SWE-Bench Pro и поддерживает непрерывные циклы разработки.
🎯 О чём этот конспект: Подробный разбор и тестирование новой открытой модели GLM 4.7 (300B параметров) от Zhipu AI. В видео сравниваются режимы с включенным и выключенным «мышлением» (Reasoning), тестируются возможности написания сложного кода (клонирование Photoshop), работа с регулярными выражениями и использование внешних инструментов (Tool Calling).
👤 Кому будет полезно: Вайбкодерам, разработчикам на базе AI-агентов и энтузиастам локальных LLM, которые ищут мощную альтернативу Claude 3.5 Sonnet и DeepSeek.
✨ Что получите: Понимание того, когда стоит использовать GLM 4.7, как эффективно настраивать промпты для обхода языковых барьеров и как модель справляется с созданием комплексных веб-приложений «с нуля».
Контекст: GLM 4.7 — китайская модель, которая по умолчанию часто отвечает на китайском языке, даже если запрос на английском. Однако её внутреннее «мышление» (Chain of Thought) происходит на английском. Для комфортной работы вайбкодеру необходимо принудительно задать системные инструкции или использовать специфические настройки токенов, чтобы получать ответы на нужном языке без потери качества рассуждений.
Выгода: Экономия времени на переводе и получение прямого доступа к одной из лучших моделей в мире (топ-1 в тестах «Humanity's Last Exam»).
Как применить:
Prompt: "Explain how to use React Hooks. Respond strictly in English."Результат: Модель переключается на чистый английский (или русский) язык, сохраняя высокую скорость генерации (около 19-20 токенов/сек на мощном железе).
Контекст: GLM 4.7 поддерживает глубокое рассуждение (по аналогии с OpenAI o1 или DeepSeek-R1). В тестах на сложные регулярные выражения (RegEx для парсинга имен файлов квантования GGUF) модель в режиме мышления тратит до 6000 токенов на обдумывание, но находит верное решение там, где обычные модели ошибаются. Однако режим мышления может быть избыточным для простых задач.
Выгода: Точное решение сложнейших логических и архитектурных задач, которые «не по зубам» стандартным LLM.
Как применить:
Thinking Mode для задач, связанных с архитектурой, сложной математикой или отладкой запутанного кода. Будьте готовы к долгому ожиданию (до 480 секунд на генерацию).Результат: Правильно составленный RegEx, учитывающий регистр и специфические символы (например, замена [KM0] на \w для поддержки всех типов квантования).
Контекст: Модель тестировалась на создание полноценного веб-приложения — клона Photoshop с поддержкой слоев, инструментов рисования и фильтров. GLM 4.7 способна генерировать более 10 000 токенов кода за один проход, создавая рабочую структуру с меню, холстом и функционалом манипуляции слоями.
Выгода: Возможность быстрого прототипирования сложных инструментов без ручного написания бойлерплейта.
Как применить:
Create a full-featured Photoshop clone using HTML, CSS, and vanilla JavaScript.
Include:
1. Layer management (add, delete, hide layers).
2. Drawing tools (brush, shapes, text).
3. Image filters (Sepia, Invert, Blur).
4. A professional UI with toolbars and menus.Результат: Готовый HTML-файл с работающим функционалом: переключение слоев, выбор цветов, применение фильтров и инструменты рисования. Версия с «Thinking» обычно добавляет более продуманные меню и дополнительные фильтры.
Контекст: GLM 4.7 показывает выдающиеся результаты в работе с внешними инструментами. В тестах она обходит GPT-4o и Claude в сценариях, где нужно не просто вызвать функцию, а проанализировать результат и сделать повторный вызов с уточненными параметрами (например, пагинация при чтении Wikipedia).
Выгода: Создание автономных агентов, которые могут эффективно искать информацию в сети и работать с API.
Как применить:
fetch или специализированный API).Пример логики модели:
get_web_page(url, start=0, length=8000).get_web_page(url, start=8000, length=8000).Результат: Модель успешно находит данные (например, продолжительность жизни рабочих муравьев), даже если они находятся глубоко в тексте статьи.
В: Насколько GLM 4.7 требовательна к ресурсам? О: Это модель на 300 миллиардов параметров. Для локального запуска в полном объеме требуются значительные мощности (видеопамять уровня H100/A100 или мощные Mac с объединенной памятью), однако квантованные версии могут работать на более доступном железе. В тестах использовалось около 270 ГБ памяти.
В: Можно ли использовать GLM 4.7 коммерчески? О: Да, модель распространяется под лицензией MIT, что является большой редкостью для моделей такого уровня и позволяет свободное коммерческое использование.
В: Стоит ли всегда держать режим Thinking включенным? О: Нет. Для простых задач (написать простой скрипт, ответить на вопрос) лучше его выключать — это сэкономит токены и время. Включайте его только для «неразрешимых» логических задач.
В: Как модель справляется с русским языком? О: Как и большинство SOTA-моделей, она хорошо понимает русский язык, но для гарантии ответа на русском стоит добавлять четкую инструкцию в системный промпт.
В: Чем GLM 4.7 лучше DeepSeek? О: Согласно бенчмаркам (Software Engineering, Tool Calling), GLM 4.7 превосходит DeepSeek в задачах программирования и использования инструментов, хотя DeepSeek может быть быстрее в некоторых узких сценариях.
Конспект создан на основе видео «GLM 4.7 - The New King of Coding?» канала Inference. Все права на оригинальный материал принадлежат авторам. Источник: https://www.youtube.com/watch?v=E-8KJpUFalM