Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Разбор GLM 4.7: тесты кодинга, режим Thinking, создание клона Photoshop и Tool Calling. Узнайте, как использовать новую MIT-модель для ваших AI-проектов.
Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Graphify: Как создать карту знаний для AI-агентов и экономить до 70% токенов
Пошаговый гайд по Graphify: установка, настройка графа знаний для Claude Code и Cursor, оптимизация контекста и экономия токенов в больших проектах.
Автоматизация Etsy + Print-on-Demand: Полный цикл от поиска трендов до публикации через AI
Пошаговое руководство по автоматизации магазина Etsy с помощью Codex и Gelato: поиск трендов, генерация дизайнов и SEO-описаний, автопубликация.
Claude 3.5 Sonnet (V2): Создание прибыльных торговых стратегий и AI-трейдинг
Пошаговое руководство по созданию торговых стратегий с Claude 3.5 Sonnet: от Pine Script до автономных AI-агентов на Bybit через MCP.
Unreal Engine 5 + Claude Code: Создание игры с нуля через AI-агентов
Пошаговый гид по настройке Claude Code в UE5 с использованием MCP, Vibe UE и Unreal Claude для автоматизации разработки игр и блюпринтов.
Нейромаркетинг и ИИ: Как внедрить психологические триггеры Apple и Coca-Cola в свой бизнес
Практическое руководство по использованию нейромаркетинга и ИИ для роста чека и конверсии. Разбор 13 триггеров и 5 бизнес-кейсов.
Google Ads + Claude Code: Полная автоматизация аккаунта и стратегия на $730,000
Пошаговый гид по автоматизации Google Ads с помощью Claude Code: создание кампаний, объявлений, лендингов и аудит аккаунта через ИИ-агентов.
Zhipu AI выпустила GLM-5-Turbo: модель, заточенную под AI-агентов
Китайский гигант Zhipu AI представил GLM-5-Turbo. Модель обучена на реальных воркфлоу агентов и показывает выдающиеся результаты в вызове инструментов и планировании задач.
Феномен Z.ai: акции выросли в 10 раз после релиза GLM-5.1
Китайская лаборатория Z.ai (бывшая Knowledge Atlas) показала невероятный рост на бирже. Секрет успеха — открытые модели, обходящие GPT-5 в кодинге.
Zhipu запустила GLM-5.1-highspeed: 400 токенов в секунду для флагманской модели
Китайский стартап Zhipu представил сверхбыструю версию своего флагмана GLM-5.1. Скорость генерации достигла 400 токенов в секунду без потери качества ответов.
🎯 О чём этот конспект: Подробный разбор и тестирование новой открытой модели GLM 4.7 (300B параметров) от Zhipu AI. В видео сравниваются режимы с включенным и выключенным «мышлением» (Reasoning), тестируются возможности написания сложного кода (клонирование Photoshop), работа с регулярными выражениями и использование внешних инструментов (Tool Calling).
👤 Кому будет полезно: Вайбкодерам, разработчикам на базе AI-агентов и энтузиастам локальных LLM, которые ищут мощную альтернативу Claude 3.5 Sonnet и DeepSeek.
✨ Что получите: Понимание того, когда стоит использовать GLM 4.7, как эффективно настраивать промпты для обхода языковых барьеров и как модель справляется с созданием комплексных веб-приложений «с нуля».
Контекст: GLM 4.7 — китайская модель, которая по умолчанию часто отвечает на китайском языке, даже если запрос на английском. Однако её внутреннее «мышление» (Chain of Thought) происходит на английском. Для комфортной работы вайбкодеру необходимо принудительно задать системные инструкции или использовать специфические настройки токенов, чтобы получать ответы на нужном языке без потери качества рассуждений.
Выгода: Экономия времени на переводе и получение прямого доступа к одной из лучших моделей в мире (топ-1 в тестах «Humanity's Last Exam»).
Как применить:
Prompt: "Explain how to use React Hooks. Respond strictly in English."Результат: Модель переключается на чистый английский (или русский) язык, сохраняя высокую скорость генерации (около 19-20 токенов/сек на мощном железе).
Контекст: GLM 4.7 поддерживает глубокое рассуждение (по аналогии с OpenAI o1 или DeepSeek-R1). В тестах на сложные регулярные выражения (RegEx для парсинга имен файлов квантования GGUF) модель в режиме мышления тратит до 6000 токенов на обдумывание, но находит верное решение там, где обычные модели ошибаются. Однако режим мышления может быть избыточным для простых задач.
Выгода: Точное решение сложнейших логических и архитектурных задач, которые «не по зубам» стандартным LLM.
Как применить:
Thinking Mode для задач, связанных с архитектурой, сложной математикой или отладкой запутанного кода. Будьте готовы к долгому ожиданию (до 480 секунд на генерацию).Результат: Правильно составленный RegEx, учитывающий регистр и специфические символы (например, замена [KM0] на \w для поддержки всех типов квантования).
Контекст: Модель тестировалась на создание полноценного веб-приложения — клона Photoshop с поддержкой слоев, инструментов рисования и фильтров. GLM 4.7 способна генерировать более 10 000 токенов кода за один проход, создавая рабочую структуру с меню, холстом и функционалом манипуляции слоями.
Выгода: Возможность быстрого прототипирования сложных инструментов без ручного написания бойлерплейта.
Как применить:
Create a full-featured Photoshop clone using HTML, CSS, and vanilla JavaScript.
Include:
1. Layer management (add, delete, hide layers).
2. Drawing tools (brush, shapes, text).
3. Image filters (Sepia, Invert, Blur).
4. A professional UI with toolbars and menus.Результат: Готовый HTML-файл с работающим функционалом: переключение слоев, выбор цветов, применение фильтров и инструменты рисования. Версия с «Thinking» обычно добавляет более продуманные меню и дополнительные фильтры.
Контекст: GLM 4.7 показывает выдающиеся результаты в работе с внешними инструментами. В тестах она обходит GPT-4o и Claude в сценариях, где нужно не просто вызвать функцию, а проанализировать результат и сделать повторный вызов с уточненными параметрами (например, пагинация при чтении Wikipedia).
Выгода: Создание автономных агентов, которые могут эффективно искать информацию в сети и работать с API.
Как применить:
fetch или специализированный API).Пример логики модели:
get_web_page(url, start=0, length=8000).get_web_page(url, start=8000, length=8000).Результат: Модель успешно находит данные (например, продолжительность жизни рабочих муравьев), даже если они находятся глубоко в тексте статьи.
В: Насколько GLM 4.7 требовательна к ресурсам? О: Это модель на 300 миллиардов параметров. Для локального запуска в полном объеме требуются значительные мощности (видеопамять уровня H100/A100 или мощные Mac с объединенной памятью), однако квантованные версии могут работать на более доступном железе. В тестах использовалось около 270 ГБ памяти.
В: Можно ли использовать GLM 4.7 коммерчески? О: Да, модель распространяется под лицензией MIT, что является большой редкостью для моделей такого уровня и позволяет свободное коммерческое использование.
В: Стоит ли всегда держать режим Thinking включенным? О: Нет. Для простых задач (написать простой скрипт, ответить на вопрос) лучше его выключать — это сэкономит токены и время. Включайте его только для «неразрешимых» логических задач.
В: Как модель справляется с русским языком? О: Как и большинство SOTA-моделей, она хорошо понимает русский язык, но для гарантии ответа на русском стоит добавлять четкую инструкцию в системный промпт.
В: Чем GLM 4.7 лучше DeepSeek? О: Согласно бенчмаркам (Software Engineering, Tool Calling), GLM 4.7 превосходит DeepSeek в задачах программирования и использования инструментов, хотя DeepSeek может быть быстрее в некоторых узких сценариях.
Конспект создан на основе видео «GLM 4.7 - The New King of Coding?» канала Inference. Все права на оригинальный материал принадлежат авторам. Источник: https://www.youtube.com/watch?v=E-8KJpUFalM