Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Пошаговый гайд по редактированию AI-изображений через JSON в Gemini. Смена цветов, материалов и объектов без галлюцинаций нейросети.
Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Gemini 3.1 Flash Real-Time: Создание голосового AI-агента с низкой задержкой
Пошаговое руководство по созданию быстрого голосового ассистента на Gemini 1.5 Flash и LiveKit без использования STT/TTS цепочек.
Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов
Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.
YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026
Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.
Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода
Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.
Vk Fast Cash Strategy
Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех
Visual Prompt Engineering: Как создавать предсказуемый ИИ-дизайн в Nano Banana и Gemini
Методика Visual Prompt Engineering для создания профессионального дизайна: управление оптикой, текстом и материалами в связке Gemini и Nano Banana Pro.
75% нового кода в Google пишет нейросеть: Сундар Пичаи раскрыл детали
Глава Google Сундар Пичаи сообщил, что три четверти нового кода компании теперь генерирует AI. Узнайте, как переход на агентные ворклоу ускорил разработку в 6 раз.
Google увеличила лимиты в AI Studio для подписчиков Pro и Ultra
Подписчики Google AI Pro и Ultra получили расширенные лимиты в AI Studio. Это отличная новость для вайбкодеров, использующих Gemini для прототипирования.
Google AI Studio расширяет лимиты для подписчиков AI Pro и Ultra
Google открывает премиальные возможности AI Studio для владельцев подписок AI Pro и Ultra: повышенные лимиты и доступ к новым моделям для быстрого прототипирования.
Нейросети для вайбкодинга 2026: сравнение по задачам
Нейросеть под капотом вашей IDE — это не просто «настройка». Это примерно 80% того, насколько быстро вы дойдете от идеи до работающего продукта. В 2026 году разрыв между моделями сократился, но выбор по-прежнему важен: одна нейросеть сэкономит вам 40…
Все AI IDE для вайбкодинга 2026: каталог и сравнение в таблице
Вайбкодинг в 2026 году — это уже не эксперимент, это рабочий способ создавать продукты. На рынке больше 130 AI-инструментов для разработки, и разобраться в этом хаосе с нуля тяжело. Здесь — полный каталог всех актуальных AI IDE для вайбкодинга: от из…
Как создать SaaS за неделю через вайбкодинг: реальный кейс
SaaS за неделю через вайбкодинг 2026 — это уже не эксперимент, а рабочая стратегия. Разберём пошагово, как построить работающий продукт с платежами, авторизацией и деплоем за 7 дней через Claude Code, Cursor и Lovable — без нанима разработчиков и без…
🎯 О чём этот конспект: Разбор революционного метода управления генерацией изображений в Google Gemini с использованием JSON-структур. Этот подход позволяет изменять отдельные детали (цвет, материал, объекты, освещение), не нарушая общую композицию и перспективу исходного изображения.
👤 Кому будет полезно: Вайбкодерам, AI-художникам и разработчикам, которые столкнулись с проблемой «галлюцинаций» нейросетей при попытке внести точечные правки в готовые генерации.
✨ Что получите: Пошаговую методику превращения визуального контента в структурированный код, который можно редактировать как текстовый конфиг, получая предсказуемый и стабильный результат в модели Imagen 3 (упоминаемой в видео как Nano Banana 2).
Контекст: Главная проблема AI-редактирования — изменение промпта часто ведет к полной перерисовке сцены. Автор предлагает использовать Gemini 1.5 Pro для деконструкции изображения в JSON-код. Это превращает картинку в список объектов с параметрами: название, цвет, материал и координаты. Когда мы подаем этот код обратно вместе с оригиналом, AI четко понимает, что именно нужно изменить, а что оставить нетронутым.
Выгода: Полный контроль над композицией и исключение случайных изменений мебели, освещения или перспективы при редактировании мелких деталей.
Как применить:
color: "cream" на color: "light blue") и отправьте обратно с командой:Modify this image based on the following JSON prompt:
[ВСТАВИТЬ ВАШ JSON КОД]Результат: Изображение, где изменен только целевой параметр, а всё остальное совпадает с оригиналом пиксель в пиксель.
Контекст: Обычные промпты часто путают текстуры объектов, находящихся рядом. Через JSON можно изолировать конкретный предмет (например, комод или чашку) и задать ему уникальные свойства поверхности (глянец, матовое дерево, керамика), не затрагивая окружение.
Выгода: Возможность быстрого прототипирования дизайна интерьеров или предметной съемки без перегенерации всей сцены.
Как применить:
name или object_type.material и finish. Например, для комода:Результат: Реалистичная замена материалов с сохранением теней и отражений.
Контекст: Замена одного кресла на другое — сложная задача из-за наслоения объектов и теней. Автор предлагает использовать "слияние" двух JSON-структур: одну от исходной комнаты, вторую от нового объекта (даже если он снят под другим углом).
Выгода: Возможность вставлять конкретные модели мебели или предметов в готовые интерьеры с автоматической подстройкой перспективы и освещения.
Как применить:
Результат: Новый объект идеально вписывается в сцену, учитывая освещение и тени комнаты, даже если исходное фото объекта было в другом ракурсе.
Контекст: При попытке сделать "дождливый день" AI часто убирает шторы, чтобы показать дождь в окне. Чтобы этого избежать, нужно использовать специфический JSON, который разделяет внутреннее освещение и внешние погодные эффекты.
Выгода: Создание вариаций одного и того же интерьера в разное время суток (Golden Hour, ночь, пасмурно) при сохранении всех предметов на своих местах.
Как применить:
lighting_setup, color_temperature и atmospheric_effects.exterior_weather_visible: true. Это заставит модель изменить только свет внутри, не пытаясь "показать" улицу.Результат: Масштабное изменение настроения снимка без потери мелких деталей интерьера.
Контекст: Самая сложная задача — применить перспективу одного фото (например, Fisheye) к другому. JSON позволяет извлечь параметры камеры: фокусное расстояние (focal_length), глубину резкости (depth_of_field) и точку фокусировки.
Выгода: Создание серии изображений в едином кинематографическом стиле или с экстремальными углами обзора.
Как применить:
Результат: Исходная сцена перестраивается под новую перспективу (например, вид из угла комнаты под широким углом).
В: Почему нужно использовать именно Gemini 1.5 Pro, а не Flash? О: Модель Pro обладает гораздо более глубокими способностями к рассуждению (reasoning) и анализу кода. Она точнее сопоставляет визуальные объекты с их текстовым описанием в JSON, что критично для избежания галлюцинаций.
В: Что делать, если Gemini пишет, что не может отредактировать изображение? О: Убедитесь, что вы загрузили оригинальное изображение в тот же чат, где вставляете JSON. Иногда помогает фраза "Using the uploaded image as a base, apply these changes...". Также проверьте, не нарушает ли изображение политики безопасности Google.
В: Можно ли таким образом менять текст на изображениях? О: Да, это один из лучших способов. В JSON нужно найти блок, отвечающий за текст или логотип, и изменить значение строки. Модель Imagen 3 (Nano Banana 2) отлично справляется с сохранением текстуры (например, текст из хлеба), меняя только сами буквы.
В: Где взять базовые промпты для генерации этих JSON? О: Автор видео предоставляет их в своем Discord-сообществе. В общем виде промпт звучит так: "Analyze this image and provide a detailed JSON representation of its objects, materials, colors, and spatial coordinates".
В: Работает ли это в Google AI Studio? О: Да, если у вас закончились лимиты в обычном интерфейсе Gemini, вы можете использовать те же промпты в AI Studio, выбрав модель Gemini 1.5 Pro. Результат будет идентичным.
Конспект создан на основе видео «How to use JSON to control AI Image Editing» канала RenderDrop. Все права на оригинальный материал принадлежат авторам. Источник: https://youtu.be/uQc4TGhvDHc