Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Пошаговый гайд по редактированию AI-изображений через JSON в Gemini. Смена цветов, материалов и объектов без галлюцинаций нейросети.
Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Graphify: Как создать карту знаний для AI-агентов и экономить до 70% токенов
Пошаговый гайд по Graphify: установка, настройка графа знаний для Claude Code и Cursor, оптимизация контекста и экономия токенов в больших проектах.
Unreal Engine 5 + Claude Code: Создание игры с нуля через AI-агентов
Пошаговый гид по настройке Claude Code в UE5 с использованием MCP, Vibe UE и Unreal Claude для автоматизации разработки игр и блюпринтов.
Нейромаркетинг и ИИ: Как внедрить психологические триггеры Apple и Coca-Cola в свой бизнес
Практическое руководство по использованию нейромаркетинга и ИИ для роста чека и конверсии. Разбор 13 триггеров и 5 бизнес-кейсов.
Экономика Агентов: Как строить стартапы для ИИ-пользователей
Разбор перехода к Agent-Web: как адаптировать бизнес под ИИ-агентов, внедрить AEO и занять ниши в инфраструктуре для машин.
ИИ-новости: Diffusion Gemma, Gemini 3.5 Live и революция в образовании
Разбор Diffusion Gemma, Gemini 3.5 Live Translate и режима Fusion в OpenRouter. Как ИИ меняет образование в Китае и аудит безопасности кода.
AI Delivery Business: Как заменить классические AI-агентства и зарабатывать на услугах
Узнайте, почему AI-агентства умирают и как перейти к модели AI Delivery Business с чеками от $2000. Пошаговый план автоматизации услуг через Claude и n8n.
Google AI Studio 2026: нативная разработка Android-приложений и интеграция с Workspace
Google превращает AI Studio в полноценную среду разработки: экспорт в Kotlin/Jetpack Compose, доступ к данным Drive/Sheets и мобильное приложение для кодинга на ходу.
Google AI Studio теперь умеет в вайб-кодинг нативных Android-приложений
Google представила обновление AI Studio на I/O 2026: теперь создавать нативные приложения на Kotlin и Jetpack Compose можно прямо в браузере без установки Android Studio.
Google AI Studio теперь собирает Android-приложения и запускает агентов
На Google I/O 2026 представили нативную генерацию Android-приложений прямо в браузере и управляемых агентов в изолированных Linux-средах.
Нейросети для вайбкодинга 2026: сравнение по задачам
Нейросеть под капотом вашей IDE — это не просто «настройка». Это примерно 80% того, насколько быстро вы дойдете от идеи до работающего продукта. В 2026 году разрыв между моделями сократился, но выбор по-прежнему важен: одна нейросеть сэкономит вам 40…
Все AI IDE для вайбкодинга 2026: каталог и сравнение в таблице
Вайбкодинг в 2026 году — это уже не эксперимент, это рабочий способ создавать продукты. На рынке больше 130 AI-инструментов для разработки, и разобраться в этом хаосе с нуля тяжело. Здесь — полный каталог всех актуальных AI IDE для вайбкодинга: от из…
Как создать SaaS за неделю через вайбкодинг: реальный кейс
SaaS за неделю через вайбкодинг 2026 — это уже не эксперимент, а рабочая стратегия. Разберём пошагово, как построить работающий продукт с платежами, авторизацией и деплоем за 7 дней через Claude Code, Cursor и Lovable — без нанима разработчиков и без…
🎯 О чём этот конспект: Разбор революционного метода управления генерацией изображений в Google Gemini с использованием JSON-структур. Этот подход позволяет изменять отдельные детали (цвет, материал, объекты, освещение), не нарушая общую композицию и перспективу исходного изображения.
👤 Кому будет полезно: Вайбкодерам, AI-художникам и разработчикам, которые столкнулись с проблемой «галлюцинаций» нейросетей при попытке внести точечные правки в готовые генерации.
✨ Что получите: Пошаговую методику превращения визуального контента в структурированный код, который можно редактировать как текстовый конфиг, получая предсказуемый и стабильный результат в модели Imagen 3 (упоминаемой в видео как Nano Banana 2).
Контекст: Главная проблема AI-редактирования — изменение промпта часто ведет к полной перерисовке сцены. Автор предлагает использовать Gemini 1.5 Pro для деконструкции изображения в JSON-код. Это превращает картинку в список объектов с параметрами: название, цвет, материал и координаты. Когда мы подаем этот код обратно вместе с оригиналом, AI четко понимает, что именно нужно изменить, а что оставить нетронутым.
Выгода: Полный контроль над композицией и исключение случайных изменений мебели, освещения или перспективы при редактировании мелких деталей.
Как применить:
color: "cream" на color: "light blue") и отправьте обратно с командой:Modify this image based on the following JSON prompt:
[ВСТАВИТЬ ВАШ JSON КОД]Результат: Изображение, где изменен только целевой параметр, а всё остальное совпадает с оригиналом пиксель в пиксель.
Контекст: Обычные промпты часто путают текстуры объектов, находящихся рядом. Через JSON можно изолировать конкретный предмет (например, комод или чашку) и задать ему уникальные свойства поверхности (глянец, матовое дерево, керамика), не затрагивая окружение.
Выгода: Возможность быстрого прототипирования дизайна интерьеров или предметной съемки без перегенерации всей сцены.
Как применить:
name или object_type.material и finish. Например, для комода:Результат: Реалистичная замена материалов с сохранением теней и отражений.
Контекст: Замена одного кресла на другое — сложная задача из-за наслоения объектов и теней. Автор предлагает использовать "слияние" двух JSON-структур: одну от исходной комнаты, вторую от нового объекта (даже если он снят под другим углом).
Выгода: Возможность вставлять конкретные модели мебели или предметов в готовые интерьеры с автоматической подстройкой перспективы и освещения.
Как применить:
Результат: Новый объект идеально вписывается в сцену, учитывая освещение и тени комнаты, даже если исходное фото объекта было в другом ракурсе.
Контекст: При попытке сделать "дождливый день" AI часто убирает шторы, чтобы показать дождь в окне. Чтобы этого избежать, нужно использовать специфический JSON, который разделяет внутреннее освещение и внешние погодные эффекты.
Выгода: Создание вариаций одного и того же интерьера в разное время суток (Golden Hour, ночь, пасмурно) при сохранении всех предметов на своих местах.
Как применить:
lighting_setup, color_temperature и atmospheric_effects.exterior_weather_visible: true. Это заставит модель изменить только свет внутри, не пытаясь "показать" улицу.Результат: Масштабное изменение настроения снимка без потери мелких деталей интерьера.
Контекст: Самая сложная задача — применить перспективу одного фото (например, Fisheye) к другому. JSON позволяет извлечь параметры камеры: фокусное расстояние (focal_length), глубину резкости (depth_of_field) и точку фокусировки.
Выгода: Создание серии изображений в едином кинематографическом стиле или с экстремальными углами обзора.
Как применить:
Результат: Исходная сцена перестраивается под новую перспективу (например, вид из угла комнаты под широким углом).
В: Почему нужно использовать именно Gemini 1.5 Pro, а не Flash? О: Модель Pro обладает гораздо более глубокими способностями к рассуждению (reasoning) и анализу кода. Она точнее сопоставляет визуальные объекты с их текстовым описанием в JSON, что критично для избежания галлюцинаций.
В: Что делать, если Gemini пишет, что не может отредактировать изображение? О: Убедитесь, что вы загрузили оригинальное изображение в тот же чат, где вставляете JSON. Иногда помогает фраза "Using the uploaded image as a base, apply these changes...". Также проверьте, не нарушает ли изображение политики безопасности Google.
В: Можно ли таким образом менять текст на изображениях? О: Да, это один из лучших способов. В JSON нужно найти блок, отвечающий за текст или логотип, и изменить значение строки. Модель Imagen 3 (Nano Banana 2) отлично справляется с сохранением текстуры (например, текст из хлеба), меняя только сами буквы.
В: Где взять базовые промпты для генерации этих JSON? О: Автор видео предоставляет их в своем Discord-сообществе. В общем виде промпт звучит так: "Analyze this image and provide a detailed JSON representation of its objects, materials, colors, and spatial coordinates".
В: Работает ли это в Google AI Studio? О: Да, если у вас закончились лимиты в обычном интерфейсе Gemini, вы можете использовать те же промпты в AI Studio, выбрав модель Gemini 1.5 Pro. Результат будет идентичным.
Конспект создан на основе видео «How to use JSON to control AI Image Editing» канала RenderDrop. Все права на оригинальный материал принадлежат авторам. Источник: https://youtu.be/uQc4TGhvDHc