Vision model
Также: Зрительная модель
Vision model — это тип ИИ, который умеет «видеть» и анализировать изображения, понимая, что на них нарисовано или написано.
Vision model — это нейросеть, обученная распознавать визуальные образы. Если обычная текстовая модель (LLM) читает только буквы, то Vision model способна «смотреть» на картинки, скриншоты интерфейсов или даже рукописные схемы.
Представьте, что это ваш зрячий помощник, который сидит рядом и описывает происходящее на экране. Вы показываете ему фотографию сломанного устройства, а он объясняет, что не так, или даете скриншот сайта, а он переводит его в код. Это работает как пара глаз, подключенная к мозгу компьютера: модель превращает пиксели в понятные данные, которые можно использовать для работы.
Зачем это нужно
Для вайбкодера Vision model — это суперсила, позволяющая быстро превращать дизайн из Figma в готовый код или находить ошибки в верстке, просто отправив скриншот в чат с ИИ. Это экономит часы ручного описания интерфейсов словами.