
Описание проекта
В рамках этого проекта я обучила нейросеть Stable Diffusion (через LoRA / DreamBooth) для генерации изображений в стиле Винсента ван Гога. Основная идея заключалась в том, чтобы исследовать, как классическая экспрессия и живописная манера Ван Гога могут быть применены к современным визуальным сюжетам — архитектуре, урбанистике и повседневным сценам XXI века.
Моя цель — воссоздать эмоциональную энергию и колористику Ван Гога в изображениях современных городов, передать движение мазков, вибрацию цвета и ощущение внутреннего света, характерное для его живописи.
Проект показывает, как можно использовать обучение генеративной модели для стилизации и художественного осмысления современной реальности.
Исходные изображения
Исходные изображения. Картины Винсента Ван Гога.
Процесс обучения
Сначала были установлены необходимые библиотеки для работы — Diffusers и DreamBooth.
Затем изображения были загружены из локального хранилища компьютера в Google Colab.
После этого я проверила успешность загрузки файлов. Дополнительно изображения обрезаются до квадратного формата (соотношение сторон 1:1) с помощью кода, сгенерированного с помощью ChatGPT.
Я установила нужные библиотеки — чтобы работать с нейросетью Stable Diffusion и форматом LoRA.
Дальше подключила модель Stable Diffusion — это основа, умеющая превращать текст в изображение.
Затем создаём и обучаем LoRA — это надстройка, которая учится твоему стилю на твоих картинках.
Сохраняем обученные веса LoRA — чтобы потом можно было применять стиль без повторного обучения.
Загружаем модель снова, уже с LoRA-весами — теперь она знает мой визуальный язык.
Я написала текстовый запрос (промпт) — описываю, что хочу увидеть, добавляя тег своего стиля.
Модель создаёт изображение — комбинирует текст и стиль, выдаёт картинку.
Сохраняю результат — в папку и смотрю прямо в Colab.
Итоговые генерации