Бесконечные возможности Stable Diffusion: как генерация изображений может изменить нашу реальность | 26 января 2023 года, 14:16

Я тут поставил себе локально Stable Diffusion с дефолтной моделью и openjourney – это генератор изображений по промптам, но безлимитный. И вот что подумалось. Промпт должен быть сформулирован така, как бы компьютер его сформулировал, глядя на финальное изображение. А компьютер умеет узнавать в изображении паттерны, которые когда-то встречались в обучающей выборке. То есть, трехлапого кота он нормально не нарисует, если в выборке не было трехлапых животных. И он также в трехлапом коте увидит кота, а не трехлапость. То есть, абстрактное мышление у системы очень ограничено тем, что ей показали на обучении.

А ведь можно обучать на сгенерированных алгоритмически объектах. Например, если задать трехлапость в современных анимационных программах, можно нагенерить тысячи разнородных животных на таком скелете, и в разных позах. Вот интересно бы получать систему на таком. Ведь по идее, такой подход не только для животных пойдет. Если сделать капчу на результаты работы ai, люди будут отфильтровать и теггировать результаты за бесплатно.

Оставьте комментарий