Стабильная Диффузия (англ. Stable Diffusion) — это нейросеть (модель ИИ), позволяющая генерировать изображения на основе текстовых фраз для генерации. Программный код продукта является открытым, в отличие от Мидджорни и доступен для скачивания любым человеком. Систему можно использовать как на сторонних сайтах за определенную плату, так и установить на собственный компьютер.
Как работает нейросеть Stable Diffusion
За увеличение разрешение и качества изображение отвечает функция upscaler. О том, как пошагово улучшить ваши картинки, я сделал отдельную инструкцию. Навык формулировать правильные запросы для нейросети оказывает решающее влияние на конечный результат.
Как установить десктопную версию
Эта технология работает на основе особой системы, называемой “скрытой диффузией”. Ее научили понимать связь между картинками и их описаниями, используя большую коллекцию примеров. В результате система узнала, как пиксели (маленькие точки, из которых состоит изображение) должны располагаться относительно друг друга. Начиная с беспорядочного набора пикселей, похожего на “шум”, система постепенно создает четкую картинку.
Перейдите на вкладку “Settings” и активируйте раздел “Face restoration” – выберите модель для восстановления лица. По умолчанию в AUTOMATIC1111 оно установлено на -1. Это значит, что при создании картинки это число будет меняться случайным образом. Вернемся к вкладке “txt2img” – мы уже рассмотрели выпадающий список с моделями, знаем что такое Prompt, размеры картинок и их количество. Со стандартными настройками помимо самих изображений вы получите дополнительную картинку в виде коллажа генерированных изображений (это если вы заказываете несколько картинок разом).
На основании статьи 1257 ГК РФ авторство может быть признано за человеком, по запросу которого было создано произведение, т.к. Если вариант генерации на сайтах по каким-то причинах не подходит, можно отдать предпочтение программам на ПК. Mage.Space — сервис с простым интерфейсом, доступными базовыми версиями Stable Diffusion и возможностью платно подключить дополнительные модули, стили и настройки. Стоимость использования Stable Diffusion на сайте начинается от 990 рублей за 1000 токенов (это внутренняя валюта для генераций). Помимо исходной версии Stable Diffusion, устанавливаемой на компьютер, есть и другие варианты использования.
Есть у Stable Diffusion и еще одна интересная функция. Вы можете загрузить в нейросеть собственное изображение и попросить ее сгенерировать похожую картинку. А то насколько она окажется похожа на оригинал, зависит от веса начального изображения, который вы укажете. Нейросети могут «жить» не только в интернете, но и на вашем собственном компьютере.
Генерация изображений
Сервис бесплатный, а количество генераций неограниченно. Чтобы сгенерировать картинку, нужно написать во вкладке txt2img текстовое описание — промпт (prompt) на английском языке. Воспользуйтесь моей авторской подборкой промптов, чтобы протестировать. После утановки я рекомендую сразу удалить предустановленную базовую модель 1.5 и пользоваться только кастомными.
- Загружаем любое изображение (хоть из интернета), жмем “Interrogate CLIP” и изучаем результат в поле текстового запроса.
- В статье рассказываем, как пользоваться ничем не уступающим Stable Diffusion в 2025 году и не платить ни копейки за подписку.
- С помощью Inpainting можно заменить любой объект на изображении на сгенерированный нейросетью — например, поменять кота на собаку.
- Регенерируйте изображение, пока не будете удовлетворены результатом.
Принцип работы
Повторное использование одних и тех же дескрипторов в каждом приглашении помогает поддерживать согласованность между разными изображениями. Наличие эталонного изображения служит визуальным руководством для Stable Diffusion. Предоставление этого изображения вместе с вашими будущими подсказками дает модели четкий образец для подражания, улучшая ее понимание желаемого внешнего вида персонажа. Создание последовательных воображаемых персонажей с помощью Stable Diffusion требует тщательной настройки модели, чтобы она соответствовала вашему конкретному творческому видению. Если у вас есть изображение, которое вас устраивает, вы можете загрузить его для использования в своих проектах.
Приложение (веб и мобильное) с удобным интерфейсом. В разделе Studio доступны более 30 популярных моделей. По умолчанию создаются изображения в высоком разрешении без дополнительной платы за улучшение качества. В разделе «Аватар» можно загружать фотографии и превращать их в художественные работы, используя один из 17 стилей.
Это первый пост в недавно созданном сообществе Midjourney, который является полной инструкцией к применению. Если нет – я бы рекомендовал начать с Midjourney, по нему есть прекрасный гайд на ДТФ. Так как там вы в реальном времени смотрите, как другие люди создают и уточняют свои запросы и что при этом выдает нейросеть в каждой модификации. Главное — не переживайте, если у вас с нескольких попыток не получается желаемого результата. Чтобы нейросеть угадала, что вы имели в виду, обычно приходится перебирать десять модификаций одного и того же запроса. Не бойтесь повторяться в запросах — так нейросеть попытается понять, к чему вы больше всего стремитесь.
Изначально MidJourney была представлена в марте 2022 года в качестве закрытого Discord-сервера. Однако спустя несколько месяцев она стала доступна для всех. Укажите в настройках требуемое разрешение изображения. Оптимальным здесь считается 512х512 пикселей, тогда как более высокое разрешение приведет к тому, что ваша видеокарта будет stable diffusion как пользоваться работать на пределе своих возможностей. Поэтому мы советуем устанавливать разрешение 512х512 пикселей и при необходимости увеличивать его с помощью любых сервисов апскейлинга в сети.
Например, если вы хотите передать мрачное настроение, то одновременно используйте слова «темно», «мрачно», «плохо освещено», «страшно», «хоррор». Stability AI использует этот сайт, чтобы собирать фидбэк от пользователей, когда они выбирают лучшую картинку из четырех. Таким же образом фибдек получают в Midjourney при тестировании новых версий. Функция Outpainting позволяет бесконечно дорисовывать готовое изображение и генерировать фон вокруг готовой картинки. Например, пользователь Reddit дорисовал платье героине картины «Девушка с жемчужной сережкой».
Его имя сильно улучшает качество изображений и добавляет им эпичности. Если попытаться поискать работы Рутковски, чаще появляются сгенерированные картинки в его стиле, а не оригиналы. Вы можете бесплатно создать изображение в режиме онлайн на официальном сайте Stable Diffusion — на это потребуется пара минут. Он работает через браузер, не требует установки и поддерживается совершенно любыми устройствами.