Midjourney vs Stable Diffusion: Что лучше выбрать?

Блог

Midjourney – это web-сервис, который создает потрясающие AI-картинки с помощью слов. Он похож на Stable Diffusion, но в нем есть некоторые отличия. Midjourney можно использовать только через Интернет, и за его использование нужно платить. Так стоит ли платить за Midjourney? И чем он отличается от Stable Diffusion? Давайте узнаем.

Midjourney vs Stable Diffusion – сравнение возможностей


В этом разделе вы найдете подробное сравнение между Stable Diffusion и Midjourney. В отличие от Midjourney, существует несколько способов использования Stable Diffusion. Я ограничу свой анализ использованием версии от AUTOMATIC1111, популярного графического интерфейса для Stable Diffusion.

Как и Midjourney, вы можете использовать Stable Diffusion от AUTOMATIC1111 как веб-сервис (например,в Google Colab). Вы также можете использовать его локально на Windows PC и Mac. Новичок в Stable Diffusion? Ознакомьтесь с кратким руководством для начинающих.

В этой статье вы увидите сравнения изображений. Я подкорректировал промты и выбранные модели в каждом отдельном случае, чтобы добиться оптимального качества изображений. Поэтому это не прямые сравнения одних и тех же промтов, а скорее попытки создать похожие изображения в разных стилях.

Midjourney vs Stable Diffusion: Что лучше выбрать?
Midjourney (v4)
Midjourney vs Stable Diffusion: Что лучше выбрать?
Stable Diffusion (v1.5)
Stable Diffusion
(AUTOMATIC1111)
Midjourney
Кастомизация изображенийПодробнаяСлабая
Легкость запускаСреднеЛегко
Легкость генерации
качественных изображений
ЛегкоСложно
InpaintingЕстьНет
OutpaintingЕстьНет
Соотношение сторонЕстьЕсть
Время выполнения~1 сек~10 сек
Негативные промтыЕстьЕсть
Отклонения при генерацииЕстьЕсть
Управление композицией и позойЕстьНет
Версии моделейСвободная.
В зависимости от
используемой модели
Ограниченная.
В зависимости от
тарифного плана
Создание собственной моделиМожноНельзя
СтоимостьБесплатно$10-$60 в месяц
МодельОткрытый исходный кодЗакрытая
Фильтр контента (NSFW/SFW)Без ограниченийС ограничениями
СтильМного вариацийРеалистичный,
художественный
UpscalerЕстьЕсть
Промт-изображениеНетЕсть
Image-to-image (img-2-img)ЕстьНет
Лимит на кол-во промтовНет?

Кастомизация изображений

В Stable Diffusion больше возможностей для настройки изображения, например, можно изменить размер изображения, указать насколько точно нужно следовать промту, задать количество генерируемых изображений,менять значение seed, использовать сэмплеры и т.д. В Midjourney возможностей меньше. Вы можете изменить соотношения сторон, значение seed и возможность досрочной остановки.

Вывод: побеждает Stable Diffusion.

Легкость запуска

Установить AUTOMATIC1111 немного сложновато. После того, как вы его запустите, вам все равно придется искать и устанавливать модели, чтобы получить нужные вам стили.

Midjourney не так удобен в пользовании, как хотелось бы, в основном из-за того, что они выбрали Discord в качестве своего интерфейса. Но все же начать работать с ним в десять раз легче.

Совет: Хотите спрятать свои генерации от чужих глаз? Создайте новый приватный сервер и пригласите бота Midjourney. И вы сможете спокойно генерировать любые картинки.

Вывод: Midjourney побеждает.

Midjourney vs Stable Diffusion: Что лучше выбрать?
Midjourney (v5)
Midjourney vs Stable Diffusion: Что лучше выбрать?
Stable Diffusion (DreamShaper)

Простое создание красивых изображений

Midjourney известен тем, что с его помощью поразительно легко создавать художественные изображения с множеством мелких деталей. Вам не нужно прилагать больших усилий для создания качественных изображений. На самом деле, очень часто программа игнорирует часть вашей подсказки и выдает неожиданно эстетичные изображения.

Пользователям Stable Diffusion необходимо приложить больше усилий для создания хорошего промта и больше экспериментировать с моделями для создания изображений аналогичного качества.

Вывод: Midjourney побеждает.

Промты

И Stable Diffusion, и Midjourney поддерживают промты и негативные промты. Оба могут добавить вес любым ключевым словам в подсказке. С помощью AUTOMATIC1111 можно проделывать чуть больше трюков с подсказками, например, смешивать два разных токена.

Вывод: ничья.

Механические голуби

Midjourney vs Stable Diffusion: Что лучше выбрать?
Midjourney (v4)
Midjourney vs Stable Diffusion: Что лучше выбрать?
Stable Diffusion (Protogen)

Разновидности моделей

Stable Diffusion – это нейронка с открытым исходным кодом. Люди создали модели в разных стилях. В настоящее время для загрузки доступно более тысячи моделей. Каждая из этих моделей может быть доработана с помощью моделей LoRA, моделей embedding и гипер-сетей. В итоге существует больше моделей, чем у вас есть времени, чтобы их перепробовать.

У Midjourney ограниченное количество моделей. Они предлагают модели от v1 до v5, плюс несколько специальных моделей, таких как niji, test, testp и HD. Есть дополнительный параметр, которым можно “стилизовать” изображение. Но в целом предложения Stable Diffusion значительно превосходят Midjourney .

Вывод: Stable Diffusion побеждает.

Изменение изображения

Вы можете использовать Stable Diffusion для изменения сгенерированного изображения различными способами. Сюда входит восстановление только части изображения с помощью inpainting и расширение изображения с помощью outpainting. Вы также можете просто указать Stable Diffusion, что вы хотите изменить, используя опцию pix2pix.

К сожалению, в Midjourney нельзя редактировать изображение.

Вывод: Stable Diffusion побеждает.

Сравнение реалистичных фотографий

Midjourney vs Stable Diffusion: Что лучше выбрать?
Midjourney (v5)
Midjourney vs Stable Diffusion: Что лучше выбрать?
Stable Diffusion (Dreamlike Photoreal)

Стиль

По умолчанию Midjourney v4 создает изображения в стиле реалистичной иллюстрации. Он также может генерировать другие художественные стили при правильном запросе. Реалистичная фотография возможна в модели v5.

Stable Diffusion может генерировать более широкий спектр стилей, от реалистичных фотографий до абстрактного искусства, благодаря увлеченному сообществу и простоте обучения новых моделей. Пользователи могут изменять модели с помощью embeddings, LoRAs или hypernetworks. Он может создавать удивительные эффекты, и с ним интересно экспериментировать.

Вывод: Stable Diffusion побеждает.

Варианты сгенерированного изображения

Оба проекта генерируют различные варианты изображения. Вы нажимаете кнопки V под изображениями в Midjourney. Или используете опцию вариации “seed” в AUTOMATIC1111.

Вывод: ничья.

Копирование позы с помощью Stable Diffusion ControlNet

Midjourney vs Stable Diffusion: Что лучше выбрать?
Исходное изображение
Midjourney vs Stable Diffusion: Что лучше выбрать?
Результат копии позы

Управление композицией и позой

Вы можете управлять композицией и позой в Stable Diffusion несколькими способами: Image-to-image, depth-to-image, pix2pix и controlNet. В Midjourney наиболее близким вариантом является использование изображений-подсказок, которые действуют как текстовые подсказки для управления созданием изображения.

Вывод: Stable Diffusion побеждает.

Стоимость

Использование Stable Diffusion с AUTOMATIC1111 бесплатно при работе на вашем собственном компьютере. В отличие от Midjourney, использование Midjourney обойдется вам как минимум в $10 в месяц.

Вывод: Stable Diffusion побеждает.

Лицензия

Многие не знают, что право собственности на изображения, которые вы создаете с помощью Midjourney, зависит от тарифного плана. Если вы не являетесь платным подписчиком, вам ничего не принадлежит. У вас больше прав, если вы платите больше. В любом случае, Midjourney может использовать ваши изображения, не спрашивая вас об этом. См. их условия предоставления услуг.

А вот Stable Diffusion не предъявляет никаких прав на созданные вами изображения. Вам разрешено распространять и дорабатывать модель и даже продавать ее. Однако модели, доработанные другими, могут иметь дополнительные ограничения. Поэтому обязательно читайте лицензию и условия использования, когда берете в работу свежие модели.

Вывод: Stable Diffusion выгоднее.

Midjourney vs Stable Diffusion: Что лучше выбрать?
Midjourney (v4)
Midjourney vs Stable Diffusion: Что лучше выбрать?
Stable Diffusion (DreamShaper)

Фильтрация контента

В оригинальной версии программы Stable Diffusion v1 присутствовал контент-фильтр, но пользователи быстро поделились версией с отключенным фильтром. Поэтому на практике в моделях v1 нет контент-фильтра. Версия v2 сложнее, потому что NSFW-контент удален из обучающих изображений. Она не может генерировать откровенный контент изначально. В Midjourney, напротив, генерация откровенных изображений запрещена. Это блокируется даже на уровне промтов. Вас даже могут забанить, если вы попытаетесь это сделать.

Вывод: Stable Diffusion побеждает.

Создание собственных моделей

Пожалуй, самой главной особенностью Stable Diffusion является возможность создания собственных моделей. Если вам не нравятся изображения, которые вы видите, вы всегда можете обучить свою собственную модель. Вы можете использовать dreambooth, textual inversion, LoRA, hypernetwork или просто провести дополнительные циклы обучения с собственными изображениями. К сожалению, с Midjourney этого сделать нельзя.

Вывод: Stable Diffusion побеждает.

Upscaler

И в Stable Diffusion, и в Midjourney есть апскейлеры. Количество возможных вариантов и параметров, доступных в AUTOMATIC1111, больше. Более того, вы можете легко добавить новые параметры.

Вывод: Stable Diffusion побеждает.

Промт-изображение

В MidJourney можно использовать изображение в качестве подсказки вместе с текстовой подсказкой. При этом будет генерироваться комбинация содержимого подсказки изображения и текстовой подсказки. Это не то же самое, что “image-to-image” в Stable Diffusion, где выбранное изображение выступает в качестве начальной картинки, а не используется как пример для обучения. Ближе всего к Stable Diffusion будет Stable Diffusion Reimagine, в котором вместо текстовой подсказки в качестве обучающего материала используется исходное изображение.

Вывод: Midjourney побеждает.

Image-to-image

В настоящее время Midjourney не имеет функционала image-to-image – метода для моделирования диффузионных изображений на основе другого изображения. Это неудивительно, поскольку ранние версии Midjourney, скорее всего, не являются диффузионными моделями.

Вывод: Stable Diffusion побеждает.

Лимит на количество промтов

Раньше Midjourney в своем руководстве пользователя указывал, что ограничение на количество промтов составляет около 60 слов. Но они удалили это заявление. С другой стороны, AUTOMATIC1111 теперь поддерживает неограниченную длину подсказок.

Вывод: недостаточно понятно кто лучше.

Использует ли Midjourney модель Stable Diffusion?

Модель Midjourney v5 не использует Stable Diffusion. Это все, что было сказано разработчиком. Однако улучшения в v5 выглядят подозрительно похожими на Stable Diffusion v2: Подсказки должны быть более буквальными и конкретными. Люди получаются с пятью пальцами… Может ли Midjourney использовать некоторые элементы из Stable Diffusion v2, например, встраивание текста в OpenClip? Конечно, ведь использование диффузионной модели имеет смысл из-за более низких затрат.

Лучше ли Midjourney, чем Stable Diffusion?

Я не хочу давать на это слишком простой ответ, но это действительно зависит от того, что вы хотите получить.

Midjourney имеет свой собственный уникальный стиль – высокий контраст, хорошее освещение и реалистичные иллюстрации. Очень легко создавать изображения с огромным количеством деталей. Вы можете получить качественные изображения, не прилагая особых усилий.

С другой стороны, Stable Diffusion также может создавать подобные или даже более качественные изображения, но для этого требуется немного больше опыта. Итак, если вы готовы к испытаниям и хотите глубоко погрузиться в техническую сторону вещей, то Stable Diffusion идеально вам подойдёт.

Чем Midjourney отличается от Stable Diffusion?

Вы можете прочитать первый раздел для сравнения по пунктам. Основное различие заключается в действующей модели и пользователях, которых они обслуживают.

Midjourney выбрала закрытую коммерческую модель. Они берут на себя разработку модели, обучение, настройку и пользовательский интерфейс. Все должно быть просто и работать “из коробки”. Вы говорите нейронке, что вы хотите, и получаете это.

Stable Diffusion – это нейронная сеть, основанная на экосистеме с открытым исходным кодом. Коды модели и учебные данные доступны всем желающим. Вы можете строить и дорабатывать на ее основе свою модель… И знаете что? Люди уже делают это! Существуют тысячи моделей, которые были созданы и выложены в открытый доступ такими же пользователями, как и вы.

Но это еще не все. Новые и невероятные модели создаются каждую неделю, и меня не перестает удивлять, насколько творческими могут быть люди, когда им предоставляется такая возможность.

Midjourney vs Stable Diffusion: Что лучше выбрать?
Midjourney (v5)
Midjourney vs Stable Diffusion: Что лучше выбрать?
Stable Diffusion (Realism Engine)

Генерация изображений Midjourney в Stable Diffusion

Воссоздать изображение в стиле Midjourney в самом Stable Diffusion непросто, но возможно. Я использую следующий способ:

Используйте тот же промт, чтобы посмотреть, что получится. Вы можете начинать с базовой модели v1.5. Результат часто сильно отличается.

  1. Подкорректируйте основные промты. Скорее всего, вы обнаружите, что Midjourney игнорирует некоторые ключевые слова и добавляет другие. Обычно я смотрю на ключевые слова в генераторе промтов, чтобы понять, как добиться того же эффекта.
  2. Возможно, вы захотите добавить негативный промт (обычно подходят универсальные).
  3. Вам обязательно нужно будет добавить несколько ключевых слов для освещения. Обратите внимание на контрастность и яркость. Выберите ключевые слова по освещению, которые помогут добиться аналогичного эффекта.
  4. Поскольку изображения Midjourney имеют более темную цветовую гамму, возможно, вам захочется попробовать использовать LoRA, например epi_noiseoffset.
  5. Наконец, поэкспериментируйте с разными моделями и воспользуйтесь тонкой настройкой.
  6. И еще используйте ControlNet, если хотите повторить композцию.

Я напишу еще одну статью, чтобы подробно описать этот процесс шаг за шагом. Оставайтесь с нами!

Где лучше генерировать, какие рекомендации!?

Midjourney и Stable Diffusion имеют широкую аудиторию поклонников. У каждого из них есть свои сильные и слабые стороны.

Midjourney – для вас, если:

  • Вы хотите генерировать потрясающие изображения без углубления в обучение.
  • Вы занятой человек и не можете позволить себе время на настройку и изучение моделей.
  • Вам нравятся стили Midjourney.
  • Вы ищете готовое решение для создания AI-образов.
  • Вы не против платить абонентскую плату.
  • Вас устраивают их условия использования.

Stable Diffusion – точно для вас, если:

  • Вам нужно полностью бесплатное решение.
  • Вы хотите работать локально (на своем компе).
  • Вы технически подкованный человек.
  • Вам нравится возиться с настройками, пробовать комбинации моделей и использовать новые инструменты.
  • Вам нужна возможность редактирования изображений.
  • Вы предпочитаете инструменты с открытым исходным кодом.
  • Вы хотите иметь больше свободы действий над своими изображениями.

Я надеюсь, что эта статья поможет вам понять разницу между Midjourney и Stable Diffusion и поможет вам решить, что из них вам подойдет лучше. Если у вас есть время и ресурсы, то вам стоит попробовать оба варианта. Скорее всего, вы обнаружите, что они оба могут занять свое место в вашей творческой среде… Дерзайте

Оцените статью
Нейросети
Добавить комментарий