- Регистрация
- 31.12.2019
- Сообщения
- 7,151
- Реакции
- 34
Примерно десять часов назад вышла Stable Diffusion 3 от [unfurl="https://stability.ai"]stability.ai[/unfurl]
![02acda35-75c6-4856-8cde-d4780fbe2b8d.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F02acda35-75c6-4856-8cde-d4780fbe2b8d.webp&hash=c0f7d3a4bb65b5b51dc3608623494168)
На сегодняшний день это самая продвинутая open-source модель для генерации изображений с 2 миллиардами параметров, которая адекватно функционирует даже на ноутбуках. Её качество генерации изображений на высшем уровне, а понимание текстовых запросов впечатляющее, по сравнению с предыдущими версиями Stable Diffusion.
Поддержка модели уже есть в ComfyUI, для Automatic1111 придётся подождать. Поэтому в этой статье мы убьём одним выстрелом двух зайцев: расскажем, как установить ComfyUI и поставим Stable Diffusion 3..
![d2e910ac-bb49-453f-b916-b4f62a7ec53d.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fd2e910ac-bb49-453f-b916-b4f62a7ec53d.webp&hash=669b3911429471f5478216330c7b074f)
Немного про ComfyUI
ComfyUI — это пользовательский интерфейс (UI) для создания изображений с преобразованием текста в изображение с использованием моделей Stable Diffusion. Он предлагает большую гибкость и контроль, чем Automatic1111, что делает его лучшим выбором для опытных пользователей, которым нужен больший контроль над процессом создания изображений.
![a227857d-d162-4eb5-8409-dd1d8cebf804.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fa227857d-d162-4eb5-8409-dd1d8cebf804.webp&hash=7277c70ce491e8f011f906c775722bc4)
Установка ComfyUI
Переходим на официальный репозиторий GitHub - https://github.com/comfyanonymous/ComfyUI
![d47d245f-747c-48e6-8f3b-498a746f29ce.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fd47d245f-747c-48e6-8f3b-498a746f29ce.webp&hash=d60186afec3849cfe0e3ae7b9940d055)
![b1de1f29-5496-4f03-aaec-3f3ec1ae21ba.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fb1de1f29-5496-4f03-aaec-3f3ec1ae21ba.webp&hash=910d6ff47838c4747166bc269993c384)
![5fbb5d96-7223-4e5f-9325-aa21d5494fdf.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F5fbb5d96-7223-4e5f-9325-aa21d5494fdf.webp&hash=0608239691e79dcf89f1411e6a2b6faf)
![cf8a57b7-3e0b-4398-b448-74cee860b472.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fcf8a57b7-3e0b-4398-b448-74cee860b472.webp&hash=edc02643e43f7fc724f623584d3545f8)
![d57adf8b-8b62-419a-b512-4b71c9e25854.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fd57adf8b-8b62-419a-b512-4b71c9e25854.webp&hash=7cb918ccfb37c2feb0b1781a3d6e9ad6)
![e573d3f0-20f5-452c-a92b-2f2653cc9597.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fe573d3f0-20f5-452c-a92b-2f2653cc9597.webp&hash=24455ab9e644a2f67cbb689af5b89a01)
![c0c573cc-72e2-45d7-8aa9-bea10bc0a91e.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fc0c573cc-72e2-45d7-8aa9-bea10bc0a91e.webp&hash=727f9e82a4f3454a81b8ac3e56909dd3)
![e4ab9c9d-caff-49a2-8f26-99b9853d8674.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fe4ab9c9d-caff-49a2-8f26-99b9853d8674.webp&hash=2f61104bc53913ceaf4846e92f5043c6)
![313cb6c8-9c77-4904-85d4-06b79ac5c3e3.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F313cb6c8-9c77-4904-85d4-06b79ac5c3e3.webp&hash=0fac3b34bba956916b8917d0c2e2f38a)
![35aa0aa7-4f8e-4a1c-89f4-bab34116f45a.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F35aa0aa7-4f8e-4a1c-89f4-bab34116f45a.webp&hash=50749fe0d0a00fe71f72384f11b1c8b6)
Немного про ноды (узлы) в интерфейсе ComfyUI
По изображению выше, вы уже можете представить себя в роли сис. админа, прокладывающего кабели. Все, что вы видите на картинке, — это стандартная схема, используемая по умолчанию в ComfyUI.
Ноды — это функциональные блоки для алгоритмов на [tooltip=894]Python[/tooltip], которые можно соединять линиями в логические цепочки. Они выполняют ту же роль, что и меню в automatic1111, задавая параметры для формирования изображения, но здесь их можно конструировать в сложные системы вручную и тонко настраивать, что в automatic1111 было бы невозможно. Это и плюс, и минус одновременно: множество возможностей, но разобраться в них непросто.Для удобного взаимодействия с нодами можно поставить ComfyUI-Manager, но об этом чуть позже.
Теперь можем перейти к скачиванию модели Stable Diffusion 3 с Hugging Face
Заходим на https://huggingface.co/stabilityai/stable-diffusion-3-medium. Для доступа к файлам необходимо заполнить небольшую форму (проявляем смекалочку и заполняем на рандом),
![b5a4a906-22bd-4f5c-80cd-e0b2a1dfce84.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fb5a4a906-22bd-4f5c-80cd-e0b2a1dfce84.webp&hash=65e209c2e72ed89f0a0fce37c844ebac)
Для удобства пользователей мы подготовили три варианта упаковки модели SD3 Medium, каждый из которых оснащен одинаковым набором весов MMDiT и VAE.
- sd3_medium.safetensors включает в себя грузики MMDiT и VAE, но не включает в себя текстовые кодировщики.
- sd3_medium_incl_clips_t5xxlfp8.safetensors содержит все необходимые веса, включая fp8-версию текстового кодера T5XXL, обеспечивая баланс между качеством и требованиями к ресурсам.
- sd3_medium_incl_clips.safetensors содержит все необходимые веса, кроме текстового кодировщика T5XXL. Он требует минимальных ресурсов, но без кодировщика текста T5XXL производительность модели будет отличаться.
- Папка text_encoders содержит три текстовых кодировщика и ссылки на их оригинальные карты моделей для удобства пользователей. На все компоненты в папке text_encoders (и их аналоги, включенные в другие пакеты) распространяются соответствующие оригинальные лицензии.
- Папка example_workfows содержит примеры удобных рабочих процессов.
![620d1ce7-2f3c-45ec-ba72-f0dfff5180a0.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F620d1ce7-2f3c-45ec-ba72-f0dfff5180a0.webp&hash=5bc61c4836e5e931c20d337a11567640)
![cb692deb-65c4-4698-92ab-ff2ef1c14344.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fcb692deb-65c4-4698-92ab-ff2ef1c14344.webp&hash=1bd0770f30add860778e5ee3ea4ff0d1)
![55b8e9ce-57ae-4a27-afd4-d72ed8cc772c.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F55b8e9ce-57ae-4a27-afd4-d72ed8cc772c.webp&hash=8cb54b1e40f57129106c55e86e45060b)
![da0ab7f7-ce55-4280-be9a-a3be19abfd31.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fda0ab7f7-ce55-4280-be9a-a3be19abfd31.webp&hash=13dd39353ea25be55764848250d2699f)
Жмем кнопочку «Load» в интерфейсе и выбираем схему
![ea13ca57-4a29-440c-bb7f-97132dfbbcab.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fea13ca57-4a29-440c-bb7f-97132dfbbcab.webp&hash=9752641fb497146d1e27f5c3f7940663)
![5a9b9c00-b748-461e-ab4c-8191627e7780.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F5a9b9c00-b748-461e-ab4c-8191627e7780.webp&hash=87cdc195ab8fb28d0436e7800a1c6c61)
![b76bf7b7-e100-463f-ab32-ceacd7414326.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fb76bf7b7-e100-463f-ab32-ceacd7414326.webp&hash=86874d7e549e2226145c3340a4a6102e)
Базовые настройки и их определение
я бы советовал оставить текущие параметры.
Описание для каждого узла из схемы
Если вы хотите использовать генерацию случайного сида для каждого изображения, поставьте «randomize».
![2302eb2f-2272-43cf-9935-86980aea3880.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F2302eb2f-2272-43cf-9935-86980aea3880.webp&hash=5c46fc834559f6e1da8200ba1fb6dc60)
![12b3b24c-9d5b-4957-aa05-5dc2a499f369.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F12b3b24c-9d5b-4957-aa05-5dc2a499f369.webp&hash=322afc2f27ee91dc154fa9ae34becb32)
Промпт (от англ. prompt) — это [tooltip=529]запрос[/tooltip] к нейросети с целью получить желаемое изображение или текст. Чем четче и правильнее прописан промпт, тем более релевантным будет результат.
Negative Prompt (или отрицательная подсказка) - это дополнение к Prompt, которое уточняет, что не следует включать в изображение. Он указывает на элементы или аспекты, которые пользователь не хочет видеть на создаваемом изображении.
Negative Prompt (или отрицательная подсказка) - это дополнение к Prompt, которое уточняет, что не следует включать в изображение. Он указывает на элементы или аспекты, которые пользователь не хочет видеть на создаваемом изображении.
![6064ccc2-4d48-49e1-a3fe-449898a537d1.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F6064ccc2-4d48-49e1-a3fe-449898a537d1.webp&hash=ca0126f6ed47f07322d6a3004b51d241)
steps — количество шагов, используемых при денуазировании. Чем больше шагов может сделать сэмплер, тем точнее будет результат.
CFG Scale (classifier-free guidance scale) — это величина соответствия текстовому запросу. Чем больше, тем ближе результат к запрошенному, но вместе с тем и более шумный.
sample name — какой сэмплер будет использовать ComfyUI
scheduler — тип используемого расписания
denoise — сколько информации о латентах должно быть стерто шумом.
CFG Scale (classifier-free guidance scale) — это величина соответствия текстовому запросу. Чем больше, тем ближе результат к запрошенному, но вместе с тем и более шумный.
sample name — какой сэмплер будет использовать ComfyUI
scheduler — тип используемого расписания
denoise — сколько информации о латентах должно быть стерто шумом.
![6064ccc2-4d48-49e1-a3fe-449898a537d1.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F6064ccc2-4d48-49e1-a3fe-449898a537d1.webp&hash=ca0126f6ed47f07322d6a3004b51d241)
Описание для каждого узла из схемы
Узел Load Checkpoint можно использовать для загрузки диффузионной модели, диффузионные модели используются для денуации латентов. Этот узел также предоставит соответствующую модель VAE и CLIP.
![2b7dade1-c1eb-4ee3-a17b-daeabced3ded.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F2b7dade1-c1eb-4ee3-a17b-daeabced3ded.webp&hash=d9e1bc9b80897adf7e48b6a0c49cd0b8)
Узел Load CLIP можно использовать для загрузки определенной модели CLIP. Модели CLIP используются для кодирования текстовых подсказок, которые направляют процесс распространения.
![4a87478f-94ad-4066-8609-dd735de03255.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F4a87478f-94ad-4066-8609-dd735de03255.webp&hash=2210e00147fda1ca27ec29e40767ab1a)
ConditioningSetTimestepRange — это новый узел в ComfyUI, а также один из самых мощных инструментов кондиционирования текста, которые у нас есть.
Узел позволяет задать временную позицию запуска/остановки для каждого запроса. Допустим, у нас есть 20 шагов, вы можете сказать сэмплеру, чтобы он начал «раскрашивать» кота на 5 шагов (которые, вероятно, самые важные), а затем забыть о кошке и начать генерировать собаку для оставшихся 15.
Узел позволяет задать временную позицию запуска/остановки для каждого запроса. Допустим, у нас есть 20 шагов, вы можете сказать сэмплеру, чтобы он начал «раскрашивать» кота на 5 шагов (которые, вероятно, самые важные), а затем забыть о кошке и начать генерировать собаку для оставшихся 15.
![bff121b4-79fd-4dbb-8d23-fc079f72f466.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fbff121b4-79fd-4dbb-8d23-fc079f72f466.webp&hash=817a52b699438835425f3c5f24d365e9)
Узлы cэмплирования обеспечивают возможность устранения скрытых помех на изображениях с использованием диффузионной модели. Чтобы получить обзор доступных графиков и выборок, воспользуйтесь,
![20cda249-d223-41f1-b13a-fea35db870f5.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F20cda249-d223-41f1-b13a-fea35db870f5.webp&hash=820f43e1f16c7cbaedeeb31e238b7e27)
Интуитивно понятный узел управления сидами, который работает очень похоже на управление сидами от Automatic1111.
![9f4a7a09-2246-41c7-9ecc-148cff2126af.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F9f4a7a09-2246-41c7-9ecc-148cff2126af.webp&hash=0a9b852a3424772a6c615dfe01a02de1)
Пустой узел скрытого изображения можно использовать для создания нового набора пустых скрытых изображений. Эти скрытые изображения затем можно использовать, например, в рабочем процессе text2image, добавляя к ним шумы с помощью узла sampler.
![6efd692b-25bf-4096-ad01-3dc93366ccb1.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F6efd692b-25bf-4096-ad01-3dc93366ccb1.webp&hash=d42e3ac0235762a81d9bf150ecab6238)
Узел CLIP Text Encode можно использовать для кодирования текстовой подсказки с помощью модели CLIP во вставку, которая может быть использована для направления модели диффузии на генерацию определенных изображений.
![7acb2d33-d2d5-4f0c-9ede-b2bd294a86a3.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F7acb2d33-d2d5-4f0c-9ede-b2bd294a86a3.webp&hash=0da593392a3abd3058bb5b7298af5cb5)
ConditioningZeroOut - этот узел обнуляет определенные элементы в структуре данных обусловливания, эффективно нейтрализуя их влияние на последующих этапах обработки. Он предназначен для расширенных операций кондиционирования, где требуется прямое манипулирование внутренним представлением обусловливания.
![041ee4bd-ff7e-42a2-a55c-157005a1d7b3.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F041ee4bd-ff7e-42a2-a55c-157005a1d7b3.webp&hash=c6b87cfa5599e109205995e039f3b678)
Узел Conditioning (Combine) можно использовать для объединения нескольких кондиционирований путем усреднения прогнозируемого шума диффузионной модели. Обратите внимание, что это отличается от узла Conditioning (Average). Здесь выходы диффузионной модели, обусловленные различными условиями (т. е. все части, составляющие условие), усредняются, а узел Conditioning (Average) интерполирует текстовые вкрапления, хранящиеся внутри условия.
![0771e1ae-e0cd-47c0-bbd5-a403595b6244.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F0771e1ae-e0cd-47c0-bbd5-a403595b6244.webp&hash=fcb390520fa575ba93a88e8322c61637)
KSampler использует предоставленную модель и положительные и отрицательные условия для создания новой версии латента. Сначала латент подвергается шумоподавлению в соответствии с заданными параметрами [tooltip=121]seed[/tooltip] и denoise strength, в результате чего стирается часть латентного изображения. Затем этот шум удаляется с использованием заданной модели и положительных и отрицательных условий в качестве руководства, "создавая" новые детали в тех местах, где изображение было стерто шумом.
![ba5dfca1-c3f0-4568-be1c-4d7c4b3d3a97.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fba5dfca1-c3f0-4568-be1c-4d7c4b3d3a97.webp&hash=d3a609fff8b62d3f0b10bc71739d74db)
Узел VAE Decode может использоваться для декодирования изображений латентного пространства обратно в изображения пиксельного пространства с помощью предоставленного VAE.
![80f7a3c0-69f3-40db-932f-1fac0a1dbda3.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F80f7a3c0-69f3-40db-932f-1fac0a1dbda3.webp&hash=660650c00b9460b20d36326187488a42)
Узел Preview Image можно использовать для предварительного просмотра изображений в графе узлов.
![ee2d53a4-5d97-46e6-9fa9-26d3a0ca3b5b.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fee2d53a4-5d97-46e6-9fa9-26d3a0ca3b5b.webp&hash=721201b1f73dc33c4502e5b4b051491e)
![0d694af2-67be-48f1-95d1-bd75d031d3d5.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F0d694af2-67be-48f1-95d1-bd75d031d3d5.webp&hash=cce0a7e6b27ddabac8ea3311174a4ecb)
Как мы видим, изображение было добавлено в очередь.
![8034124d-f68f-4d94-bd54-1578525702bf.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F8034124d-f68f-4d94-bd54-1578525702bf.webp&hash=bcb83083d94b4f79a83d903b3b900ba7)
![56c19bac-0b37-4143-880d-24f1b7a79eb5.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F56c19bac-0b37-4143-880d-24f1b7a79eb5.webp&hash=351b029e8193f77940ddb10305f96798)
Про ComfyUI Manager
ComfyUI-Manager — это расширение, предназначенное для повышения удобства использования ComfyUI. Он предлагает функции управления для установки, удаления, отключения и включения различных пользовательских узлов ComfyUI. Кроме того, это расширение предоставляет функцию концентратора и удобные функции для доступа к широкому спектру информации в ComfyUI.
ComfyUI-Manager — это расширение, предназначенное для повышения удобства использования ComfyUI. Он предлагает функции управления для установки, удаления, отключения и включения различных пользовательских узлов ComfyUI. Кроме того, это расширение предоставляет функцию концентратора и удобные функции для доступа к широкому спектру информации в ComfyUI.
![6f63c46d-4b35-4c19-8be6-7c4d00486aff.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F6f63c46d-4b35-4c19-8be6-7c4d00486aff.webp&hash=d27c7d04c95f43d94fe9b0a289a3492e)
![7afd36d6-5efd-45a0-a08d-203c46dbb4bf.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F7afd36d6-5efd-45a0-a08d-203c46dbb4bf.webp&hash=4623cc0c07c4e0144d1902b0cfa8e6e1)
![3bb52e4f-5e87-45c5-894f-e2ed3604070e.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2F3bb52e4f-5e87-45c5-894f-e2ed3604070e.webp&hash=87fb556c5dd9e637a8cda1fff4671570)
![bcb6ff65-6436-440e-9924-6a54bf7f6064.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Fbcb6ff65-6436-440e-9924-6a54bf7f6064.webp&hash=811ba2a2895c2a750ac7209d810ac365)
![aa455567-3efb-4d97-a582-065635d7d339.webp](/proxy.php?image=https%3A%2F%2Fnztcdn.com%2Ffiles%2Faa455567-3efb-4d97-a582-065635d7d339.webp&hash=a7ca3b579bcbf2e8da54eba4b18b6709)
Вот и все, гайд завершен. [tooltip=71]База[/tooltip] рассказана, надеюсь все будут довольны и кому-то моя статья пригодится. :cool_bun: