ComfyUI tutorijal za vizuelne efekte: Vodič korak po korak

  • ComfyUI nudi granularnu kontrolu na nivou čvorova za VFX sa SD, ControlNet, LoRA i SDXL, kako za sliku tako i za video.
  • AnimateDiff, HunyuanVideo, LTX Video i Wan 2.1 proširuju ekosistem za generiranje glatkih i konzistentnih klipova.
  • Administrator olakšava instaliranje/ažuriranje čvorova i održavanje reproducibilnih tokova s ​​ispravnim modelima i ovisnostima.
  • Cloud opcije smanjuju hardverske barijere; lokalne opcije pružaju maksimalnu kontrolu i detaljno prototipiranje.

ComfyUI

Ako želite da se odmah upustite u kreiranje slika i videa pomoću vještačke inteligencije, a da pritom ne izgubite finu kontrolu, došli ste na pravo mjesto: ComfyUI je interfejs zasnovan na čvorovima koji vam omogućava da izgradite vlastiti proces poput LEGO kockica. U ovom vodiču ćete od nule i detaljno naučiti kako postaviti radne procese vizualnih efekata (VFX) u ComfyUI-ju., i za slike i za video, bez propuštanja ičega važnog.

Pored osnova, pogledat ćemo tokove pretvaranja teksta u sliku, tokove pretvaranja slike u sliku, inpainting, outpainting, skaliranje, ControlNet, SDXL, LoRA i ugrađivanja. Preći ćemo na video uz AnimateDiff, HunyuanVideo, LTX Video i Wan 2.1.Ovo uključuje zahtjeve, instalaciju, ključne parametre i savjete za produktivnost s prečicama i upraviteljima čvorova. Također ćemo obraditi opcije oblaka ako želite izbjeći složene instalacije.

Šta je ComfyUI i zašto je idealan za VFX?

ComfyUI je grafički korisnički interfejs (GUI) za stabilnu difuziju (Stable Diffusion) zasnovan na čvorovima koji vam omogućava pregled i modifikaciju toka podataka od početka do kraja. Svaki čvor obavlja određeni zadatak (učitavanje modela, kodiranje teksta, uzorkovanje, dekodiranje VAE, itd.) i povezan je kablovima. koji predstavljaju ulaze i izlaze. Ova filozofija je savršena za VFX: tačno znate gdje signal ulazi, gdje se transformiše i kako uticati na rezultat.

U poređenju sa monolitnim interfejsima, ComfyUI se ističe svojom transparentnošću i fleksibilnošću. Cijena te slobode je strmija krivulja učenja i određena vizualna distrakcija. (svaki radni tok može biti drugačije postavljen), ali nagrada je mogućnost brze izrade prototipa, preciznog otklanjanja grešaka i dijeljenja radnih tokova na ponovljiv način.

ComfyUI u odnosu na AUTOMATIC1111

Mnogi korisnici dolaze s AUTOMATIC1111, klasika za stabilnu difuziju. ComfyUI dobija na lakoći, transparentnosti i mogućnostima izrade prototipaA1111 djeluje ujednačenije i direktnije, ali manje granularno. Ako želite razumjeti unutrašnje funkcionisanje i izvući maksimum iz VFX-a, ComfyUI je sigurna opcija.

Prvi koraci i osnovne kontrole

Interakcija s platnom je jednostavna: zumirajte pomoću kotačića ili geste štipanja, povucite za pomicanje i kreirajte veze povlačenjem od izlaza jednog čvora do ulaza drugog. Vidjet ćete blokove (čvorove) poput Load Checkpoint, CLIP Text Encode, KSampler ili VAEi kablove koji predstavljaju putanju podataka.

Tekst u sliku: osnovni tok i bitni čvorovi

Standardni cjevovod uključuje učitavanje kontrolne tačke, kodiranje prompta, uzorkovanje latentnih slika i dekodiranje u piksele. Ovo je kostur na kojem je izgrađeno gotovo sve u ComfyUI-ju..

Odabir modela s kontrolnom tačkom opterećenja

Čvor Load Checkpoint isporučuje tri dijela: MODEL (mreža za predviđanje šuma), CLIP (enkoder teksta) i VAE (za prelazak sa piksela na latentne slike i obrnuto). MODEL šalje podatke u KSampler, CLIP ide do tekstualnih čvorova, a VAE se koristi za dekodiranje konačnog rezultata.Bez kontrolne tačke nema igre, zato odaberite onu koja je kompatibilna s vašim radnim procesom.

Pozitivni i negativni upiti s CLIP tekstualnim kodiranjem

Koristite dva CLIP Text Encode čvora: gornji za pozitivan i donji za negativan. Tekst se transformira u ugrađene materijale visoke rezolucije koji usmjeravaju širenje informacija.Možete ponderirati riječi sintaksom (termin:1.2) kako biste dali veću ili manju težinu konceptima.

Generisanje i parametri KSamplera

KSampler

Uzorkovanje će započeti kada ga stavite u red čekanja (Prompt u red čekanja). KSampler kontroliše početnu vrijednost, korake, sampler, planer i jačinu uklanjanja šuma.Fiksno početno vrijednost omogućava ponovljivost; više koraka obično poboljšava detalje (po cijenu vremena); denoise=1 u text2img primjenjuje potpuni proces uklanjanja šuma.

Prazna latentna slika: rezolucija i serije

Čvor Prazna latentna slika kreira početno latentno platno. Visina i širina moraju biti višekratnici broja 8Tipične veličine: 512/768 za SD 1.5 i 1024 za SDXL. Prilagodite veličinu serije ako želite više slika po pokretanju.

VAE: kompresija i rekonstrukcija

VAE kodira i dekodira između piksela i latentnih slika. Pruža efikasnost i manipulativni latentni prostor, u zamjenu za neke gubitke ili artefakte.U text2img, koristit ćete ga uglavnom na kraju (VAE Decode) da biste dobili sliku u pikselima.

Slika u sliku, SDXL i preslikavanje/preslikavanje

Slika po slika

Ovaj tijek rada kombinuje prompt i osnovnu sliku. Odaberite kontrolnu tačku, učitajte sliku, pregledajte upute i prilagodite uklanjanje šuma u KSampleru da odlučite koliko odstupate od originala (manje šuma = više slično izvoru).

SDXL na ComfyUI-ju

ComfyUI podržava SDXL rano i efikasno zahvaljujući svojoj modularnosti. Pripremite pozitivne/negativne upute i pokrenite proces s odgovarajućim uzorkivačem; zapamtite optimalnu rezoluciju latentnog signala (obično 1024).

Inpainting

Da biste izmijenili određena područja, učitajte sliku, otvorite uređivač maski i sačuvajte masku u čvor. Ovaj tijek rada koristi standardne modele; ako koristite kontrolnu tačku "inpainting", koristite VAE Encode (Inpaint). Umjesto standardnih VAE Encode i Set Noise Latent Mask čvorova, postavlja se prompt za opis promjene i tipična jačina uklanjanja šuma, kao što je 0.6.

Outpainting

Proširite granice slike uz Pad Image for Outpainting: kontrolišite lijevo/gore/desno/dolje i perje za glatke prijelaze. U VAE Encode-u (za Inpainting) podesite grow_mask_by (bolje >10) kako bi se postigli prirodniji i dobro integrirani ispuni.

Skaliranje: piksel naspram latentnog

Povećanje rezolucije piksela

Povećanje rezolucije piksela

Dva načina: algoritmom (bikubnim, bilinearnim, najbližim tačnim) sa Upscale Image by ili modelom sa Load Upscale Model + Upscale Image (koristeći Model). Algoritmi su brzi, ali manje precizni; modeli traju duže i obično nude bolje detalje.i možete kombinovati izlete sa Paket od 50 efekata za After Effects.

Povećavanje latentnog

Takozvana Hi-Res Latent Fix skalira se direktno u latentnom prostoru, obogaćujući detalje tokom rekonstrukcije. Može se neznatno razlikovati od originala i sporije je, ali dodaje informacije. umjesto samog rastezanja piksela.

Brza usporedba

Povećanje skale piksela: brzo, bez dodavanja novih informacija, moguće zaglađivanje. Latentno povećanje skale: sporije, Dodaje detalje, ali može promijeniti osnovnu sliku.Odaberite prema kontekstu i potrebnoj vjernosti.

ControlNet: fina kontrola strukture

ControlNet pruža smjernice kao što su granice, poza, dubina ili segmentacija kako bi se osiguralo da model poštuje strukturu. To je izuzetno moćan alat za VFX jer dosljedno fiksira kompoziciju i kretanje.Isprobajte Lineart, Depth ili OpenPose i prilagodite jačinu kako biste uravnotežili vjernost/kreativnost.

ComfyUI Administrator: Prilagođeni čvorovi ažurirani

Instalirajte nedostajuće čvorove

Ako tijek rada zahtijeva čvorove koje nemate, koristite Upravitelj: dugme Upravitelj, "Instaliraj nedostajuće prilagođene čvorove", ponovo pokrenite ComfyUI i ponovo učitajte preglednik. Ovo osigurava da tačno replicirate zajednički tok..

Ažuriranje čvorova

U Upravitelju provjerite ima li ažuriranja i kliknite na "Instaliraj prilagođene čvorove". Ako se pored paketa pojavi "Ažuriranje", primijenite ga, ponovo pokrenite i osvježite. Održavanje čvorova ažurnim sprječava greške i poboljšava funkcionalnost.

Pretraživanje čvorova na platnu

Dvaput kliknite na prazno platno da biste otvorili tražilicu čvorova i dodajte ih po imenu. Ovo ubrzava sastavljanje složenih lanaca. bez pregledavanja menija.

Ugrađivanja (inverzija teksta)

ComfyUI

Da biste aktivirali ugrađivanje, upišite embedding:Name na pozitivnom ili negativnom upitu. Smjestite datoteku u ComfyUI/models/embeddings ComfyUI će ga primijeniti ako pronađe podudaranje. To je moćan način za uključivanje određenih stilova ili koncepata.

Ugrađivanje automatskog dovršavanja

Instalirajte paket ComfyUI-Custom-Scripts za automatsko dovršavanje. Nakon što je aktivno, kada počnete kucati "embedding:", prikazat će se dostupni ugradbeni elementi.ubrzavanje rada s velikim kolekcijama.

Težina ugradnje

Možete mu dati težinu baš kao i riječima: (embedding:Name:1.2) povećava utjecaj, a (embedding:Name:0.8) ga smanjuje. Podešavanje težina vam daje finu kontrolu nad vizuelnim efektom.

LoRA: prilagođava stil bez dodirivanja VAE

LoRA modificira MODEL i CLIP osnovne kontrolne tačke kako bi uveo stilove, znakove ili objekte, ostavljajući VAE netaknutim. Osnovni tok: odabir kontrolne tačke, dodavanje jedne ili više LoRA, pregled upita i pokretanje reda čekanja.

Nekoliko kaskadnih LoRA-a

Možete primijeniti više LoRA-a u istom toku; oni se kombinuju sekvencijalno. Eksperimentirajte s redoslijedom i težinama kako biste kreativno kombinirali stilove sve dok se ne postigne željena ravnoteža.

LoRA

Prečice i trikovi koji štede sate

Kopiranje/lijepljenje: Ctrl+C, Ctrl+V i Ctrl+Shift+V za lijepljenje uz zadržavanje unosa. Odaberite više čvorova pomoću tipke Ctrl, kreirajte okvire za odabir i pomičite ih pomoću tipke Shift za brzo kreiranje rasporeda.

Isključivanjem čvora pomoću Ctrl+M on se privremeno izostavlja; minimizirajte čvor pritiskom na tačku u njegovom gornjem lijevom uglu za čišćenje platna u velikim projektima.

Red za generiranje: Ctrl+Enter. ComfyUI ponovo izvršava čvorove samo ako se unosi promijene.; ispravlja početne vrijednosti kako bi se izbjeglo ponovno izračunavanje dugih lanaca i uštedjelo vrijeme.

PNG ugrađeni tok: Prevucite generiranu sliku u ComfyUI da biste preuzeli tok rada iz njenih metapodataka. To je odličan način za dijeljenje i verzioniranje cjevovoda bez gubitka dijelova. Ako bolje učite uz video, pogledajte 10 revolucionarnih video tutorijala.

ComfyUI za video: AnimateDiff korak po korak

AnimateDiff vam omogućava generiranje sekvenci iz teksta, slika ili videa. Za Windows sa NVIDIA-om, optimalno je 10 GB VRAM-a (minimalno 8 GB sa nižim rezolucijama ili Txt2Vid)U zahtjevnim projektima možete očekivati ​​oko 10 GB s 2 ControlNet-a.

Instalacija i zavisnosti

Instalirajte Git za kloniranje čvorova i 7-Zip za raspakiranje prenosivog ComfyUI-ja. FFmpeg je opcionalan (za pakovanje GIF/MP4 iz čvorova kombinera)Ako nije u PATH-u, streamovi nastavljaju generirati slobodne okvire.

Preuzmite prenosivi ComfyUI i pokrenite run_nvidia_gpu prvi put za inicijalizaciju. U mapi prilagođenih čvorova, klonirajte ComfyUI-AnimateDiff-Evolved, ComfyUI-Manager, ComfyUI-Advanced-ControlNet i ComfyUI-VideoHelperSuite.

Iz Managera instalirajte "ControlNet Auxiliary Preprocessors" i "FizzNodes". Ponovo pokrenite ComfyUI da biste sve ispravno učitali i izbjegnite greške pri uvozu.

Potrebni modeli

Kompatibilne SD 1.5 kontrolne tačke stavite u odgovarajuću fasciklu i po potrebi u generaliziranu VAE. Preuzmite module za kretanje (npr. originalne iz AnimateDiff, TemporalDiff ili AD Stabilized Motion) i kopirajte ih u svoju putanju. Za ControlNet, dodajte Lineart, Depth i OpenPose (pth/yaml).

Ključni tokovi rada: Vid2Vid i Txt2Vid

Vid2Vid: učitava direktorij okvira s ulaznim čvorom slike/videozapisa, kontrolira image_load_cap, skip_first_images i select_every_nth za trajanje i uzorkovanje. Jedinstvene opcije konteksta su ključne: dužina konteksta ~16, preklapanje radi kontinuiteta i zatvorena petlja samo za Txt2Vid.

Txt2Vid: koristi primarni čvor okvira (bez programa za učitavanje slika) i generira direktno iz prompta. Sa Denoise=1 u KSampleru imat ćete potpuno generativni efekat., idealno za maštovite klipove.

Zakazivanje grupnih upita

FizzNodesov BatchPromptSchedule vam omogućava da mijenjate promptove po okviru. Koristi pre_text i app_text za uobičajene zaglavlja i zatvaranja, te definira parove "okvir: prompt". Budite oprezni sa zarezom u posljednjem elementu, to će uzrokovati grešku; duplicira instrukciju ako je želite zadržati između intervala.

Postavke uzorkovanja i kombiniranja

ComfyUI za VFX: Uvod, instalacija i tok rada

KSampler za video zahtijeva više koraka (minimalno 25, a bolje je povećavati ih). Isprobajte Euler_a sampler i prilagodite CFG po svojoj želji.U Vid2Vid, smanjite šum da biste se približili izvornom isječku. Čvor Combine izvozi GIF/MP4: definirajte brzinu kadrova (frame_rate), broj petlji (loop_count), format i želite li ping-pong.

Praktični savjeti: smanjite jačinu ControlNet-a za statične slike, isprobajte OpenPose, koristite drugi KSampler za "hires" korekciju. Isprobajte Motion LoRA kako biste obogatili određene pokrete i štedljivo kombinuje ControlNets.

Drugi video engine-i u ComfyUI-ju

HunyuanVideo (img2vid sa titlovima)

Pripremite sliku veličine 512x512 i generirajte titl pomoću Florence2Run. Zamijenite pojmove poput „slika/fotografija/ilustracija“ sa „video“ koristeći StringReplace Za usklađivanje s obukom modela. Konvertirajte u latentni prostor koristeći HunyuanVideo Sampler + wrappers, primijenite Lora Select i izvezite pomoću combinera.

LTX video (LTX čvorni cjevovod)

Instalirajte ComfyUI-LTXVideo čvorove i modele (uključuje PixArt-XL enkoder). Napišite prompt u CLIP-u, kreirajte video latent pomoću EmptyLTXVLatentVideo i prilagodite LTXVSchedulerBroj koraka povećava kvalitet, a parametri poput max_shift, base_shift, stretch i terminal oblikuju dinamiku isječka. Sačuvajte pomoću SaveAnimatedWEBP (lossless true, kvalitet 100) ili izvezite u druge formate.

Wan 2.1 (tekst u video, slika u video, video u video)

ComfyUI također integrira tokove za Wan 2.1. Njegova upotreba uključuje Txt2Vid, Img2Vid i Vid2Vid, s kontrolom parametara sličnom prethodnim cjevovodima i prednostima u vremenskoj konzistentnosti ovisno o slučaju upotrebe.

Pokretna grafika: segmentacija, dubina i miješanje

Za animacije pokretne grafike iz videa, počnite sa LoadVideoInput, kontrolišite Skip First Frames i Select Every Nth Frame, a zatim skalirajte sa ImageScaleToMegapixels do ~1MP. Ova predobrada prilagođava opterećenje VRAM-a i brzinu rada. u generaciji. Također možete provjeriti kako Kreirajte titlove u Premiereu integrirati grafiku i odjavnu špicu.

Segmentirajte subjekt koristeći GroundingDINO i SAM sa GroundingDinoSAMSegment iz teksta. Uvećajte masku pomoću GrowMaskWithBlur i pretvorite je u sliku pomoću MaskToImage. za robusniji obris.

Kreirajte vremenski signal pomoću TimeFeatureNode i modulirajte ga pomoću FeatureScalera (linearno, logaritamsko, eksponencijalno). Ovo će vam omogućiti da kontrolišete pomjeranja dubine (Z) ili položaje maski duž klipa. za više filmskih efekata.

Generirajte masku za ponovno bojenje zavisnu od dubine pomoću FlexMaskDepthChamber-a, kombinirajući masku subjekta, vremenski signal i mapu dubine isječka. Podesite Z naprijed/Z nazad da biste definisali aktivnu zonu u bilo kojem trenutku. i postići uvjerljiv 3D efekat.

U generativnoj fazi, učitajte kontrolne tačke, primijenite LoRA, konfigurišite promptove i dodajte ControlNet ako je potrebno. AnimateDiff će vam dati kadrove; zatim interpolirajte sa RIFE VFI da biste udvostručili glatkoću. i glatke prijelaze.

Ako želite miješati prolaze: generirajte nekoliko verzija s različitim indikacijama, odaberite segmente pomoću ImageIntervalSelectPercentage, kombinirajte prijelaze pomoću ImageBlend i spojite ih pomoću ImageBatchMulti. Završni prolaz kroz RIFE VFI ostavlja animaciju svilenkasto glatkom. i spreman za izvoz.

ComfyUI online i cloud alternative

Capcut logo

Ako ne želite ništa instalirati, postoje cloud servisi sa unaprijed konfiguriranim ComfyUI-jem, sa stotinama čvorova/modela i desetinama gotovih radnih procesa. Korisni su za brze testove ili za timove koji dijele predloške bez bavljenja lokalnim agencijama. Kao brza i jednostavna alternativa, postoje i resursi na animacije i vizualni efekti u CapCutu.

Druga opcija je korištenje generatora videa u oblaku poput Dreamine: jednostavno sučelje, nema lokalnog VRAM-a i rezultati se dobivaju za 20-60 sekundi. Nudi dodatne funkcije kao što su HD nadogradnja, interpolacija kadrova i generiranje zvučne podloge.Sa besplatnim dnevnim kreditima za početak, ovo je pojednostavljena alternativa kada je brzina važnija od detaljne kontrole.

Performanse, zahtjevi i vremena

Lokalno, ComfyUI za pretvaranje slike u video obično zahtijeva između 8 i 24 GB VRAM-a, ovisno o modelu (AnimateDiff, HunyuanVideo, LTX Video) i rezoluciji. Čak i na moćnim grafičkim procesorima, generiranje može trajati 10-30 minuta Ako je isječak dug ili ako koristite više ControlNet-ova i visokopropusnih filtera, opterećenje se prebacuje na provajdera u oblaku.

ComfyUI-jev softver je besplatan, ali cijena se svodi na hardver i struju ako radite duže vrijeme. Oblak izbjegava taj trošak, u zamjenu za ovisnost o usluzi i naknadi ili kreditima.Procijenite šta najviše koristi vašem radnom procesu.

Uobičajeni problemi

Ako vidite null greške ili čvorove koji "ne postoje", vjerovatno vam nedostaju modeli u vašim folderima ili deinstalirane zavisnosti. Provjerite da li svaki čvor ima svoj pridruženi model i koristite Manager za instalaciju svih nedostajućih paketa.Izbjegavajte konfliktne repozitorije ako već koristite ComfyUI za druge zadatke.

Najbolje prakse za konzistentan VFX

Zaključajte sjeme radi ponovljivosti dok podešavate dijelove lanca. Sačuvajte slike s metapodacima radnog procesa i dodajte napomene o verzijama čvorova i modelaU videu pažljivo definirajte dužinu konteksta i preklapanja te održavajte jasan redoslijed ControlNet-ova i LoRA-a.

Taktički prebacujte između uvećanih piksela i latentnih detalja ovisno o vrsti snimka i nivou detalja. U Vid2Vid-u, smanjite šum kako biste ispoštovali osnovno kretanje.U Txt2Vid-u, koristite korake i sampler da biste postigli vizualnu stabilnost.

Integrirajte ControlNet preprocesore (canny, depth, openpose…) iz Managera kako biste proširili svoj alatni set. I zapamtite: manja snaga ControlNet-a često daje bolje rezultate u videu.izbjegavajući filtrirani izgled i održavajući prirodni izgled.

Obavezno istražite HunyuanVideo i LTX Video ako vaš slučaj zahtijeva vodiče za titlove, drugačiju kontrolu vremenske dinamike ili alternativne kanale. Wan 2.1 također dodaje solidne opcije za Txt2Vid, Img2Vid i Vid2Vid. sa konzistentnim parametrima i konkurentnim rezultatima.

Oni koji traže brzinu i nulto trenje mogu se osloniti na online usluge, dok će oni koji zahtijevaju hiruršku kontrolu i potpunu ponovljivost zablistati s lokalnim ComfyUI-jem. Sa dijelovima koje ste vidjeli - čvorovima, parametrima, prečicama i tokovima - sada imate mapu puta za kreiranje vrhunskog VFX-a. i u statičnim slikama i u video sekvencama, na fleksibilan i skalabilan način.

boja i svetlosni efekat
Vezani članak:
Proučite specijalne efekte: Zašto se posvetiti svijetu VFX-a