Az AI képcsinálók (Midjourney/stable diffusion) hogy is működnek pontosan? több lenn
Mármint csak véletlenszerűen generálja a képeket, tehát ha például beírod hogy "lézerkard egy macska kezében", akkor keres az interneten macskás és lézerkardos képeket, aztán összekombinálja?
VAGY tényleg maga az AI készíti el a képeket, tehát mintha egy ember lenne?
Igen, valóban maga állítja elő a képet. Gyakorlatilag megtanították neki, hogy egy képből hogyan készíthető random zaj, és ezt a folyamatot játssza le visszafelé, tehát véletlenszerűen generált zajból állít értelmezhető képet. Itt egy kép a folyamatról: [link]
Van egy szövegértelmező komponense, ami elemzi és értelmezi a felhasználói promptot, ez több millió képből álló adatbázison lett tanítva, olyanon, mint pl. a laion2B és LAION-Aesthetics v2 ( [link] ).
"tehát ha például beírod hogy "lézerkard egy macska kezében", akkor keres az interneten macskás és lézerkardos képeket, aztán összekombinálja"
Generáláskor nem keres semmit.
Nagyon-nagyon leegyszerűsítve: van egy tanítási fázis, amikor egy-egy adott kifejezéshez - "macska", "lézerkard" - létrehoznak egy "paramétermátrixot" (ez kb. egyfajta, igen zajos kis felbontású "kép"), amit igen sok, a kifejezéshez tartozó képből alakítanak ki (ezeket a képeket persze az Internetről szedik össze). Ebből lesz egy modelled (Stable Diffusion esetén ez pár GB méretű).
Amikor képet generálsz, akkor ebből a modellből az adott kifejezéshez a program megkeresi az adott "paramétermátrixot", és ezeket kombinálva, feljavítva alakítja ki a képet.
kipróbáltam a Stable Diffusion-t, és háát... Nem vagyok elragadtatva tőle... Össze-vissza képeket csinál, összemosódott arcok, a tárgyak egymásba mentek, igazi szürreális volt. Viszont a neten láttam nagyon jó képeket, realisztikusakat, enyémek meg mesébe se valók...
Az lehetett a baj, hogy a stable diffusion online változatát használtam? ha letölteném pc-re, jobb képeket csinálna? Valamint midjourney-t nem tudom kipróbálni, mert fizetős...
"Az lehetett a baj, hogy a stable diffusion online változatát használtam? "
Az azért probléma, mert az online változatok adott modell(ekk)el dolgozik, nem lehet testre szabni, más modellekkel kiegészíteni, tanítani.
"ha letölteném pc-re, jobb képeket csinálna?"
Mivel több modellt használhatsz hozzá, jobban testre tudod szabni, ezért igen.
Egy könnyebben kezelhető, webböngészőből használható változat:
modellek (ingyenes regisztrációt igényel):
ezt is be kell installálni, azt a webböngészőset is.
És azzal a civitai oldallal mit csináljak? több modellt ad hozzá a stable diffusionhoz? regisztrálok és letöltés? Én csak képeket láttam rajta
"ezt is be kell installálni, azt a webböngészőset is."
Igen, a telepítés lépései szerepelnek az oldalon:
szükséged van hozzá a Python 3.10.6-ra (ez a programozási nyelv, amiben a Stable Diffusion-t írták):
és a Git-re (ez pedig egy verziókezelő rendszer, esetedben arra lesz használva, hogy ezzel töltheted le az egész cuccost):
"És azzal a civitai oldallal mit csináljak? több modellt ad hozzá a stable diffusionhoz?"
Igen, onnan tölthetsz le modelleket.
"regisztrálok és letöltés?"
Regisztrálsz, bejelentkezel, kiválasztod a neked tetsző modelleket és letöltöd a feltelepített Stable Diffusion megfelelő könyvtárába.
További kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!