Ugrás a fő tartalomra

Leonardo.ai használata


Leonardo.ai használata




Elérési link

https://leonardo.ai/?ref=promptengineering.org



Felület




A Leonardo.ai felhasználói felület

Webalapú és könnyen navigálható. A felhasználók rendelkezésére álló lehetőségek közé tartozik a létrehozni kívánt képek száma, a kép méretei, az útmutatási skála és a csempézés. A képernyő jobb oldalán a felhasználók beírhatják az utasításokat, kiválaszthatják a használni kívánt modellt és stílust, és szükség esetén negatív üzeneteket is megadhatnak.

A felület letisztult és rendezett kialakítású, ami egyszerűvé teszi a navigációt. A funkciók és szolgáltatások világosan jelennek meg, és nem akadályozzák a felhasználót. Ez a Midjourney fiókoldalának elrendezésére emlékeztet.

A Leonardo.ai számos előre betanított modellt kínál a felhasználóknak.

Ezek a modellek fotorealisztikus és művészi stílusokat, vintage fotózást, mágikus lényeket és papírművészetet tartalmaznak, beleértve a "Deliberate 1.1", "Vintage Photography", "Luna" és "Paper Art Style" modelleket.

Tesztelésem azt mutatja, hogy ezek NAGYON jó finomhangolt modellek, amelyek specifikus, de nagyon jó teljesítményt adnak.



Saját fotók használata

A Leonardo.ai egyik legkiemelkedőbb funkciója, hogy a felhasználók fotók feltöltésével saját egyéni adatkészleteket és modelleket hozhatnak létre.

És ezt viszonylag egyszerűen és gyorsan meg lehet tenni.

Ez lehetővé teszi a felhasználók számára, hogy a Leonardo.ai-t meghatározott stílusban képezzék, és elérjék a kívánt eredményeket. Ilyenkor is kell egy minimális prompt, mert nem engedi a Generate gombot megnyomni anélkül

Azért szükséges egy minimális prompt a Leonardo.AI-nál is, mert a gépi tanulás algoritmusainak szükségük van legalább néhány információra ahhoz, hogy képesek legyenek pontosabb és értelmesebb eredményeket generálni.

A minimális prompt lehetővé teszi a rendszer számára, hogy adatokat gyűjtsön a felhasználó preferenciáiról és stílusáról, hogy a generált kép azokkal a szempontokkal egyezzen meg.

A Generate gombot csak akkor lehet megnyomni, ha a rendszer úgy ítéli meg, hogy elegendő információ áll rendelkezésre a kép generálásához.



A guidance scale azt jelzi, hogy mennyire szeretnénk pontosan irányítani a kép generálását. 
  • Ha a guidance scale magas, akkor a rendszer kevésbé lesz kreatív és inkább a promptban megadott információkhoz tartja magát.
  • Ha alacsony a guidance scale, akkor a rendszer szabadabb kezet kap, és nagyobb kreativitással generálja a képet.


Az init strength pedig azt jelzi, hogy mennyire erős kezdeti hatás legyen a generált képen.
  • Ha az init strength magas, akkor az elsődleges motívum vagy szín jobban kiemelkedik a képen.
  • Ha alacsony az init strength, akkor az elsődleges motívum vagy szín kevésbé lesz feltűnő a képhez képest.








Egyedi modellek képzése Leonardo AI-ban


A Leonardo AI modellek betanítása döntő lépés a kívánt kimenetek létrehozásában. Számos tényezőt figyelembe kell venni a sikeres edzés érdekében.


- Képek száma

Az edzéshez használt képek száma befolyásolja a kimenetek minőségét. A jó tartomány 8-15 kép, de nyugodtan kísérletezzünk különböző tartományokkal.

Nem tanácsos azonban 5 kép alá menni, és 30 kép fölé menni nem feltétlenül javítja a minőséget.

A képek száma attól is függ, hogy mit edzünk, mivel egy objektum képzése kevesebb képet igényel, mint egy stílust.




- A képi adatkészlet jellemzői

Az adatkészlet jellemzői, különösen a változatosság és a konzisztencia közötti egyensúly szintén szerepet fognak játszani a képzési folyamatban.






- Következetesség

Fontos, hogy a képek között legyen közös téma vagy minta, amelyből a modell tanulhat.
A képek között konzisztens elemeket tanul meg a modell, és ezek megjelennek a kimenetekben.





- Variáció

Ha a generált képek között jó sok variáció van, akkor a modell ne "túlillessze" és elakadjon bizonyos dolgokban, amelyek esetleg nem kívánatosak a kimenetekben.

A képeken eltérő dolgok lazábban tanulhatók meg, és lehetővé teszik a modell számára, hogy a betanított tárgyat új stílusokba és kontextusokba helyezze.



A változatosság és a következetesség közötti egyensúlyra nincs tökéletes válasz, és érdemes kísérletezni vele. Például, ha egy modellt aranyos állatfigurákra oktat, akkor a karakter pozíciója, stílusa és képkompozíciója az egységes elemek, míg az állatfigurák és az általuk viselt ruhák a változatos elemek.






-- Egyedi funkció – AI Canvas

A Leonardo.ai egy mesterséges intelligencia vászonnal rendelkezik, amely egy hatékony, egyszerű és könnyen navigálható szerkesztő, amely lehetővé teszi mesterséges intelligencia művészeti képek új és innovatív módon történő létrehozását és szerkesztését.

Ha korábban megijed más Stable Diffusion modellektől, ez lehet a megoldás az Ön számára.

Feltölthet egy képet a számítógépéről, egy korábbi generációból vagy a közösségből.

Miután kiválasztott egy képet, kimásolhatja a promptot, és szerkesztheti a vásznon.

Az AI vászon egy blokkot biztosít, amely a prompt alapján új művészetet generál, és olyan módon bővítheti és módosíthatja a képeket, amelyekre korábban nem volt lehetőség.



- Leonardo.ai festészete

Elege van abból, hogy a vászon mérete korlátozza? Mondjon búcsút ezeknek a határoknak, és üdvözölje a végtelen kreatív lehetőségeket a Leonardo.ai vászonra festő funkciójával.

Ez a képlakotó játékot megváltoztató funkció lehetővé teszi, hogy kiterjesszed alkotásaid a kezdeti vásznon túlra, és egy nagyobb műalkotást hozz létre, amely valóban megragadja a látásmódját.

A Leonardo.ai segítségével bármilyen irányba bővíthet képeit. Egyszerűen válassza ki azt a területet, amelyen új alkotást szeretne létrehozni, és nyomja meg a generálás gombot. Innentől kezdve választhat a különböző generációk közül, és kiválaszthatja azt, amelyik a legjobban tetszik.

Akár szélesebb, akár magasabb, akár négyzet alakú képet szeretne, a választás szabad!

És a lehetőségek tárháza itt nem ér véget! Feltölthet előző generációs képet, vagy létrehozhat egy újat, és teljes portrét hozhat létre a kép kibontásával és szerkesztésével.

A rajzoló maszk funkcióval pedig még a kép bizonyos részeit is szerkesztheti – például megváltoztathatja valaki ajkának színét –, hogy valóban a sajátja legyen.



- Képek keverése

A Leonardo.ai lehetővé teszi két kép egyesítését is. A radír segítségével eltávolíthatja a képek nem kívánt részeit, és létrehozhat egy új képet, amely egyesíti a kettőt.

Ez igazán lenyűgöző és egyedi képeket eredményez, amelyeket folyamatosan bővíthet és módosíthat.





-- Prompt Generation Tool

A Leonardo.ai egyik egyedülálló tulajdonsága az azonnali generálás funkció. Az eszköz segítségével a felhasználók azonnali ötleteket generálhatnak egy adott szó alapján.

Például, ha beírja a „paradicsom” szót, az eszköz gombnyomásra négy, a paradicsommal kapcsolatos ötletet generál.

Ez a funkció nagy segítséget jelenthet azoknak a felhasználóknak, akik nehezen találnak ötleteket a műalkotásukhoz.

Ez egy egyszerű, de praktikus funkció azokban az időkben, amikor hiányzik az ihlet, vagy egyszerűen csak ötletekre van szüksége, hogy elinduljon.

Szintén hasznos a generálás gomb közvetlenül a javasolt prompt mellett, amely azonnal négy csodálatos képpé válik.



-- AI kép alak póz funkció

Az AI póz funkció, amely a Controlnet for Stable Diffusion megvalósításának tűnik, a Leonardo AI-ban lehetővé teszi a felhasználók számára, hogy egy adott póz alapján képeket hozzanak létre.

A funkció használatához a felhasználóknak meg kell ragadniuk egy fényképet a kívánt pózzal, és importálniuk kell a platformra.

A funkció használatához a Stable Diffusion 1.5-re kiképzett modellre van szükség, például a finomhangolt illusztrációs 2. verziójú modellre.

A kép létrehozásához a felhasználóknak meg kell adniuk egy promptot, és ki kell választaniuk a kép méreteit, az útmutatási skálát, a lépésszámot és a csempézési beállításokat.

A renderelt eredmény nem mindig tökéletes, de a minőség javítható a kép felskálázásával.


Ami a képzési modelleket illeti, a Leonardo AI embereknek szóló képzése nem biztos, hogy finoman hangolt, de a képek felskálázása jobb eredményekhez vezethet.

A platform utófeldolgozási funkciója túlsúlyos lehet, különösen közeli portrék esetén.



-- Használat Ingyenes

Mindez ingyenes (a cikk megjelenés időpontjában), de mi a trükk?
A Leonardo ingyenes verziójának egyik fő korlátozása a naponta kapott tokenek korlátozott száma.

Az ingyenes csomagban körülbelül 150 tokennel kell kezdeni, és minden kép létrehozása nagyjából egy tokenbe kerül.

Bár ez elsőre korlátozónak tűnhet, fontos észben tartani, hogy a platformon vannak más funkciók is, amelyek több tokenbe kerülnek.





-- Teljesítmény-összehasonlítás a Midjourney-vel

A Leonardo.ai dizájnja és az általa készített képek a MidJourneyhoz hasonlítanak.

Mindkét eszköz sikeres volt az esztétikailag tetszetős képek elkészítésében, amelyek pontosan ábrázolták az egyszerű utasításokat.

A MidJourney azonban erősebb stílusérzékkel és vizuálisan vonzóbbnak bizonyult.

Amikor összetettebb felszólításokkal szembesült, a Leonardo.ai nehézségekbe ütközött a konzisztens stílus megtartása során, ami gyakran nem összefüggő képeket eredményezett.

Ezenkívül furcsa hibát észleltek, amikor egy munkamenetben korábban generált kép megkettőződött egy későbbi promptban, annak ellenére, hogy más magja volt.


Fontos megjegyezni, hogy a MidJourney és a Leonardo.ai, amely stabil diffúzióval működik, két különálló rendszer, eltérő felszólítási stílusokkal


--- Magyarázatok:


Stable Diffusion XL (SDXL) egy fejlett AI-modellt jelent melyet a DreamStudio-val (http://dreamstudio.ai) együttműködve fejlesztenek, amely mesterséges intelligenciára és gépi tanulási alkalmazásokra specializálódott.

Az SDXL egy jelentős frissítés az eredeti Stable Diffusion modellhez képest, lenyűgöző 2,3 milliárd paraméterrel büszkélkedhet elődje 900 milliójához képest.

A paraméterek jelentős növekedése lehetővé teszi, hogy a modell pontosabb, érzékenyebb és sokoldalúbb legyen, ami új lehetőségeket nyit a kutatók és a fejlesztők számára egyaránt.



-- Az SDXL modell számos fejlesztést kínál elődjéhez képest. A legfigyelemreméltóbb fejlesztések közé tartozik:

- Továbbfejlesztett nyelvértés: A 2,3 milliárd paraméterrel az SDXL-t úgy tervezték, hogy mélyebben megértse az emberi nyelvet, lehetővé téve az összetett szövegek megértését, valamint pontosabb és koherensebb válaszok generálását.

- Továbbfejlesztett kontextuális tudatosság: Az SDXL-modell jobban képes felismerni és megérteni a kontextust egy adott beszélgetésben vagy adatkészletben, lehetővé téve, hogy relevánsabb és hasznosabb információkat nyújtson a felhasználóknak.

- Skálázhatóság: A megnövekedett paraméterek száma lehetővé teszi a modell számára, hogy nagyobb adatkészleteket dolgozzon fel és összetettebb feladatokat is kezeljen, így értékes eszközzé válik számos iparág és alkalmazás számára.

- Jobb teljesítmény: Az SDXL továbbfejlesztett architektúrája és megnövelt paraméterei jobb általános teljesítményt eredményeznek, lehetővé téve, hogy gyorsabb és megbízhatóbb eredményeket generáljon a felhasználók számára.

- Nyílt forráskódú kiadás: Az SDXL modell nyílt forráskódú projektként jelenik meg, amely lehetővé teszi a fejlesztők és kutatók számára, hogy hozzáférjenek a technológiához, módosítsák és építsenek rá az alkalmazások széles körében.





-- Az SDXL azt ígéri, hogy forradalmasítja az AI-t:

- Egyedi modellek betanítása és betöltése: Ha lehetővé tennénk a felhasználók számára, hogy betaníthassák és betölthessék saját egyedi modelleiket, az nagyobb rugalmasságot és személyre szabást tesz lehetővé, amely megfelel a konkrét felhasználási eseteknek és iparágaknak.

- Tisztább, áramvonalasabb felhasználói felület: A továbbfejlesztett felhasználói felület megkönnyíti a felhasználók számára a navigációt és az AI-modellben való interakciót, javítva az általános felhasználói élményt.

- Jobb festés és kifestés: A festési és kifestési technikák fejlesztése lehetővé tenné a modell számára, hogy még valósághűbb képeket és szöveget állítson elő, ami növeli a kreatív alkalmazásokban való hasznosságát.

- A ControlNethez hasonló modellek natív integrációja: Az olyan modellek integrációja, mint a ControlNet, tovább javítaná az SDXL képességeit, lehetővé téve a modell kimeneteinek hatékonyabb vezérlését, és nagyobb testreszabási lehetőségeket biztosítva a felhasználóknak.








Mesterséges intelligencia (AI) képparancsok útmutatója

A képleíró utasítások azt jelentik, hogy a művészek hogyan „beszélnek” a mesterséges intelligencia művészeti rendszereivel, és a jó felszólítások írása kulcsfontosságú készség az AI-képek létrehozásában.



A felszólítás lehet :
  • olyan egyszerű, mint „boldog kutya”
  • vagy valami összetett, például „nagyon aranyos bolyhos kutya, öröm és remény kifejezésével, a steampunk stílusában, ahogy Cezanne festette, fotorealisztikus és rendkívül részletgazdag”.






Az alábbiakban néhány példa kifejezést mutatunk be, amelyek kombinálhatók:


Objektumok|Beállítás/helyszín|Stílusok|Művészek|Összetétel és forma
Folyó|Erdő|Álomszerű|Leonardo da Vinci|portré
óceán|Esőerdő|Steampunk|Michelangelo|Ultraszéles lövés
Víz|Rét|Cyberpunk|Rembrandt|Fejbelövés
Fa|hegy|Pop art|Vermeer|Extrém Vértes
Virág|Terület|Impresszionizmus|Watteau|Távolság
Fű|Udvar|Minimalizmus|Delacroix|Fotorealisztikus
Ég|Folyó|Modern|Claude Monet|Filmes
Nap|Folyam|Reális|Georges Seurat|Nagyon részletes
Hold|óceán|Retro|Vincent van Gogh|Ábra
Csillagok|Tengerpart|Futurisztikus|Munch|Poszter
Bolygók|Strand|Pszichedelikus|Schiele|Borító
Tájkép|Sivatag|Vízfestmény|KIimt|Intenzitás
Autó|Város|Olaj|Picasso|Szimmetrikus
Kamion|Város utca|Gyurma|Matisse|Aszimmetrikus
Repülőgép|Játszótér|Papír vágott kézműves|Magritte|Hangsúly
Űrhajó|Park|Expresszionizmus|Salvador Dali|Túlzás
Ház|Tundra|Reneszánsz|Georgia O’Keeffe|Arány
kastély|Füves síkság|Klasszicizmus|Hopper|Harmadik szabálya
Faház|Napkelte|Rokokó|Warhol|Dekoratív
Felhőkarcoló|Napnyugta|Utcai művészet|Peter Max|Meleg színek
Óra|Déli|Szürrealizmus|Maxfield Parrish|Cool Colors
Néz|Csillagos égbolt|Diagrammatikus rajz|Cezanne|Semleges színek
Kutya|Kozmikus|Barokk|Goya|Negatív tér
Macska|Mennyei|Szecesszió||Dominancia
Térkép||Art Deco||Lineáris perspektíva
||||Biomorf formák







prompt: (RPG 4.0)
a ford mustang, colour car is blue, very beautiful, car on the city, sparks in the ground, against the backdrop of a storm, the car is covered in mud and creaks, water on the ground, 3d rendering, cyberpunk,realistic, car with an American sports cars, street racing, perfect image, vibrations, game asset , symmetrical, tuner, modified car, wide body, tram, street racing, 4k, modding culture, photorealistic, high detail, game ready, other car racing, city life


negatív prompt:
nsfw, blurry eyes, two heads, two faces, plastic, Deformed, blurry, bad anatomy, bad eyes, crossed eyes, poorly drawn face, mutation, mutated, extra limb, ugly, poorly drawn hands, missing limb, blurry, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, mutated hands and fingers, out of frame, blender, doll, cropped, low-res, close-up, poorly-drawn face, out of frame double, blurred, ugly, disfigured, too many fingers, deformed, repetitive, grainy, extra limbs, bad anatomy, airbrush, zoomed, deformed, extra limbs, extra fingers, mutated hands, bad anatomy, bad proportions, blind, bad eyes, ugly eyes, dead eyes, vignette, out of shot, out of focus, gaussian, closeup, monochrome, grainy, noisy, text, writing, watermark, logo, over saturation,over shadow


















Prompt:(Leonardo Creative)
Masterpiece, ultraHD, digital photo, photorealistic view, full-body Aquaman such as Hulk deep underwater, cinematic dynamic light, air bubbles in the water, light is refracted in the water, small wrinkles on the forehead, the image is sharp everywhere, water everywhere, colourful fish swim, aquatic plant background {{{{Full body}}}}.








Prompt: (Leonardo Creative)
Masterpiece, ultraHD, digital photo, photorealistic view, beautiful woman deep underwater, cinematic dynamic light, long red hair, air bubbles in the water next to the woman's head and body, light is refracted in the water, small wrinkles on the forehead, the image is sharp everywhere, water everywhere, colourful fish swim, aquatic plant background

Negatív Prompt:
broken neck, abnormal body, plastic skin, porcelain skin, looking at the camera, big air bubbles, nsfw, blurry eyes, two heads, two faces, plastic, Deformed, blurry, bad anatomy, bad eyes, crossed eyes, poorly drawn face, mutation, mutated, extra limb, ugly, poorly drawn hands, missing limb, blurry, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, mutated hands and fingers, out of frame, blender, doll, cropped, low-res, close-up, poorly-drawn face, out of frame double, blurred, ugly, disfigured, too many fingers, deformed, repetitive, grainy, extra limbs, bad anatomy, airbrush, zoomed, deformed, extra limbs, extra fingers, mutated hands, bad anatomy, bad proportions, blind, bad eyes, ugly eyes, dead eyes, vignette, out of shot, out of focus, gaussian, closeup, monochrome, grainy, noisy, text, writing, watermark, logo, over saturation,over shadow







Forrás:
Facebook : ChatGPT magyarul (Günther Henrik + Márton Gergely )


Link:

https://www.aiartdigest.com/leonardo-ai-vs-midjourney-using-10-example-ai-images-with-prompts/?utm_content=cmp-true













Megjegyzések