Try our cookies Alza.cz a. s., Company identification number 27082440, uses cookies to ensure the functionality of the website and with your consent also to personalisage the content of our website. By clicking on the “I understand“ button, you agree to the use of cookies and the transfer of data regarding the behavior on the website for displaying targeted advertising on social networks and advertising networks on other websites.
Alzak icon

Stable Diffusion, Midjourney: Hogyan működik a mesterséges kreativitás?

Article

Publikálva • Szerző: Michal Rybka

A mesterséges intelligencia új és meglepő formája a mesterséges kreativitás. Az utóbbi időben számos olyan program jelent meg, amelyek képesek szöveges bemenetek alapján képeket generálni. Maga a kreatív AI 2015-ben vált híressé, amikor a Google bemutatta a Deep Dream Generatort. Ez képes volt a bemeneti képet színes hallucinációvá feldobni – érdekes volt, de kissé egyoldalú.

Ai fotózás a művészeti alkotásban. Midjourney segítségével készült. Készítette: Václav Závada.

Hogyan működik a mesterséges kreativitás? – TARTALOM

  1. Mi az a látens diffúzió?
  2. Hogyan működik a képgenerálás AI-val?
  3. Új szakma van születőben: az AI művész

Mi az a látens diffúzió?

Az új kreatív programok a látens diffúzió modern koncepcióján alapulnak, amely egy olyan folyamat, amelyben a neurális hálózat egyre zajosabb bemeneteken tanul meg képeket felismerni, így szó szerint megtanulja látni az alakzatokat a káoszban. Maga az alkotás fordítva történik, vagyis tiszta zajból generálódik egy bemenet, amelyben az egyes iterációkban a hálózat felismeri az alakzatokat, és a véletlenszerű bemenetet azokkal az elemekkel helyettesíti, amelyeket lát benne. Ami ebben a folyamatban lenyűgöző, az a lehetőség, hogy pontosan így születnek az álmok – az alvó agy véletlenszerű aktivitását képekként és látomásokként értelmezi.

A látens diffúzió koncepcióként néhány évvel ezelőtt jött létre, de ma már vannak kereskedelmi platformok, mint a Midjourney, de van egy nyílt forráskódú eszköz is, a Stable Diffusion. Ezek két részre oszlanak – maga a neurális hálózat tanítása szuperszámítógépeken történik, ahol milliárdnyi bemenetet mutatnak neki, az eredményül kapott modell pedig otthoni számítógépeken is futtatható modern videókártyával és minimum 8 GB RAM kapacitással. Hasonló modelleket egyelőre otthoni számítógépeken tanítani nem lehet, számítási szempontból túl igényes.

Midjourney segítségével készült

Hogyan nézne ki a Midjourney, ha ember lenne? Közvetlenül a Midjourney-t kérdeztük meg – így ábrázolta önmagát.
Eszköz: Midjourney. Készítette: Václav Závada

Midjourney segítségével készült

És hogyan nézne ki a Midjourney szerint a Stable Diffusion, ha ember lenne?
Eszköz: Midjourney. Készítette: Václav Závada

i

Mennyire igényes egy új AI modell betanítása a Stable Diffusion számára?

Ahogy azt fentebb is említettük, otthoni számítógépeken mesterséges intelligenciát betanítani nem lehet. Elméletben ez nem igaz, természetesen lehet – csak az idő, amire szükséged lenne hozzá, több száz évben mérhető. És ez nem túlzás.

Hogy konkrétabbak legyünk. Egy NVIDIA DGX A100 szuperszámítógépen, amelynek 128 CPU magja, 55.296 magja van, és körülbelül 200.000 USD dollárért adják el, 79 ezer számítási órára van szükség a Stable Diffusion modell betanításához.

Egy NVIDIA DGX A100 szuperszámítógépnek tehát 9 évre lenne szüksége a modell betanításához. Szóval az elméletet félretéve, a valóságban otthoni számítógépeken egyelőre nem lehet modellt tanítani.

Hogyan működik a képgenerálás AI-val?

A képek generálása úgy történik, hogy a rendszer fogja a szöveges bemeneteket, amelyek megmondják neki, mit kellene látnia a zajban – és egy véletlenszerűen generált zajt is, amelyből elkezdi feldolgozni a képi eredményt. Mivel véletlenszerű mintából indul, az eredmény mindig egyedi kép, még ha hasonlíthatnak is egymásra a tartalmak és stílusok. A generálás iteratív, vagyis több kép keletkezik, amelyek közül a felhasználó kiválasztja azokat, amelyek tetszenek neki, és azokat dolgoztatja ki tovább. Tehát nem egy teljesen automatikus folyamatról van szó, amelyben az AI létrehozná a lehető legjobb képet, hanem inkább egy kreatív eszközről, amely javaslatokat tesz az egyes lehetőségekre, és az emberrel együtt formálja azokat.

Midjourney segítségével készült

Hogyan nézne ki a DALLE.E 2, ha ember lenne? Ismét Midjourney segítségével készült.
Eszköz: Midjourney. Készítette: Václav Závada

Az ember az egyedi bemenetek szerzője, és ő választ a lehetséges kimenetek közül is, így a kreatív AI terméke emberi szerzői mű. Az AI mint olyan nem rendelkezik jogi személyiséggel, és nem lehet szerző, a törvény ma a kreatív AI produkcióját szoftvereszköz kimenetének tekinti – hasonlóan például az Adobe Photoshophoz. Bár folynak viták arról, hogy a szerző nem lehet-e maga a hálózat – nem, nem lehet, a törvény nem ismeri el az AI jogi személyiségét, és nagyon problémás lenne valami ilyesmit bevezetni. A jogi személyiség azt jelenti, hogy az AI-ra úgy tekintenének, mint emberre mind a jogok, mind a kötelezettségek szempontjából – és tekintettel arra, hogy a törvényeket emberek tervezték emberek számára, az AI jelenlegi jogrendszerbe való bevonása több kárt okozna, mint hasznot.

Midjourney segítségével készült

Midjourney – egy nő a város utcáin.
Eszköz: Midjourney. Készítette: Václav Závada

Midjourney segítségével készült

Midjourney – egy nő a város utcáin.
Eszköz: Midjourney. Készítette: Václav Závada

i

Szerzői jog vs AI művészet

A mesterséges intelligencia tehát nem lehet szerző a szerzői jogi törvény értelmében. Ha azonban a kimenet létrehozásához konkrét szerzőt használsz, vagy olyan referencia képet használsz, amelyet aztán mesterséges intelligencia segítségével módosítasz, akkor egy úgynevezett származékos szerzői műről van szó. Így elméletileg két helyzet állhat elő:

1. Ha olyan specifikus megadási módot (promptokat) használsz, amely meghatározó hatással van az eredményül kapott kép megjelenésére, esetleg saját referencia fotódat/képedet használod, akkor az AI kimenetét úgynevezett származékos szerzői műnek lehet tekinteni. Más szóval, egy ilyen kép a szerzői jogi törvény értelmében műként védelemben részesül.

2. Ha a képedet valaki más képére alapozod, esetleg átveszed az ő megadási módját, akkor az illető személy (elméletben) igényt tarthat a jogaira azzal az érvvel, hogy származékos szerzői műről van szó.

Kérdés, hogy a bíróságok milyen álláspontot foglalnának el ebben a kérdésben. Ezért a fenti szöveget ne vedd megkérdőjelezhetetlen igazságnak, hanem inkább véleménynek. Egyelőre ugyanis nem létezik semmilyen bírósági precedens, legalábbis errefelé. És ha létezik valamilyen objektív igazság, akkor az az, hogy a törvényt csak a bíróság értelmezheti, semmiképp sem az Alza.hu szerkesztője.

Midjourney segítségével készült

Midjourney – egy nő a város utcáin.
Eszköz: Midjourney. Készítette: Václav Závada

Midjourney segítségével készült

Midjourney – egy nő a város utcáin.
Eszköz: Midjourney. Készítette: Václav Závada

Új szakma van születőben: az AI művész

A kreatív AI ma valóban inkább egy eszköz, amely azonban nagyon gyorsan és hatékonyan képes vizuális tartalmat generálni. Új pozíció születik, az AI művész, aki az AI eszközökkel együttműködve képes tartalmat generálni az elképzelései szerint – ez egy hasonló szerep, mint például a keresési specialista, csak művészi átfogással.

i

Midjourney vs Stable Diffusion

A Midjourney és a Stable Diffusion kimenetének felületes összehasonlítása, amelyet itt a cikkben képek formájában találsz, félrevezető lehet. A Stable Diffusion kezelésében nincs akkora tapasztalatunk, és így nem tudjuk teljes mértékben kihasználni a benne rejlő potenciált, ami kétségtelenül óriási. A Midjourney-vel szemben ugyanis a saját számítógépeden fut, így bármilyen modellt letölthetsz, amely a választott műfajodra specializálódik. Ma már számos megbízható modellt találhatsz az interneten – néhány az animére, mások a katonai technikára specializálódnak.

Jelenleg azonban meg kell jegyeznünk, hogy a Stable Diffusion kimenete lényegesen kevésbé konzisztens. Számos általunk generált kép gyenge minőségű volt, míg a Midjourney-nél nem kellett különösebben erőlködnünk. A Stable Diffusion óriási potenciállal rendelkezik. Ugyanakkor mivel minden a saját hardvereden fut, nem kell foglalkoznod tilalmakkal és korlátozásokkal (ami egyben kissé ijesztő is), és ami a legfontosabb – ingyenes.

De ahhoz, hogy versenyképes kimenetet kapj belőle, nem elég a puszta szerencse, különböző modelleket kell letöltened, próbálkoznod, kísérletezned kell a különböző beállítások kombinációival és a kérésed megfogalmazásával. Érdekességképpen mellékelünk néhány képet is, amelyek nem kerültek be a cikkbe. Itt találod őket: Stable Difusion, Midjourney.

Midjourney segítségével készült

Stable Diffusion: egy lány a város utcáin.
Eszköz: Stable Diffusion. Készítette: Václav Závada

Midjourney segítségével készült

Stable Diffusion: egy lány a város utcáin.
Eszköz: Stable Diffusion. Készítette: Václav Závada

A kreatív intelligencia várhatóan gyorsan érvényesülni fog a kreatív írás és a filmkészítés területén is, így viszonylag gyorsan megjelennek az AI által készített filmek, és jó eséllyel az AI által írt és rendezett filmek is. Ez a kreatív szakmák végét jelenti – vagy demokratizálódásukat? Ezt még nem tudjuk – és azt sem tudjuk, hogy pontosan hol vannak a jelenlegi kreatív AI képességeinek határai. Jelenleg a mesterséges intelligencia napról napra fejlődik, és úgy tűnik, egyelőre még nem érte el a határait. Így megállapítható, hogy a látens diffúzión alapuló eszközök sokkoló előrelépést hoztak. Egyelőre azonban igaznak tekinthetjük azt az állítást, hogy minden hasonló technológiának megvannak a maga korlátai, de idővel jobb és hatékonyabb intelligencia váltja fel.

Midjourney segítségével készült

Stable Diffusion: egy lány a város utcáin.
Eszköz: Stable Diffusion. Készítette: Václav Závada

Midjourney segítségével készült

Stable Diffusion: egy lány a város utcáin.
Eszköz: Stable Diffusion. Készítette: Václav Závada

A közeli jövőben várhatóan normalizálódni fog a kreatív AI bevetése a mindennapi életben, ezzel együtt jó eséllyel egy szórakoztatóbb és játékosabb világ köszönhet ránk is, mert az a teljesítmény, amellyel a kreatív AI képes újabb és újabb tartalmat generálni, egyszerűen lenyűgöző. Ez a technológia már itt van – és nekünk hozzá kell szoknunk – és meg kell békélnünk azzal is, hogy a következő terület, ahol érvényesülni fog, teljesen más lehet, mint amit várunk.

4.8 1,016×
Apple HomePod mini white - EU
Voice Assistant - Apple Home, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 2 ambient sound microphones, Camera, EU distribution, language used: English and German. Siri - in English, compatible Apple Home apps, iOS support, connection via WiFi 2.4 GHz and Bluetooth, open system, functioning independently, home control, camera, 2 microphones to pick up ambient sound, Supports Apple Music, woofer
Discounted -5 % 51,000 Ft 53,890 Ft
Currently Unavailable
Order Code: JA041a1
4.7 140×
Apple HomePod (2nd generation) White
Voice Assistant - Apple Home and Manufacturer app, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 4 ambient sound microphones, language used: English.
+Gift Travel Adapter AlzaPower with a value of 2,490 Ft
151,490 Ft
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: apple23_01
Samsung Galaxy S25 12GB/256GB Navy - Mobile Phone
Free delivery
Alzaboxes and stores
4.8 289×
Samsung Galaxy S25 12GB/256GB Navy
Mobile Phone 6,2" AMOLED 2340x1080, 120Hz, processor Qualcomm Snapdragon 8 Elite for Galaxy 8-core, RAM 12 GB, internal memory 256 GB, main camera with optical zoom 50 Mpx (f/1,8) + 10 Mpx (f/2,4) + 12 Mpx (f/2,2), selfie camera 12 Mpx, optical (ois) stabilization, GPS, NFC, LTE, 5G, USB-C, fingerprint reader in screen, dual SIM, water resistant IP68, unlocked, quick charging 25W, wireless charging, battery 4000 mAh, Android 15
349,990 Ft
Buy
In stock 1 pcs
Order Code: SAMO0269c4HU
Samsung Galaxy Tab S11 12GB/128GB Silver + touch pen - Tablet
Free delivery
Alzaboxes and stores
Samsung Galaxy Tab S11 12GB/128GB Silver + touch pen
Tablet - display: 11" QHD 2560 × 1600 OLED, MediaTek Dimensity 9400+ 3,4 GHz, RAM: 12GB, internal memory: 128GB + memory card up to 2048GB, webcamera 13Mpx+ 12Mpx, weight: 469, USB-C, Android 16
339,900 Ft
Buy
In stock 1 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: SATA1052b2HU
5.0 19×
Google Pixel 10a 256GB Fog - Készülékbeszámítási bónusz 40 000 HUF
Mobile Phone 6,3" P-OLED 2424 × 1080, 120Hz, processor Google Tensor G4, RAM 8 GB, internal memory 256 GB, main camera 48 Mpx (f/1,7) + 13 Mpx (f/2,2), selfie camera 13 Mpx, optical (ois) and electronic (eis) stabilization, GPS, NFC, LTE, 5G, USB-C, dual SIM, water resistant IP68, unlocked, quick charging 30W, wireless charging, battery 5100 mAh, Android 16
+Gift Phone Cover Google Pixel 10a Case Fog with a value of 16,260 Ft
With cashback bonus In return for an older model, the customer will get a discount on the newer model. Vyměňte starý telefon za nový a získejte při nákupu Google Pixel 10a zpět 2 500 Kč. Pro uplatnění bonusu je možné odevzdat jakýkoli starší telefon. Platí do 30.04.2026. 244,990 Ft
New arrival 284,990 Ft
Buy
In stock > 5 pcs
Order Code: GPX1084c2
HONOR Magic8 Pro 12GB/512GB Sunrise Gold - Mobile Phone
Free delivery
Alzaboxes and stores
5.0
HONOR Magic8 Pro 12GB/512GB Sunrise Gold
Mobile Phone 6,71" AMOLED 2808 × 1256, 120Hz, processor Qualcomm Snapdragon 8 Gen 5 8-core, RAM 12 GB, internal memory 512 GB, main camera 50 Mpx (f/1,6) + 200 Mpx (f/2,6) + 50 Mpx (f/2), selfie camera 50 Mpx, optical (ois) stabilization, GPS, NFC, LTE, 5G, USB-C, dual SIM, unlocked, quick charging 100W, wireless charging 80W, battery 6270 mAh, Android 16
469,900 Ft
Buy
In stock 3 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: UM348b2HU
4.6 15×
Amazon Echo Show 8 (3rd gen) Charcoal
Voice Assistant - OS supported: Android and iOS controls your smart home and plays music, Headphone output, Display, Camera and Microphone mute button,.
63,890 Ft
Buy
On the way 3 pcs
Expected 17/04/2026
Order Code: ANE1046
4.3 16×
Amazon Echo Spot Ocean Blue
Voice Assistant - Tuya, Samsung SmartThings, Xiaomi Home, GOVEE Home, EZVIZ and Manufacturer app, OS supported: Android and iOS controls your smart home and plays music, Display, hours and Microphone mute button, language used: English.
33,790 Ft
Buy
In stock 1 pcs
Order Code: AME1049
4.7 140×
Apple HomePod (2nd generation) Midnight
Voice Assistant - Apple Home and Manufacturer app, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 4 ambient sound microphones, language used: English.
+Gift Travel Adapter AlzaPower with a value of 2,490 Ft
151,490 Ft
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: apple23_02
Print
P-DC1-WEB05
30 év tapasztalat az e-kereskedelemben
3 million megrendelés évente
a vásárlók 98% visszatérõ
Több infó