A Netflix ajánlórendszereitől kezdve a mobilos arcfelismerésen át egészen az orvosi diagnosztikai szoftverekig a gépi tanulás már a mindennapjaink része. A cikk azt is bemutatja, hogyan különbözik a gépi tanulás a hagyományos programozástól, miként tanulnak a számítógépek az adatokból, melyek a fő tanulási típusok, és hogy miért ugyanolyan fontos a jó minőségű adat és az eredmények magyarázhatósága, mint maga a pontosság.
A mesterséges intelligencia egy tág fogalom, de a legtöbb modern rendszer, amit AI-ként emlegetünk, valójában gépi tanulást használ. Akár a Netflix ajánlásait nézzük, egy e-shop chatbotjával beszélünk, vagy a telefonunk arcfelismerést végez, mindez egy algoritmusnak köszönhető, amely óriási mennyiségű adaton tanult. Ahogy az MIT Sloan is magyarázza, a gépi tanulás ma már kritikus módszer, amelyre a legtöbb AI rendszer épül.
Az alapötlet viszonylag egyszerű. Ahelyett, hogy a programozók pontosan előírnák, mit csináljon a számítógép, megengedik, hogy a gép példákból tanulja meg önállóan. Ez a lényegi különbség a hagyományos programozáshoz képest, ahol minden lépést kézzel kell definiálni. A gépi tanulásnál ezzel szemben a cél egy olyan modell létrehozása, amely képes alkalmazkodni az új helyzetekhez, és döntéseket hozni a korábbi tapasztalatok alapján.
A gépi tanulás tehát inkább hasonlít egy dolgozó betanításához, mint egy gép használati utasításának írásához. Nem konkrét szabályokat írunk, hanem adatokat és visszajelzést adunk. A számítógép ezután próbál saját módszereket találni a helyes eredmények eléréséhez.
Minden gépi tanulási rendszer az adatoknál kezdődik. Ezek lehetnek szövegek, számok, képek, hangok, videók, de akár szenzoradatok vagy banki tranzakciók is. Ezeket először olyan formára kell hozni, amivel az algoritmus tud dolgozni. Gyakran szükséges a hibák eltávolítása, az egységes formátum biztosítása vagy az adatok feldarabolása. Ebben a fázisban döntjük el, mely adatokat használjuk a modell tanítására, és melyeket hagyunk meg későbbi ellenőrzésre.
Ezt követi a megfelelő modell kiválasztása. Ez tulajdonképpen egy matematikai eszköz, amely az adatokon tanul meg mintákat felismerni. Néha elég egyszerű statisztikai módszereket használni, máskor bonyolultabb, több rétegű neurális hálózatokra van szükség. Ilyenkor beszélünk mélytanulásról (deep learning). Ez a megközelítés áll a legtöbb modern AI rendszer mögött, az önvezető autóktól kezdve a generatív modellekig, mint a ChatGPT. A modell a tanulás során próbálja „kitalálni” a helyes válaszokat a korábbi példák alapján, és fokozatosan finomítja a belső rendszerét, hogy egyre pontosabb legyen.
A tanítás közben tehát a gép megtanulja, hogyan juthat a megfelelő kimenethez a bemeneti adatokból. Ha például állatokat ismer fel képeken, kezdetben nem tudja, mitől kutya a kutya. De minden újabb kép és a hozzá kapott helyes válasz alapján fokozatosan kialakítja a saját elképzelését arról, mi jellemzi a kutyát. Több ezer ismétlés után már képes felismerni egy kutyát olyan képen is, amit korábban nem látott.
A kapott modellt aztán olyan adatokon teszteljük, amiket még nem látott, hogy kiderüljön, mennyire jól általánosít. Ha megfelelő pontosságot ér el, használatba kerülhet – például ajánlórendszerként, diagnosztikai eszközként vagy gyártásban egy robotkar irányításához.
Attól függően, hogyan dolgozunk az adatokkal, három fő megközelítést különböztetünk meg a gépi tanulásban.
A gépi tanulás felhasználási területei szinte végtelenek. Az e-kereskedelemben ajánlásokat ad a vásárlási előzmények alapján. Az egészségügyben MRI képeket elemez, vagy betegségek kockázatát jósolja. A bankokban kiszűri a csalásokat és értékeli az ügyfelek hitelképességét. A gyártásban előre jelzi a gépek meghibásodását a szenzoradatok alapján, és az üzleti életben segíthet marketingstratégiák értékelésében is.
A mindennapi életben is találkozunk vele: mobilappokban, amelyek felismerik a hangot vagy fordítanak idegen nyelveket, önvezető autókban, vagy a közösségi médiában, ahol algoritmusok döntik el, milyen bejegyzéseket látunk. Természetesen a legismertebb chatbotok – mint a ChatGPT, a Gemini vagy a Copilot – is gépi tanulásra épülnek, milliárdnyi adat feldolgozásával.
Bár a gépi tanulás eredményei gyakran lenyűgözőek, a technológiának vannak korlátai. A modell csak abból tanul, amit adunk neki. Ha az adatok hiányosak, torzítottak vagy problémásak, a modell átveheti az emberi előítéleteket és újratermelheti azokat. Ismertek olyan esetek, amikor algoritmus diszkriminált bizonyos csoportokat hitelbírálatnál, vagy véletlen összefüggések alapján előnyben részesített bizonyos tartalmakat.
Probléma a modellek úgynevezett „értelmezhetetlensége” is. Bonyolultabb rendszereknél, például mély neurális hálóknál, nehéz megmondani, miért jutott a modell egy adott következtetésre. Ez különösen érzékeny területeken jelent gondot, például az orvostudományban vagy az igazságszolgáltatásban.
További gyenge pont a manipulációra való hajlam. Elég egy apró változtatás az adatokban, és a modell súlyos hibát követhet el. Például egy képfelismerő algoritmus egy kutyát struccnak jelölt, mert valaki módosította a kép metaadatait.
Végül fontos megjegyezni, hogy nem minden problémára jó megoldás a gépi tanulás. Sok cég hajlamos AI-t bevezetni oda is, ahol egy egyszerű szkript vagy emberi döntés elég lenne. A szakértők ezért azt javasolják, mindig a problémából induljunk ki, ne a technológiából. Először tudjuk meg, mit akarunk megoldani, és csak utána gondoljuk végig, hogy a gépi tanulás a megfelelő eszköz-e.
i
Ezek a cikkek is érdekelhetnek:
A gépi tanulás egy erőteljes eszköz, amely lehetővé teszi a számítógépek számára, hogy adatokból tanuljanak, mintákat keressenek és döntéseket hozzanak anélkül, hogy mindent kézzel programoznánk. Óriási potenciált rejt a hatékonyság, a szolgáltatások minősége és a felhasználói igényekhez való alkalmazkodás javításában. Ugyanakkor új kockázatokat is hordoz – az előítéletektől kezdve a hibás értelmezésekig. Ezért fontos érteni nemcsak azt, mire képes a gépi tanulás, hanem azt is, mire nem. És ha valaha AI ajánl valami fontosat, gondoljuk át, milyen adatokból dolgozik. Néha remekül működik. Máskor pedig olyan furcsaságot ajánlhat, mint egy csokoládétorta csirkével – ahogy egy híres receptgeneráló kísérlet mutatta.