A generatív AI, és vele a nagy nyelvi modellek, vagyis az LLM-ek látványosan megmutatták, hogy a számítógép ma már nemcsak adatokat keres vagy utasításokat követ, hanem szöveget, képet, hangot, videót, kódot, vagy akár egy komplett üzleti tervet is képes előállítani. Csakhogy a történet itt nem ér véget – sőt, könnyen lehet, hogy valójában itt kezdődik.
Aki kérdez: a felhasználó, aki válaszol: az LLM
A nagy nyelvi modellek – mint például a ChatGPT vagy a Claude – használata során a felhasználó többnyire kérdez, a modell pedig válaszol. Megír, összefoglal, átfogalmaz, elemez, ötletel. Ha jól kapja meg a kontextust, sokat segít; ha rosszul, akkor magabiztosan tud mellélőni. A generatív AI ezért sok cégnél ma még inkább egyfajta „digitális dopping”: gyorsabbá teszi a gondolkodást, lerövidíti az első körös munkát, segít a döntések előkészítésében és a háttéranyagok feldolgozásában.
A következő lépcsőfok az úgynevezett agentic AI – és itt érdemes a kifejezéssel kapcsolatban egy kis nyelvi kitérőt is tenni. Ezt a technológiát magyarul jellemzően „ügynöki AI-nak” vagy „AI-ügynöknek” szokták nevezni, noha ez az elnevezés egyrészt kevésbé adja vissza az eredeti kifejezés tartalmát, másrészt félrevezető lehet, mivel a magyar nyelvben az „”ügynök” szó jelentéstartalma meglehetősen sajátos. Az angol “agency” kifejezés ugyanis, bár valóban jelent ügynökséget is, jelen esetben sokkal inkább a cselekvőképességet jelöli. Azaz az agentic AI-t magyarul a legjobban cselekvőképes mesterséges intelligenciaként írhatjuk körül, ami sokkal pontosabban világít rá a technológia lényegére.
Az agentic AI ugyanis egy LLM-hez képest nem egyszerűen okosabb chatbot. Sokkal inkább egy olyan digitális munkatárs prototípusa, amelynek már nemcsak utasításokat adhatunk, hanem célokat is.
Egy cselekvőképes AI ugyanis képes egy feladatot részekre bontani, megtervezni azok végrehajtását, majd ehhez megfelelő eszközöket használni, vállalati rendszerekhez kapcsolódni, eredményeket ellenőrizni, majd továbblépni a következő részfeladat végrehajtásához. Az OpenAI fejlesztői dokumentációja is úgy írja le az agentic AI-t, mint egy olyan LLM-et, amely előre megadott utasításokkal, eszközökkel, kontextussal, védőkorlátokkal és strukturált kimenetekkel működik. Ez annyit tesz, hogy már nemcsak megmondja, mit kellene csinálni, hanem bizonyos határok között végre is tudja hajtani.
Tudjuk, kit engedünk dolgozni?
Ez a különbség elsőre apróságnak tűnhet, pedig üzleti szempontból óriási jelentősége van. Egy LLM-től megkérdezhetjük, hogyan kellene hatékonyabbá tenni az ügyfélszolgálatot, és válaszolni fog a kérdésre, jobb vagy rosszabb megoldásokkal. Egy agentic AI-rendszer viszont, megfelelő jogosultságokkal, naplózással és emberi kontrollal már képes lehet elemezni a beérkező ügyeket, csoportosítani a kéréseket, előkészíteni a válaszokat, hibajegyeket nyitni a megfelelő kollégának, és közben figyelni, hol akadhatnak el a folyamatok.
A nagy kérdés tehát már nem az, hogy „mit tud megírni az AI?”, hanem az, hogy milyen munkafolyamatba engedjük be, milyen eszközöket kap, meddig mehet el, és ki felel a döntéseiért?
A McKinsey 2025-ös globális AI-felmérése szerint az AI-használat széles körben terjed, de a legtöbb szervezetnél továbbra is kihívást jelent, hogy a kísérletekből valódi, folyamatokba épített üzleti hatás legyen. Ez pedig pontosan az a terület, ahol az agentic AI ígérete és kockázata találkozik.
Egy ügynök akkor hasznos, ha nemcsak okos, hanem beilleszthető más rendszerekbe, illetve ha pontosan tudja hol és milyen adatokhoz fér hozzá. Emellett kulcsfontosságú, hogy a cselekvőképes mesterséges intelligencia számára egyértelmű legyen, hogy milyen rendszerekben dolgozhat, milyen jogosultságai vannak, hogyan ellenőrzik, auditálják, illetve milyen emberi felülvizsgálati protokollokat léptettek életbe. Ha ezek közül egyik is hiányzik, a hatékonyság forradalma helyett automatizált káosz lesz a végeredmény.