A ChatGPT ágens (agent) az OpenAI legújabb fejlesztése, amit július végén tettek széles körben elérhetővé. Ez az egyik első olyan AI-rendszer, amivel már nemcsak beszélgetni tudunk, hanem megkérhetjük arra, hogy önállóan oldjon meg összetett feladatokat: rendelje meg a másnapi ebédhez szükséges alapanyagokat, vagy állítson össze egy prezentációt az általunk megadott paraméterek és az interneten fellelhető adatok alapján.
Legalábbis elméletben. A ChatGPT ágensnek ugyanis nem Sam Altman cégének demóvideóiban, hanem a keszekusza interneten kell boldogulnia, ami tele van emberekkel, botokkal és veszélyekkel. A szolgáltatók simán dönthetnek úgy, hogy letiltják az AI-ágens hozzáférését, miközben a rosszindulatú aktorok megpróbálhatják rávenni, hogy térjen el az utasításaitól, vagy adja ki az adatainkat. Az AI-biztonsággal foglalkozó szakértők eközben attól is tartanak, hogy az egyre fejlettebb és autonómabb AI-rendszerek maguktól kezdenek el veszélyesen viselkedni.
Mit tud?
Az ágenst megkérhetjük, hogy böngéssze nekünk az internetet, töltsön le dokumentumokat, írjon kódot, készítsen táblázatokat és állítson össze prezentációkat. A ChatGPT-n belül a Plus, a Pro és a Team csomagokra előfizetőknek elérhető ágens a cég jelenlegi legfejlettebb érvelő modellje, az o3 felturbózott változatának érződik. Az új funkciót az OpenAI egyesített ágensrendszernek (unified agent system) nevezi, ami a ChatGPT-re, a netes keresés alapján jelentéseket író mélykutatásra (deep research), valamint a virtuális számítógép használatára képes Operatorra épül.
A ChatGPT ágens leglátványosabb eleme az a kis ablak, amin keresztül asztali böngészőből folyamatosan követhetjük, ahogy dolgozik, és a látvány elsőre, sőt talán még másodjára is megdöbbentő. Az ablak egyrészt lehetőséget ad a beavatkozásra, másrészt biztonságérzetet kelt, és abba az illúzióba ringat, hogy mindig tudjuk, mit csinál az ágens – miközben a fejlett AI-rendszereket a kutatók inkább fekete dobozokhoz hasonlítják, amelyek működését nem értjük teljesen.
A ChatGPT ágens a korábbi Operatorhoz hasonlóan egy szervereken futó, virtuális számítógéppel dolgozik. Az internetet böngészőn keresztül éri el, amivel az oldalakat vizuálisan is szemügyre tudja venni, vagy ha csak arra van szüksége, kinyeri belőlük a szövegeket. Ha egy weboldal használatához be kell jelentkeznie valahová, akkor nekünk kell átvennünk a böngésző felett az irányítást, és meg kell adnunk az adatainkat – amiket az OpenAI állítása szerint a ChatGPT nem ment el.
De hogyan dolgozik a fájlokkal, amiket az internetről is le tud tölteni, és milyen táblázatokat, prezentációkat készít? Erre az ágens a Terminalnak nevezett parancssori felületet használja virtuális számítógépén, amivel kódot tud írni és futtatni, és ezáltal a rábízott feladatot elvégezni. A cég szerint az ágens nemcsak repetitív irodai feladatok automatizálására, például táblázatok rendszeres frissítésére lehet hasznos, hanem utazástervezésre vagy időpontfoglalásra is.
Az ágens az OpenAI által közzétett benchmark-eredmények alapján jól teljesít: a Humanity’s Last Exam (az emberiség utolsó vizsgája) nevű teszten például 41,6 százalékot ér el az o3 20,3 százalékával szemben. A cég azt állítja, hogy saját tesztjén, ami komplex, gazdaságilag értékes feladatok elvégzését méri, a ChatGPT ágens az esetek felében a bírálók szerint ugyanolyan vagy jobb eredményt tesz le az asztalra, mint az emberek.