qubit

Az Emberiség Utolsó Vizsgáján jól teljesített, de az ebédet még ne bízzuk a ChatGPT ágensre

2025-08-05

Brendon-ai

A ChatGPT ágens (agent) az OpenAI legújabb fejlesztése, amit július végén tettek széles körben elérhetővé. Ez az egyik első olyan AI-rendszer, amivel már nemcsak beszélgetni tudunk, hanem megkérhetjük arra, hogy önállóan oldjon meg összetett feladatokat: rendelje meg a másnapi ebédhez szükséges alapanyagokat, vagy állítson össze egy prezentációt az általunk megadott paraméterek és az interneten fellelhető adatok alapján.

Legalábbis elméletben. A ChatGPT ágensnek ugyanis nem Sam Altman cégének demóvideóiban, hanem a keszekusza interneten kell boldogulnia, ami tele van emberekkel, botokkal és veszélyekkel. A szolgáltatók simán dönthetnek úgy, hogy letiltják az AI-ágens hozzáférését, miközben a rosszindulatú aktorok megpróbálhatják rávenni, hogy térjen el az utasításaitól, vagy adja ki az adatainkat. Az AI-biztonsággal foglalkozó szakértők eközben attól is tartanak, hogy az egyre fejlettebb és autonómabb AI-rendszerek maguktól kezdenek el veszélyesen viselkedni.

Mit tud?

Az ágenst megkérhetjük, hogy böngéssze nekünk az internetet, töltsön le dokumentumokat, írjon kódot, készítsen táblázatokat és állítson össze prezentációkat. A ChatGPT-n belül a Plus, a Pro és a Team csomagokra előfizetőknek elérhető ágens a cég jelenlegi legfejlettebb érvelő modellje, az o3 felturbózott változatának érződik. Az új funkciót az OpenAI egyesített ágensrendszernek (unified agent system) nevezi, ami a ChatGPT-re, a netes keresés alapján jelentéseket író mélykutatásra (deep research), valamint a virtuális számítógép használatára képes Operatorra épül.

A ChatGPT ágens leglátványosabb eleme az a kis ablak, amin keresztül asztali böngészőből folyamatosan követhetjük, ahogy dolgozik, és a látvány elsőre, sőt talán még másodjára is megdöbbentő. Az ablak egyrészt lehetőséget ad a beavatkozásra, másrészt biztonságérzetet kelt, és abba az illúzióba ringat, hogy mindig tudjuk, mit csinál az ágens – miközben a fejlett AI-rendszereket a kutatók inkább fekete dobozokhoz hasonlítják, amelyek működését nem értjük teljesen.

A ChatGPT ágens a korábbi Operatorhoz hasonlóan egy szervereken futó, virtuális számítógéppel dolgozik. Az internetet böngészőn keresztül éri el, amivel az oldalakat vizuálisan is szemügyre tudja venni, vagy ha csak arra van szüksége, kinyeri belőlük a szövegeket. Ha egy weboldal használatához be kell jelentkeznie valahová, akkor nekünk kell átvennünk a böngésző felett az irányítást, és meg kell adnunk az adatainkat – amiket az OpenAI állítása szerint a ChatGPT nem ment el.

De hogyan dolgozik a fájlokkal, amiket az internetről is le tud tölteni, és milyen táblázatokat, prezentációkat készít? Erre az ágens a Terminalnak nevezett parancssori felületet használja virtuális számítógépén, amivel kódot tud írni és futtatni, és ezáltal a rábízott feladatot elvégezni. A cég szerint az ágens nemcsak repetitív irodai feladatok automatizálására, például táblázatok rendszeres frissítésére lehet hasznos, hanem utazástervezésre vagy időpontfoglalásra is.

Az ágens az OpenAI által közzétett benchmark-eredmények alapján jól teljesít: a Humanity’s Last Exam (az emberiség utolsó vizsgája) nevű teszten például 41,6 százalékot ér el az o3 20,3 százalékával szemben. A cég azt állítja, hogy saját tesztjén, ami komplex, gazdaságilag értékes feladatok elvégzését méri, a ChatGPT ágens az esetek felében a bírálók szerint ugyanolyan vagy jobb eredményt tesz le az asztalra, mint az emberek.

Beletört az Amazonba a virtuális bicska

Forrás

Hasonló cikkek

Érdekességek

telex-írta

Korábban a szexualitás volt a tabu, ma a halál és a szenvedés az

2024-11-01

Posted by Brendon-ai

telex-írta

Válogatott ajándékok, mindenkinek, minden alkalomra (x)

2024-11-01

Posted by Brendon-ai

telex-írta

Amikor magamhoz tértem, éreztem, hogy nagyon nagy baj van a lábaimmal

2024-11-01

Posted by Brendon-ai

Vélemény, hozzászólás? Válasz megszakítása

EUR/HUF398.32Ft

05 aug · CurrencyRate · EUR

CurrencyRate.Today
Check: 05 Aug 2025 20:05 UTC
Latest change: 05 Aug 2025 20:00 UTC
API: CurrencyRate

Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.

⚡You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

USD/HUF344.19Ft

05 aug · CurrencyRate · USD

CurrencyRate.Today
Check: 05 Aug 2025 20:05 UTC
Latest change: 05 Aug 2025 20:00 UTC
API: CurrencyRate

⚡You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

EUR/HUF398.32Ft

05 aug · CurrencyRate · EUR

CurrencyRate.Today
Check: 05 Aug 2025 20:05 UTC
Latest change: 05 Aug 2025 20:00 UTC
API: CurrencyRate

⚡You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

USD/HUF344.19Ft

05 aug · CurrencyRate · USD

CurrencyRate.Today
Check: 05 Aug 2025 20:05 UTC
Latest change: 05 Aug 2025 20:00 UTC
API: CurrencyRate

⚡You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

Az Emberiség Utolsó Vizsgáján jól teljesített, de az ebédet még ne bízzuk a ChatGPT ágensre

Mit tud?

Beletört az Amazonba a virtuális bicska

Érdekességek

Korábban a szexualitás volt a tabu, ma a halál és a szenvedés az

Válogatott ajándékok, mindenkinek, minden alkalomra (x)

Amikor magamhoz tértem, éreztem, hogy nagyon nagy baj van a lábaimmal

Napoli, tecnica del 'finto maresciallo': giovane arrestato per 11esima volta

A legfejlettebb AI is megbukott a fordított Turing-teszten: nem tudja eldönteni, hogy emberrel vagy géppel beszél

Vélemény, hozzászólás? Válasz megszakítása

Korábban

MNB árfolyamok

Kapcsolat

Csak 18 éven felülieknek!