Az Emberiség Utolsó Vizsgáján jól teljesített, de az ebédet még ne bízzuk a ChatGPT ágensre

-- Olvasási idő kb.: 2 perc és 12 másodperc

A ChatGPT ágens (agent) az OpenAI legújabb fejlesztése, amit július végén tettek széles körben elérhetővé. Ez az egyik első olyan AI-rendszer, amivel már nemcsak beszélgetni tudunk, hanem megkérhetjük arra, hogy önállóan oldjon meg összetett feladatokat: rendelje meg a másnapi ebédhez szükséges alapanyagokat, vagy állítson össze egy prezentációt az általunk megadott paraméterek és az interneten fellelhető adatok alapján.

Legalábbis elméletben. A ChatGPT ágensnek ugyanis nem Sam Altman cégének demóvideóiban, hanem a keszekusza interneten kell boldogulnia, ami tele van emberekkel, botokkal és veszélyekkel. A szolgáltatók simán dönthetnek úgy, hogy letiltják az AI-ágens hozzáférését, miközben a rosszindulatú aktorok megpróbálhatják rávenni, hogy térjen el az utasításaitól, vagy adja ki az adatainkat. Az AI-biztonsággal foglalkozó szakértők eközben attól is tartanak, hogy az egyre fejlettebb és autonómabb AI-rendszerek maguktól kezdenek el veszélyesen viselkedni.

Mit tud?

Az ágenst megkérhetjük, hogy böngéssze nekünk az internetet, töltsön le dokumentumokat, írjon kódot, készítsen táblázatokat és állítson össze prezentációkat. A ChatGPT-n belül a Plus, a Pro és a Team csomagokra előfizetőknek elérhető ágens a cég jelenlegi legfejlettebb érvelő modellje, az o3 felturbózott változatának érződik. Az új funkciót az OpenAI egyesített ágensrendszernek (unified agent system) nevezi, ami a ChatGPT-re, a netes keresés alapján jelentéseket író mélykutatásra (deep research), valamint a virtuális számítógép használatára képes Operatorra épül.

A ChatGPT ágens leglátványosabb eleme az a kis ablak, amin keresztül asztali böngészőből folyamatosan követhetjük, ahogy dolgozik, és a látvány elsőre, sőt talán még másodjára is megdöbbentő. Az ablak egyrészt lehetőséget ad a beavatkozásra, másrészt biztonságérzetet kelt, és abba az illúzióba ringat, hogy mindig tudjuk, mit csinál az ágens – miközben a fejlett AI-rendszereket a kutatók inkább fekete dobozokhoz hasonlítják, amelyek működését nem értjük teljesen.

A ChatGPT ágens a korábbi Operatorhoz hasonlóan egy szervereken futó, virtuális számítógéppel dolgozik. Az internetet böngészőn keresztül éri el, amivel az oldalakat vizuálisan is szemügyre tudja venni, vagy ha csak arra van szüksége, kinyeri belőlük a szövegeket. Ha egy weboldal használatához be kell jelentkeznie valahová, akkor nekünk kell átvennünk a böngésző felett az irányítást, és meg kell adnunk az adatainkat – amiket az OpenAI állítása szerint a ChatGPT nem ment el.

De hogyan dolgozik a fájlokkal, amiket az internetről is le tud tölteni, és milyen táblázatokat, prezentációkat készít? Erre az ágens a Terminalnak nevezett parancssori felületet használja virtuális számítógépén, amivel kódot tud írni és futtatni, és ezáltal a rábízott feladatot elvégezni. A cég szerint az ágens nemcsak repetitív irodai feladatok automatizálására, például táblázatok rendszeres frissítésére lehet hasznos, hanem utazástervezésre vagy időpontfoglalásra is.

Az ágens az OpenAI által közzétett benchmark-eredmények alapján jól teljesít: a Humanity’s Last Exam (az emberiség utolsó vizsgája) nevű teszten például 41,6 százalékot ér el az o3 20,3 százalékával szemben. A cég azt állítja, hogy saját tesztjén, ami komplex, gazdaságilag értékes feladatok elvégzését méri, a ChatGPT ágens az esetek felében a bírálók szerint ugyanolyan vagy jobb eredményt tesz le az asztalra, mint az emberek.

Beletört az Amazonba a virtuális bicska


Forrás

Érdekességek

Napoli, tecnica del 'finto maresciallo': giovane arrestato per 11esima volta

A legfejlettebb AI is megbukott a fordított Turing-teszten: nem tudja eldönteni, hogy emberrel vagy géppel beszél

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

hir8.com

HU EUR/HUF399.33Ft
05 aug · CurrencyRate · EUR
CurrencyRate.Today
Check: 05 Aug 2025 07:05 UTC
Latest change: 05 Aug 2025 07:00 UTC
API: CurrencyRate
Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.
You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

HU USD/HUF345.72Ft
05 aug · CurrencyRate · USD
CurrencyRate.Today
Check: 05 Aug 2025 07:05 UTC
Latest change: 05 Aug 2025 07:00 UTC
API: CurrencyRate
Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.
You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀


MNB árfolyamok

HU EUR/HUF399.33Ft
05 aug · CurrencyRate · EUR
CurrencyRate.Today
Check: 05 Aug 2025 07:05 UTC
Latest change: 05 Aug 2025 07:00 UTC
API: CurrencyRate
Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.
You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀
HU USD/HUF345.72Ft
05 aug · CurrencyRate · USD
CurrencyRate.Today
Check: 05 Aug 2025 07:05 UTC
Latest change: 05 Aug 2025 07:00 UTC
API: CurrencyRate
Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.
You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

Kapcsolat

  • +36 20 4393341
  • +36 84 330266
  • szerk.: velemeny@hir8.com
  • jp.software.peticom@gmail.com
  • Jámbor Péter - impress.-p.jambor@hotmail.com
  • Kapcsolati form
  • FACEBOOK: LINK

RSS - Vidd el a legfrissebb tartalmakat!

Adomány a hir8.com-nak!


hir8.com vCard