Villámgyors és világszíntű teljesítményre képes az új magyar nyelvi modell

Az immár bárkinek szabadon elérhető Racka-4B modell teljesítménye a magyar nyelvi feladatokban a kétszer akkora (8 milliárd paraméteres) modellek teljesítményével is összemérhető, sebessége pedig jócskán meghaladta azokét – olvasható az ELTE Informatikai Karának hétfői sajtóközleményében.

A Qubit Live #12 eseményen egyébként meglepően jól vizsgázó ChatPULI, és a Puli család utáni generációt képviselő, az egyik régi magyar juhfajtáról elnevezett úgynevezett érvelő (reasoning) modell az ELTE Mesterséges Intelligencia Tanszék és a Digitális Örökség Nemzeti Laboratórium együttműködésének terméke. A mesterséges intelligencia mérnökökből és nyelvtechnológusokból álló kilencfős stáb a legnagyobb magyarországi szuperszámítógépen, a Komondor HPC infrastruktúrán magyarította a modellt. A 200 millió oldalnak megfelelő szöveg feldolgoztató paraméterhatékony (LoRA) eljárás eredményeként a nyílt forráskódú Racka-4B az előd modellekkel szemben már szofisztikált logikai és érvelő képességekkel is rendelkezik.

A fejlesztők egyik mesterfogása az volt, hogy „az eredeti modell mintegy 150 ezer elemből álló szótárából eltávolítottak nagyjából 32 ezer olyan ritka tokent (például bizonyos távol-keleti karaktereket), amelyek a projekt szempontjából lényegtelenek voltak. Ezek helyére pedig kifejezetten a magyar nyelvre optimalizált tokeneket illesztettek be, és úgy hangolták át a rendszert, hogy előnyben részesítse ezek használatát. Ennek a bravúrnak köszönhetően a modell 47 százalékkal kevesebb tokenből tudja felépíteni ugyanazt a magyar szöveget, ami a gyakorlatban azt jelenti, hogy drasztikusan felgyorsult a szöveggenerálás, ráadásul a nyelvtani és ragozási hibák is jelentősen ritkultak.

Mindez azért sem elhanyagolható, mert a globális tech-óriások még véletlenül sem a magyar nyelvhez igazítva fejlesztgetik a generatív mesterséges intelligencia (AI) aktuális csúcstermékeiket. „Ennek egyik oka, hogy a magyar morfológiailag egy rendkívül gazdag nyelv: szavaink sok ragot, jelet, képzőt hordoznak, így egyetlen szóalakban rengeteg információ sűrűsödhet össze. Ráadásul nincs olyan, a magyarhoz közeli rokon nagy világnyelv, amelynek digitális jelenléte – technológiai értelemben – magával húzná a magyart. Ha viszont ezek a rendszerek nem értik és beszélik elég jól a nyelvünket, nem integrálják a régió kultúráját és történeti tudását, vagy akár a hazai jogszabályokat, a jogi szaknyelvet, akkor Magyarország több téren is hátrányba kerülhet. Ahhoz, hogy a régió megőrizze digitális szuverenitását, elengedhetetlen a saját adatokon tanított technológia” – fogalmaz a sajtóközlemény.

(Címlapi képünkön az AI-modell névadó juhfajtáját méltán képviselő hortobágyi, avagy magyar racka látható.)


Forrás

Érdekességek

Sulyok ütőkártyája most az a Velencei Bizottság akar lenni, amit sorosozásra és önigazolásra is használt már a Fidesz

Az evolúció gének passzolgatásával találta fel újra és újra a gombaszerű életmódot

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

hir8.com

Vélemény

A jelenlegi politikai környezetben – ahol a parlamenti struktúra nem biztosítja a valódi fékek és ellensúlyok működését – különösen fontos, hogy legyenek olyan politikai és civil hangok, amelyek a nyilvánosságban és a társadalmi párbeszédben képesek konstruktív kontrollt gyakorolni. -Jámbor Péter


HU EUR/HUF355.8Ft
02 jún · CurrencyRate · EUR
CurrencyRate.Today
Check: 01 Jun 2026 23:25 UTC
Latest change: 01 Jun 2026 23:16 UTC
API: CurrencyRate
Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.
You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀
HU USD/HUF305.79Ft
02 jún · CurrencyRate · USD
CurrencyRate.Today
Check: 01 Jun 2026 23:25 UTC
Latest change: 01 Jun 2026 23:16 UTC
API: CurrencyRate
Disclaimers. This plugin or website cannot guarantee the accuracy of the exchange rates displayed. You should confirm current rates before making any transactions that could be affected by changes in the exchange rates.
You can install this WP plugin on your website from the WordPress official website: Exchange Rates🚀

könyv borító

Soha többé kétharmad

Soha többé kétharmad

Tombol a közösségi média és patás ördögnek titulál mindenkit, aki a '26-os választásokra terveket fogalmaz meg. Valóban, úgy tűnik elengedhetetlen a valódi változás, sokak szerint mindenáron. Azonban mivel…

Tovább »