szerző:
Gál Luca
Értékelje a cikket:
Köszönjük!

Megvizsgálták a mesterséges intelligencia alapú szoftverek verbális intelligenciáját. Meglepő eredményre jutottak.

Az ELTE PPK kutatásából kiderült, hogy a mesterséges intelligencia alapú szoftverek még a doktori fokozattal rendelkező anyanyelvi beszélőket is maguk mögé utasítják – olvasható az egyetem közleményében.

A nagy nyelvi modellek (large language models) olyan mesterségesintelligencia-típusok, amelyek képesek ember alkotta szövegekhez hasonló tartalmak létrehozására. Ezek a modellek – például a ChatGPT – forradalmi változást hoztak az AI világában, és mára már képesek igen élethűen utánozni az emberi képességeket.

Egyes kutatók szerint az AI intelligenciáját úgy lehet a legjobban mérni, ha a modellekkel embereknek tervezett pszichometriai teszteket végeztetünk el. Ennek fényében Kovács Kristóf, az ELTE PPK tudományos főmunkatársa, a Kognitív Képességek Kutatócsoport vezetője és a tesztező platformokkal foglalkozó Klein Balázs vizsgálatukban két mesterséges intelligencia alkalmazás (ChatGPT és Bing) verbális intelligenciáját hasonlították össze több mint 9000 emberével.

Ehhez egy számítógépes adaptív szókincstesztet használtak, ahol kilenc felsorolt szó közül mindig azt a kettőt kellett kiválasztani, amelyek jelentésben a legközelebb álltak egymáshoz.

A teszten mindkét nyelvi modell magas teljesítményt nyújtott: 20-ból 19 embernél (az emberek 95%-ánál) jobb eredményt értek el, és jobban teljesítettek a doktori fokozattal rendelkező anyanyelvi beszélőknél is.

A gépek kiemelkedő teljesítményük ellenére azonban vétettek néhány hibát is. Az ismétlődő kérdések 42%-ánál eltérő válaszokat adtak az egyes alkalmakkor – ilyen embereknél nem történik. Emellett esetenként olyan szavakkal válaszoltak, amelyek nem szerepeltek a megadott opciók között.

Ezek a hibák azonban nem a szoftverek hiányosságaira utalnak, hanem sokkal inkább arra mutatnak rá, hogy az embereknek szánt pszichometriai teszteknek a mesterséges intelligencia esetében vannak korlátai.

A kutatók azt tanácsolják, ne a túl felszínes, hanem épp a túl szofisztikált kommunikáció esetén fogjunk gyanút – hiszen könnyen előfordulhat, hogy egy AI szoftver színesebb szókincsből dolgozik, mint mi.