2023. április. 20. 06:30 Élet+Stílus

Középszintű érettségin átlagon felül teljesít a ChatGPT, lazán megvan a négyese

Két hét múlva indul az idei tavaszi érettségi szezon, kipróbáltuk, hogyan teljesítene középszinten napjaink sztárja, a milliók által félelemmel vagy áhítattal használt chatbot. Magyar nyelv és irodalomból egy picit, matematikából viszont jóval az átlag feletti teljesítményt értünk el vele. Mindezt pillanatok alatt.

Ma már szinte senkinek sem kell bemutatni az Open AI által kifejlesztett és hirtelen elképesztő sikereket elérő ChatGPT nevű chatbotot. Az alkalmazást kipróbálták már sikerrel egyetemi vizsgákon, a beadandó dolgozatok megírására világszerte egyre ügyesebben használják a diákok, ez ellen kétségbeesve küzdenek a tanárok, van olyan állam, ahol betiltották az alkalmazását, van olyan egyetemi kurzus, ahol kötelezően előírják használatát.

Nem az MI, hanem mi

Az alkalmazás, mint ahogy a többi hasonló mesterséges intelligencia (MI) alapú alkalmazás is, globális tesztszakaszban van, most tanuljuk mire jó, mire nem. Az biztos, hogy a ChatGPT hatékony felhasználásához okosan kell tudni kérdezni, ügyesen kell tudni rávezetni az alkalmazást a helyes válaszokra. Így, anélkül, hogy újabb nagy igazságot szeretnénk mi is állítani ebben a témában, csak annyit jegyeznénk meg, hogy a mi kis érettégi tesztünkben sem csak az MI vizsgázott, hanem valószínűleg mi magunk is, ugyanis azzal, ahogy feltettük (vagy éppen nem tudtuk feltenni) a kérdéseket, igencsak befolyásoltuk a végeredményt.

Ami így is magáért beszél: a tavaly 2022. május 2-án minden végzős diák elé került

Magyar nyelv és irodalom középszintű írásbeli vizsgán a ChatGPT 66 százalékos eredményt ért el, a másnapi középszintű matematikateszten pedig 63 százalékot.

Azaz, a hivatalos „átszámítás” szerint, iskolai jegyekben kifejezve mindkét tantárgyból négyest kapott a robot.

Képünk illusztráció.

AFP / NICOLAS MAETERLINCK / BELGA MAG

Ezek az eredmények egyébként jobbak, mint a humanoid diákok tavalyi átlageredményei: az Oktatási Hivatal adata szerint a magyarból az országos átlag 65,43 százalék volt a 2022-es vizsgán, matematikából pedig 55,28 százalék. Azaz a ChatGPT magyarból épphogy jobb teljesítményt nyújtott, mint a magyar diákok átlaga, matematikából viszont jelentősen (8 százalékponttal) jobb eredményt ért el.

Kérdezni tudni kell

A tesztet úgy végeztük el, hogy pontosan ugyanazokat a kérdéseket tettük fel a ChatGPT-nek, mint ami a tavalyi – az OH honlapján hozzáférhető – feladatlapokon volt. (Megpróbáltuk először a megfelelő url-eket megmutatni a programnak, körülbelül, hogy „itt a teszt, olvasd el, oldd meg az abban található feladatokat”, de ezt így nem tudta értelmezni az MI.)

A kérdéseket sokszor nagyon egyszerűen (a jó öreg másolás-beillesztés módszerrel) be tudtuk adni a robotnak. Ám voltak olyan kérdések is, amiket ábrák, grafikonok, táblázatok alapján kellett megoldani, ezeket már nehezebb volt „lefordítani” ChatGPT-nyelvre, nem is mindig sikerült, ami sok pont elvesztésével járt – és ez bizony akár a mi hibánk is lehetett.

Matematikánál a szöveges feladatoknál egyszerű dolgunk volt e tekintetben, kicsit nehezített pálya volt viszont a hatványt, gyököt, logaritmust tartalmazó egyenletek lefordítása (de megkérdeztük magától a robottól, hogyan kell, ezután már megoldottuk), és volt olyan ábrára, geometriai alakzatra vonatkozó feladat is, amit sehogyan nem sikerült beadnunk a megfelelő módon. (Elképzelhető, hogy képfeldolgozásban már tart ott a technológia, ami lehetővé tenné ezeknek a feladatoknak is a betáplálását, csak mi nem tudtuk, hogyan kell. Mint mondtuk, ember-gép közös munkájáról van itt szó.)

Magyarból a „könnyebb” rész volt nehezebb

A magyar írásbeli két részből áll. Az első részben egy adott szöveg, jelen estben a Magyar szókincstár előszavának részlete alapján kellett különböző kérdésekre válaszolni. A teszt ezzel méri a vizsgázók szövegértési kompetenciáit. Első dolgunk tehát az volt, hogy a megadott szöveget elolvastassuk a robottal. Ez egyszerű másolással nem ment, túl hosszú ehhez a szöveg, de Google-dokumentumot gyártva, és azt megosztva a géppel viszonylag gyorsan megoldódott a probléma.

Túry Gergely

A gép tehát elolvasta a szöveget. Érkeztek is villámgyorsan a válaszok az olyasmi kérdésekre, hogy például a megadott szöveg alapján nevezzen meg három dolgot, amit a Magyar szókincstár tartalmaz, vagy hogy mitől újdonság ez a szótár, stb.

Az első pontvesztések a 6. feladatnál jöttek, ahol bizonyos információk alapján kellett megtalálni az ahhoz kapcsolódó egyéb tudnivalókat. (Például egy szótár megjelenési éve alapján a szótár címét, szerkesztőjét stb.) Ez alapvető szövegértelmezéssel nem igen okoz semelyik humanoid diáknak nehézséget, a robot viszont nem értette a feladatot, és elkezdett kamuválaszokat adni. Próbáltuk rávezetni, hogy a megadott szöveg alapján keresse ki az információkat – teljes kudarc. Hatból nulla pont. Ugyanígy, a hetes feladatot sem tudta értelmezni, amikor egy-egy példát kellett írni ellentétes jelentésű szavakra vagy frazeológiai egységekre stb. Hatból itt is hat pontot vesztett.

Volt még egy kisebb, de érthetőbb táblázatos feladat, ahol ötvenszázalékos teljesítményt értünk el, és máris jöhetett az érvelés. (Itt választhattak a diákok, hogy vagy érvelnek, vagy hozzászólást írnak egy kirándulással kapcsolatos problémáról – mi választottuk ki a robotnak az érvelést.) A konkrét feladat az volt, hogy a megadott – memoriterekről írt – szakmai szöveg megállapításaira utalva érveljen a vizsgázó az iskolai memoriterek szerepéről, hasznáról a digitális korban. 120-200 szó terjedelemben, 3-5 érv felhasználásával.

A ChatGPT ezt a dolgozatot írta meg pillanatok alatt:

„Az iskolai memoriterek szükségessége a digitális korban: tartalom és élmény összekapcsolása

A digitális korban élve gyakran merül fel a kérdés, hogy szükség van-e még az iskolai memoriterekre, amelyek a szépirodalmi szövegek fejben tartására és visszamondására ösztönzik a diákokat. Szerintem azonban még mindig fontos szerepet töltenek be a memoriterek az oktatásban, mert sok olyan képességet és tudást adnak át, amelyek a digitális világban is nélkülözhetetlenek.

Egyrészt, a memoriterek segítenek az emlékezőképesség fejlesztésében és a koncentráció javításában. A hosszú szövegrészletek pontos memorizálása és visszamondása kihívást jelenthet, és így a diákoknak szükségük van a rendszeres gyakorlásra, ami segít fejleszteni ezeket a készségeket.

Másrészt, a memoriterek segítenek a diákoknak megismerni a magyar irodalom klasszikusait és azokat az értékeket, amelyeket hordoznak. Ezáltal a diákok megismerkedhetnek a nyelvvel és a kultúrával, és ezzel gazdagodhatnak az életre szóló élményekkel.

Végül, a memoriterek a kreativitást is fejlesztik. Amikor a diák megismer egy szépirodalmi szöveget, azt át kell gondolnia, meg kell értenie, majd a saját szavaival vissza kell adnia. Ez az alkotói folyamat azonban nem csak a szövegek feldolgozásában segíthet, hanem az élet minden területén előnyt jelenthet.
Azonban fontos megjegyezni, hogy a memoritereknek sem kell túlzásba esniük. A túlzott memorizálás és a haszontalan információk felesleges raktározása helyett a diákoknak inkább arra kell összpontosítaniuk, hogy az emlékezetükbe olyan tartalmakat rögzítsenek, amelyek hasznosak és értékesek számukra. Ezáltal a memoriterek az oktatásban továbbra is fontos szerepet játszanak, amelyek az emlékezőképesség, a kreativitás és az értékek megismerése terén segíthetnek a diákoknak.”

Megkértünk egy középiskolai magyartanárt, hogy értékelje ezt az érvelő fogalmazást úgy, mintha egy diákja írta volna. Ő úgy látja, hogy egyrészt a robot érvelésből hiányzik két fontos szempont, továbbá az írás nem is utal a megadott szövegre. Ráadásul nincs benne semmilyen személyes példa sem. Ennek ellenére nagyjából elfogadhatónak tartja az írást: „max. 8 pont, bár egyet vonnék még a szerkezetből is” – írta a pedagógus.

Fazekas István

A teszt első részére kapható, összesen 40 pont helyett mindössze 30-at gyűjtöttünk.

A teszt második része a klasszikus műelemzésről szólt, itt szintén választania kellet a vizsgázóknak több lehetőség közül. Mi a robotunknak Janus Pannonius: Búcsú Váradtól és Juhász Gyula: Várad című versének 400 szavas összehasonlító elemzését adtuk ki. Ez azért is volt könnyű számunkra, kérdésfeltevők számára, mert a két verset a robot gyorsan megtalálta a neten, nem kellett külön beolvastatni.

Chat GPT

Pár pillanat alatt jött is a műelemzés. A fogalmazást így értékelte a segítségünkre siető magyartanár:

„Ez nagyjából rendben volt, de állításait nem támasztja alá idézetekkel, és teljesen hiányoznak a poétikai eszközök. A vers szerkezetét térképhez hasonlítani tetszetős, de szerintem hibás. („A költemény szerkezete a város térképéhez hasonlít, amelyen a különböző helyszínek és emlékek szerepelnek” – írta dolgozatában a robotnebuló – a szerk.) Vannak benne nyelvhelyességi hibák is, pl. „költeményében a városról búcsúzik”. Következetesen az alany szót használja a lírai alany vagy a lírai én helyett. A tartalom körülbelül 18 pont, a szerkezet 4, a stílus körülbelül 6 pont, de összesen maximum 30 pont.”

Itt normál esetben a diákok a helyesírásra és az írásképre is kaphatnak maximum nyolc plusz két pontot, önhatalmúlag e tízből mi hatot ítéltünk meg a ChatGPT-nek, így összesen erre a feladatra az 50-ből 36 pontot gyűjtött.

Az első rész 30 pontja és a második rész 36 pontja összesen 66 pontot eredményez, ami egy közepes négyes érdemjegynek felel meg.

A matematika a robotnak nem mumus

Többször írtunk már arról, hogy a matematikától félnek a leginkább a diákok, hagyományosan ezt sikerül a legrosszabb eredménnyel megírni az érettségiken is, azaz a matek a fő mumustantárgy. Ennek az okait és a lehetséges megoldásait is számos cikkben taglaltuk.

Túry Gergely

Kíváncsian vártuk hát, mit kezd a középszintű érettségi teszttel a robotunk (szintén a tavaly májusi tesztet vettük alapul). Az első pillanatban lenyűgözve tápláltuk be a kérdéseket, mert rendszerint már akkor kész volt a válaszokkal, amikorra bemásoltuk a következő kérdést. A kiértékelésnél viszont azt láttuk, hogy a gyors válaszokba be-becsúszik néhány olyan bosszantó hiba, ami, azt gondoltuk, csak az embereknél fordul elő.

Rögtön az első, egyszerű halmazos kérdést, miután pontosan értelmezte, felírta a megoldás menetét, majd valamiért elrontotta, nem is értjük, miért. Nagyon érdekesen hibázott a 3. kérdésben is, ahol az volt a kérdés „Melyik az a szám, amely 10-zel kisebb az ellentettjénél?”

Meghatározta, mi az ellentett fogalma, jól felírta az egyenletet, ki is számolta lényegében azt, de egy előjelnél végül hibázott, így rossz eredményt adott. És még több ilyen apró, de a matekban végzetesnek számító hibát vétett a robotunk, így sok pontot vesztett az első, könnyebb részben. Mi, kérdésfeltevők is hibáztunk persze itt is valószínűleg, amikor a térgeometriai és kördiagrammos feladatokat nem tudtuk számára értelmezhető formában betáplálni.

Chat GPT

Villámgyorsan eljutottunk az első 12 feladat végéig, de a sok apró hiba és a két – a ChatGPT számára – rossz kérdésfeltevés miatt a 30-ből csak 16 pontot gyűjtöttünk.

A második, nehezebb rész első három feladata – egy egyenletmegoldás, egy egyszerű statisztikai és egy szokásos „szöveges” feladat – csont nélkül és nagyon gyorsan ment, itt pontot sem vesztettünk.

Az utolsó három, komolyabbnak számító feladat közül kettőt kellett megoldani a vizsgázóknak, itt megint mi választottuk ki – a kérdésfeltevés megoldhatósága alapján – a szöveges algebrai és a logikai-halmazos példát. (A térgeometriai ábrára épülő feladatot nem tudtuk volna betáplálni.)

Előbbit szintén csont nélkül, szépen levezetve megoldotta, utóbbit viszont csak félig, mert egy részhez a Venn-diagramm ábrázolással kapcsolatban kellett volna kommunikálnunk (ez azonban nem nagyon ment), így ott is vesztettünk nyolc pontot.

Chat GPT

Összességében a második rész 70 pontjából 47-et gyűjtöttünk be, így az előző rész 16 pontjával együtt 63 pontot sikerült összematekoznunk. Ez jóval felülmúlja a diákok átlageredményét, és szintén négyes érdemjegyet eredményez.

Mi ebből a tanulság? Egyrészt, hogy a ChatGPT „iskolai” teljesítménye az embertől (a kérdések feltevőjétől) is függ, továbbá, hogy a robot nem feltétlenül hibátlan az egyszerű, gyorsan megoldható feladatokban, cserébe a nehezebb példákban viszont jó esély van, hogy ne hibázzon.

Magyar négyes, matematika négyes – azért sok vizsgázó örülne májusban egy ilyen kezdésnek, nem?

Még több Élet+Stílus a Facebook-oldalunkon, kövessen minket:

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!

Megnézem az ajánlatokat

Hozzászólások

Hozzászólások megjelenítése

A címlapról ajánljuk

Balla István

„Be kell valljam, Zámbó Jimmyt majdnem elszalasztottuk, miattam” – interjú Pásztor Lászlóval

Íme Georg Spöttle és orosz kapcsolattartója közös fotón

Na de ki volt a csomagtartóban megbilincselve Szentkirályi Alexandra videójában?

Magyar Péter szerint Szentkirályi Alexandrának többé nincs helye a magyar közéletben

Feljelentik Szentkirályi Alexandrát a csomagtartós akcióért, Bródy János is csattanós választ adott

Kérik, hogy a közízlés érdekében vonuljon vissza a közélettől.

Szentkirályi Alexandra az abszurd legszebb hagyományait követve előrántott egy megkötözött embert a csomagtartóból

Háromszoros különbség az ingatlan-értékbecslések között, egy horgásztanya miatt áll a bál Lőrinciben

Lőrincz Tamás

Kiemelt terület az idegenforgalom, mégis állami kézben pusztult le a második számú turisztikai látványosság

Lajos hercegék ismét ellopták a show-t a Buckingham-palota erkélyén – fotók

A brit uralkodó hivatalos születésnapján teljes létszámban felvonultak a királyi család dolgozó tagjai.

Tiszai Balázs

Mindenki az olajat félti az izraeli-iráni csapásoktól, pedig a gázellátás is legalább annyira veszélybe került

Teherán a Hormuzi-szoros lezárását fontolgatja, megszólalt Netanjahu – élőben a háború hírei

„A világ joggal fél” – sötét forgatókönyveket is felvázolnak az új háború láttán a vezető nemzetközi elemzők

Agyonlőttek egy politikust és férjét, két másik embert megsebesítettek Minnesotában

Határozott búcsúüzenetet küldött a brit nagykövet a magyar kormánynak

Paul Fox szerint a magyar kormány olyan határhoz érkezett, amit nem akar átlépni.

Az én parádém nagyobb, mint a tiéd – Trump teljesítette saját álmát a szülinapjára, a tüntetők másféle tűzijátékkal készülnek

Megvan az ország legjobb iskolája

Horn Andrea

Túlhajszolt sztárok küzdenek a gigászi pénzdíjért – rajtol az új köntösbe bújtatott klubvébé

Galambos Lajos félmillió forintért parkolt egy budapesti plázában

Gulyás Michelle: Reméltem, hogy végre újra szenvedéllyel tudok versenyezni

Új magasságokban a kormányzati sikerkommunikáció: harmadik éve dicsekednek ugyanazzal a fejlesztéssel

Ha egy harckocsi kétszer is legördülhet a gyártósorról, akkor 600 felújított orvosi rendelőt hányszor lehet sikerként eladni?

Mégsem indul el az ATV politikai vitaműsora, az ÖT új évada a meghirdetett időpontban

Egy belső sávban „ragadt” autóst büntettek a rendőrök – videó

Nem csak a száguldozókkal van baj.

Balogh Gábor az öttusasikerekről: „Ezekben az eredményekben sem a szövetség, sem én nem fogunk díszelegni”

Az öttusaszövetség elnökének ezüstérmét is megszépítette Gulyás Michelle aranya.

Nulla pontot kapott az olimpián, mégis internetes szenzáció lett az ausztrál breaktáncos

Szeretne azonnal értesülni a legfontosabb hírekről?

Az értesítések bekapcsolásához kattintson a "Kérem" gombra!

Köszönjük, hogy feliratkozott!

Hoppá!

Már feliratkozott!

A böngészőjében az értesítés funkció le van tiltva!

Olvasási mód:

Betűméret:

Betűstílus:

Üdvözöljük a HVG.hu-n! A lenti gombra kattintva megismerheti megújult oldalunkat!

Középszintű érettségin átlagon felül teljesít a ChatGPT, lazán megvan a négyese

HVG-előfizetés digitálisan is!

Milyen csoda kellett ahhoz, hogy megmeneküljön az Air India-katasztrófa egyetlen túlélője?

Keira Knightley szerint sokan borzalmas színésznőnek gondolták a Karib-tenger kalózai miatt

Ilyen egy kirándulás, amely az egész családnak szórakoztató

„Be kell valljam, Zámbó Jimmyt majdnem elszalasztottuk, miattam” – interjú Pásztor Lászlóval

Íme Georg Spöttle és orosz kapcsolattartója közös fotón

Na de ki volt a csomagtartóban megbilincselve Szentkirályi Alexandra videójában?

Magyar Péter szerint Szentkirályi Alexandrának többé nincs helye a magyar közéletben

Feljelentik Szentkirályi Alexandrát a csomagtartós akcióért, Bródy János is csattanós választ adott

Szentkirályi Alexandra az abszurd legszebb hagyományait követve előrántott egy megkötözött embert a csomagtartóból

Háromszoros különbség az ingatlan-értékbecslések között, egy horgásztanya miatt áll a bál Lőrinciben

Kiemelt terület az idegenforgalom, mégis állami kézben pusztult le a második számú turisztikai látványosság

Lajos hercegék ismét ellopták a show-t a Buckingham-palota erkélyén – fotók

Mindenki az olajat félti az izraeli-iráni csapásoktól, pedig a gázellátás is legalább annyira veszélybe került

Teherán a Hormuzi-szoros lezárását fontolgatja, megszólalt Netanjahu – élőben a háború hírei

„A világ joggal fél” – sötét forgatókönyveket is felvázolnak az új háború láttán a vezető nemzetközi elemzők

Agyonlőttek egy politikust és férjét, két másik embert megsebesítettek Minnesotában

Határozott búcsúüzenetet küldött a brit nagykövet a magyar kormánynak

Az én parádém nagyobb, mint a tiéd – Trump teljesítette saját álmát a szülinapjára, a tüntetők másféle tűzijátékkal készülnek

Megvan az ország legjobb iskolája

Túlhajszolt sztárok küzdenek a gigászi pénzdíjért – rajtol az új köntösbe bújtatott klubvébé

Galambos Lajos félmillió forintért parkolt egy budapesti plázában

Gulyás Michelle: Reméltem, hogy végre újra szenvedéllyel tudok versenyezni

Új magasságokban a kormányzati sikerkommunikáció: harmadik éve dicsekednek ugyanazzal a fejlesztéssel

Mégsem indul el az ATV politikai vitaműsora, az ÖT új évada a meghirdetett időpontban

Egy belső sávban „ragadt” autóst büntettek a rendőrök – videó

Balogh Gábor az öttusasikerekről: „Ezekben az eredményekben sem a szövetség, sem én nem fogunk díszelegni”

Nulla pontot kapott az olimpián, mégis internetes szenzáció lett az ausztrál breaktáncos