Radiológus-vizsgasort raktak kutatók a ChatGPT elé, és egész ígéretesen szerepelt a chatbot – voltak azonban megdöbbentő, érthetetlen hibái

Egyelőre úgy tűnik, nem vált ki egy radiológust a ChatGPT, bár több szempontból is lenyűgöző, amit elért – vagy érthetetlenül elbukott – egy ilyen vizsgán a chatbot.

hvg.hu

Radiológus-vizsgasort raktak kutatók a ChatGPT elé, és egész ígéretesen szerepelt a chatbot – voltak azonban megdöbbentő, érthetetlen hibái

Az OpenAI által fejlesztett ChatGPT-t már több vizsgának is alávetették korábban. Jogi és üzleti vizsgákon egy közepes tanuló szintjét tudta teljesíteni a chatbot, míg egy komplex, több egészségügyi területet felölelő vizsgasorozaton 52,4 és 75 százalék közötti eredményt ért el.

Most ismét egy orvosi feladatsort raktak a kanadai Torontói Általános Kórház (TGH) kutatói a ChatGPT elé, az eredmény pedig alapvetően egészen meggyőző – de azért vannak gyenge pontjai.

A szakemberek egy 150 kérdésből álló feladatsorral adták fel a leckét a chatbotnak – ezek a kérdések hasonlítottak azokhoz, amelyekkel a kanadai és az amerikai radiológiai testületek mérik fel a tanulók tudását. Egy akadályt azért le kellett küzdeni a teszthez, a ChatGPT ugyanis képeket nem tud fogadni bemenetként, így a kutatók csak a szövegeket adták meg a chatbotnak. A kérdéseket – nehézségük szerint – két csoportba osztották, alacsonyabb és magasabb rendű besorolásokba, az eredményeket pedig a Radiology folyóiratban publikálták.

Felmondott „a mesterséges intelligencia keresztapja", és nagyon fél attól, mi lesz ebből az egészből
A mesterséges intelligenciában keresztapaként is emlegetett Geoffrey Hinton több mint egy évtized után távozik a Google-től, hogy szabadon beszélhessen az MI veszélyeiről.

Előbbiek például a téma általános megértését, míg utóbbiak az információk alkalmazását, analizálását és összegzését követelték meg. Egyúttal azt is tesztelték, hogy a jelenleg elérhető két ChatGPT-verzió (az ingyenes változat GPT-3.5-ös változata, valamint az új GPT-4) között van-e különbség, jobb-e az egyik, mint a másik.

Nos, előbbi, a GPT-3.5 eredménye 69 százalékos lett az egész kérdéssorra vetítve. Az alacsonyabb rendű kérdéseknél tudott villantani: itt 84 százalékot ért el, 61 kérdésből 51 volt helyes. A magasabb rendűeknél vérzett el, itt 60 százalékot sikerült abszolválnia, 89 kérdésből 53-at tudott helyesen megválaszolni.

A márciusban bemutatott GPT-4 már 81 százalékos összesített eredménnyel zárt, 150-ből 121 kérdést válaszolt meg helyesen. Az OpenAI a GPT-4 bejelentésekor a komplex kérdések megválaszolásának fejlődését is kiemelte, ami a magasabb rendű kérdéseknél is visszaköszönt: 81 százalékot ért el ezeken a chatbot.

Itt jött azonban a csavar. A GPT-4 ugyanis az alacsonyabb rendű kérdésekből 12 olyat szúrt el, amire a GPT 3.5 még helyesen válaszolt – ez a kutatókat is meglepte, főleg, hogy ezt megelőzően az új változat igen bonyolult radiológiai kérdésekre pontos válasszal szolgált.

Összességében, az átjutáshoz 70 százalékos eredmény szükséges, így a GPT 3.5 egyetlen százalékon bukott el, míg a GPT-4 már bőven átment.

Házipatika és Webbeteg helyett érdemes-e orvosi tanácsért fordulni a mesterséges intelligenciához?
Mennyire megbízható a mesterséges intelligencia, ha egészségügyi, például szűréssel kapcsolatos tanácsokért fordulunk hozzá? - tették fel a kérdést amerikai kutatók.

Ugyan a GPT-4-ben már csökkent az úgynevezett hallucinációk száma – ami a téves információk magabiztos állítását fedi le –, de az orvoslásban az ilyen tévedések végzetesek lehetnek – összegez az Interesting Engineering.

Egyelőre tehát úgy tűnik, hogy nem fogja kiváltani a radiológusokat a nyelvi modell.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Radiológus-vizsgasort raktak kutatók a ChatGPT elé, és egész ígéretesen szerepelt a chatbot – voltak azonban megdöbbentő, érthetetlen hibái

Felmondott „a mesterséges intelligencia keresztapja", és nagyon fél attól, mi lesz ebből az egészből

Házipatika és Webbeteg helyett érdemes-e orvosi tanácsért fordulni a mesterséges intelligenciához?

„Honfoglalózással” hódítják meg a szövetségi államokat az USA-ban a republikánusok és a demokraták

Trump: Inkább nem lennék ott a Putyin-Zelenszkij találkozón

Orbán az ukránokra árulkodott Trumpnál, aki egy felpaprikázott osztályfőnök stílusában válaszolt

Mégis, milyen biztonsági garanciákra számíthat Ukrajna Trump nélkül, csak Európától?

Szijjártó szlovák kollégájával együtt szólította fel Brüsszelt, hogy lépjen fel a Barátság vezeték elleni ukrán támadások ellen

Sokkal nagyobb a pusztítás Munkácson, mint amit eddig látni lehetett

Kéri László: Sulyok Tamás bukhat, durva konfliktusok jöhetnek a Tisza szigeteken belül – Fülke

Vitorláson fotózták le Orbánt, Kaminski Fanny is ott volt a fedélzeten

Magyar Péter: Ungár Anna cégének luxusgépe éppen a horvát szigetre repült, amelynél Orbán Viktor hajózott

Orbán Viktor találkozott a horvát elnökkel a nyaralásán

Megszólalt Prigozsin anyja: A fiam tudta, hogy meg fog halni

Szijjártó és a lengyel külügyminiszter az X-en osztotta egymást

A magyar tisztek délcegek, de a katonáink képzése épp a legfontosabb területeken harmatgyenge

Videón, ahogy a nyílt utcán megöl egy embert a háborús bűnök miatt körözött líbiai tábornok

Bajban lehet a kormány, ha már a közvélemény-kutatók elleni hergelésbe kezdett

Ajsa Luna himnuszénekléséről mondott véleményt az Opera főigazgatója, majd penitenciát írt elő neki

Lord Robert Skidelsky: Európa demográfiai válságára egyetlen megoldás van, anélkül a kontinens kihal

Itthon nincs, vagy rossz, vagy drága, így Szlovákiába járnak át olcsóbb felnőttpelenkáért

Ukrajnának tűzszünet kell, és nem békemegállapodás, ezt kell elmagyarázni Trumpnak

Enyedi Ildikó: Feszült, keserű és méltatlanul alantas a közbeszéd, annál meglepőbb, hogy mennyi kedvességgel találkozik az ember

Para-Kovács Imre: Nárcisz és Pszichó alaszkai tárgyalása

Mária Terézia az asztalra csapott, az oroszok segítettek, a Szent Jobb hazatért