Rámértek, mennyire tud programozni a mesterséges intelligencia, az eredmény kijózanító

A Microsoft kutatói szerint a mesterséges intelligencia nem képes olyan hatékonyan megtalálni egy programkódban lévő hibát, mint az ember.

Bár a legtöbb felhasználó valószínűleg csak egyszerű feladatokhoz – szöveg vagy képalkotáshoz – használja a mesterséges intelligenciát, a különböző modelleket egyre gyakrabban alkalmazzák a programozásban is. A Google vezérigazgatója, Sundar Pichai 2024 őszén azt mondta, hogy a vállalatnál az új kódok 25 százalékát már a mesterséges intelligencia állítja elő, a Meta vezérigazgatója, Mark Zuckerberg pedig szintén azt közölte, hogy a cégen belül széles körben használják az MI kódolási képességeit.

Úgy tűnik azonban, hogy még a legjobb modellek is küzdenek azzal, hogy egy kódban hibát találjanak, miközben ez egy tapasztalt programozó számára nem okoz problémát.

A Microsoft kutatás-fejlesztési részlege által készített új tanulmány szerint a különböző modellek, például az Anthropic Claude 3.7 Sonnet és az OpenAI o3-mini nem teljesítettek jól a hibakeresésben, amikor erre mértek rá a szakemberek. Mindez azt mutatja, hogy a merész kijelentések ellenére az MI még mindig nem ér a szakemberek nyomába az olyan munkaköröknél, mint például a programozás.

HVG Ai5 – Mit okoz nekem ma a mesterséges intelligencia? Mit várhatok holnap?
Megjelent a HVG mesterséges intelligenciával foglalkozó kiadványának ötödik száma.

A szakemberek kilenc különböző modellt teszteltek, amelyek számos hibakereső eszközhöz fértek hozzá. A feladat adott volt: meg kellett oldani a teljesítmény mérését szolgáló SWE-bench Lite 300 darab hibakeresési feladatát. Az eredmények egyértelműek: a legjobban teljesítő Claude 3.7 Sonnet érte el a legmagasabb átlagos sikerarányt (48,4 százalék), ezt követte az OpenAI o1 (30,2 százalék) és az o3-mini (22,1 százalék).

A szakemberek szerint az alulteljesítésnek több oka volt: egyfelől nehezen fértek hozzá a hibakereső eszközökhöz, másfelől pedig egyszerűen arról van szó, hogy a fejlesztők nem tanították be eléggé az ilyen feladatok elvégzésére az MI-t. A jövőben a finomhangolás és a speciális adatokon való modellbetanítás segíthet majd javítani a teljesítményt – írja a TechCrunch.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Andie MacDowell a HVG-nek: Nem volt szexualitás a karakterembem, féltem, hogy elveszek a forgatagban

Forrnak az indulatok Szijjártó Péter minisztériumában: diplomáciai tapasztalat nélküli expapot neveztek ki fontos pozícióba

A londoni nagykövetségen elsőbeosztotti státuszba került Németh Norbert – ez a pozíció elvileg a diplomáciai szakma egyik csúcsa.

Rámértek, mennyire tud programozni a mesterséges intelligencia, az eredmény kijózanító

HVG Ai5 – Mit okoz nekem ma a mesterséges intelligencia? Mit várhatok holnap?

Andie MacDowell a HVG-nek: Nem volt szexualitás a karakterembem, féltem, hogy elveszek a forgatagban

„Úgy volt, hogy ma is megyek Munkácsra, de a történtek után: dehogyis megyek"

Orbán Viktor leírta: oroszok rakétával támadták a munkácsi gyárat

Itt a Sándor-palota magyarázata: ezért törölte Sulyok Tamás az „orosz” szót a munkácsi rakétatámadásról szóló posztjából

Kaiser: Heteken át tervezhették az oroszok a Munkács elleni támadást

Lakner Zoltán: A magyar kormányzat ma bebizonyította, hogy meddig tart a szuverenitása Putyinnal szemben, semeddig

Forrnak az indulatok Szijjártó Péter minisztériumában: diplomáciai tapasztalat nélküli expapot neveztek ki fontos pozícióba

Ki volt a tűzijáték közben árulónak nevezett uralkodó, akiről szeretnék, hogy Magyar Péter jusson eszünkbe?

Az édesanya a nagydorogi csecsemőgyilkosság gyanúsítottja

Valaki egyszer nem szigorú vigyázállásban énekelte a Himnuszt, a kormánysajtó máris nekiesett

Megvolt a lengyel elnök első vétója

Lovat találtak az óbudai panelek közt szerda este

Karácsony Gergely: A forgalomból kivont buszokat már 2021-ben selejteztük volna, ha a kormány engedi

Dobszay János: Kibicnek drága

Milorad Dodik már nem elnök, de Budapest, Belgrád és Moszkva támogatásával verné szét Boszniát

Reviczky Gábor: „Háromfajta rákom volt”

Marabu Féknyúz: Orbán turnézik

Ukrajnának tűzszünet kell, és nem békemegállapodás, ezt kell elmagyarázni Trumpnak

Enyedi Ildikó: Feszült, keserű és méltatlanul alantas a közbeszéd, annál meglepőbb, hogy mennyi kedvességgel találkozik az ember

Para-Kovács Imre: Nárcisz és Pszichó alaszkai tárgyalása

Mária Terézia az asztalra csapott, az oroszok segítettek, a Szent Jobb hazatért