Úgy tűnik, nemcsak az OpenAI mesterséges intelligenciája brillírozott a világ egyik legnehezebb matematikai versenyén, a Nemzetközi Matematikai Diákolimpián (IMO). A Google MI-kutató részlege, a DeepMind nemrég bejelentette: a Gemini egy továbbfejlesztett változata hivatalosan is aranyérmes teljesítményt nyújtott azáltal, hogy hat feladatból ötöt sikerült megoldania – írja a Venture Beat.
Az eredmény nemcsak a Google számára fontos, hanem azt is megmutatja, hogy az MI most már képes komplex matematikai problémákat megoldani természetes nyelvi megértéssel – vagyis úgy, ahogy arra az ember is képes – ahelyett, hogy speciális programozási nyelvekre lenne szükség ehhez.
Az IMO-ra az országok legfeljebb hat diákot küldhetnek ki, ahol rendkívül nehéz matematikai feladatokat kell megoldaniuk. Ezek a feladatok látszólag egyszerűek, de gyakran némi kreativitást igényelnek ahhoz, hogy minden esetben a legmagasabb pontszámot lehessen megszerezni. Az idei, július 10-e és július 20-a között zajló versenyen 630 versenyző vett részt, és csak 67-en tudtak aranyérmet szerezni.
A Google mostani sikere messze felülmúlja a 2024-es teljesítményét, amikor a vállalat egyesített AlphaProof és AlphaGeometry rendszerei ezüstérmet szereztek azzal, hogy hatból négy feladatot sikerült megoldaniuk. Az idei áttörést a Gemini Deep Think hozta meg, egy továbbfejlesztett érvelési rendszer, amely az úgynevezett „párhuzamos gondolkodás” technikáját alkalmazza. A hagyományos, egyetlen érvelési láncot követő MI-modellekkel ellentétben a Deep Think egyszerre több lehetséges megoldást is vizsgál, mielőtt megadná a végső választ.
Ennek köszönhetően a rendszer a verseny 4,5 órás időkeretén belül érte el az aranyérmes teljesítményt.
A modell 42-ből 35 pontot ért el, vagyis pont annyit szerzett meg, mint az OpenAI fejlesztése.
A Google közlése szerint azért nem tette hamarabb közzé az eredményeket, mert az IMO kérése az volt, hogy addig ne publikáljanak a cégek, amíg az eredményeket nem ellenőrzi a megfelelő bizottság. Ezt a kérést azonban megkerülte az OpenAI, ami miatt a cég bejelentését negatív megítélés kísérte – írja a Venture Beat.
De visszatérve a Google eredményéhez: a Google DeepMind sikere úgy tűnik, az újszerű betanítási technikáknak köszönhető, amelyek túlmutatnak a hagyományos megközelítéseken. A csapat fejlett megerősítéses tanulási módszereket alkalmazott, amelyek célja a többlépéses érvelés, a problémamegoldás és a tételbizonyítási adatok felhasználása volt. A modell emellett hozzáférést kapott kiváló minőségű matematikai megoldások válogatott gyűjteményéhez, és konkrét útmutatást kapott az IMO-stílusú problémák megközelítéséhez.
A modell különösen lenyűgöző érveléssel állt elő egy olyan problémában, ahol sok emberi versenytárs posztgraduális szintű matematikai fogalmakat alkalmazott. A DeepMind kutatója, Junehyuk Jung szerint a Gemini „csak az elemi számelméletet használta fel egy önálló bizonyítás megalkotásához”, ami elegánsabb megoldást jelentett, mint amikkel számos versenyző állt elő.
A kérdés, hogy az ilyen érvelési modelleket lehet-e alkalmazni más területeken is, és képes lehet-e áttörést hozni az MI-piacon. A matematikai feladatok ugyanis jól körülhatárolt szabályrendszer alapján oldhatók meg, miközben a való életben sokrétű döntéseket kell hozni.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.