Elindult a Chatbot Arena, pár kattintással egymásnak engedheti a mesterséges intelligenciákat, hogy melyik ad jobb válaszokat

A Kaliforniai Egyetem oktatói és hallgatói egy nem mindennapi küzdőteret fejlesztettek, amit bárki kipróbálhat. Chatbotokat lehet ugyanarra a feladatra felkérni, majd eldönteni, melyik teljesített jobban.

hvg.hu

Azóta, hogy tavaly novemberben nyilvánosság elé került az OpenAI ChatGPT-je, megszaporodtak a mesterséges intelligencia alapú projektek. A legnagyobb technológiai vállalatok szinte azonnal kijöttek saját vagy sajátjuknak tekintett megoldásokkal, de azért a kisebb cégek sem akartak lemaradni. Az eredmény: csak úgy kapkodjuk a fejünket, annyiféle chatbot (ChatGPT-alternatíva) van ma már.

Ezek a chatbotok eltérőek, különböző nagy nyelvi modellt (large language model, LLM-et) használnak, más a felhasználói felületük, az áruk stb. Hogy némi rendet vágjanak ebben a káoszban, a Kaliforniai Egyetem kutatói és diákjai, pontosabban az általuk alapított nyílt kutatószervezet, a Large Model Systems Organization (LMYSY Org) létrehozták a Chatbot Arenát, egy mesterségesintelligencia-csatateret.

A Chatbot Arena tulajdonképpen egy benchmark platform az LLM-ek számára, ahol a felhasználó két véletlenszerűen választott modellt tesztelhet egy feladattal (pl. írjon egy meghatározott e-mailt), majd kiválaszthatja a legjobb választ anélkül, hogy tudná, melyik LLM áll az egyes válaszok mögött. Ezután már látható, hogy mely LLM-eket használták a kimenet létrehozásához.

A felhasználói értékelések eredményeit az LLM-ek rangsorolására használják fel egy Elo minősítési rendszeren alapuló ranglistán, amely a sakkban széles körben használt értékelési rendszer. A ranglista éllovasa (nem meglepő módon) a GPT-4, az OpenAI legfejlettebb LLM-je. A második helyre a Claude-v1, az Anthropic által kifejlesztett LLM került. Ez utóbbi még nem érhető el a nyilvánosság számára, de van egy várólista, ahol a felhasználók regisztrálhatnak a korai hozzáférésre.

A nyolcadik helyen áll a ranglistán a PaLM-Chat-Bison-001, a PaLM 2 almodellje, a Google Bard mögött álló LLM. Ez a helyezés megfelel a Barddal kapcsolatos általános vélekedésnek, miszerint nem a legrosszabb, de nem is tartozik a legjobbak közé.

A ZDNet arra a lehetőségre is felhívja a figyelmet, hogy a Chatbot Arena oldalán össze is lehet hasonlítani két modellt. Ez a funkció akkor lehet hasznos, ha valakit a konkrét LLM-ek érdekelnek. A Chatbot Arena jelenleg húsz különböző nyelvi modellt tartalmaz, köztük nyílt forráskódú megoldásokat is az internetről.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások

Elindult a Chatbot Arena, pár kattintással egymásnak engedheti a mesterséges intelligenciákat, hogy melyik ad jobb válaszokat

Kiszáradó Duna, kifogyó import, a drágulásra felkészítő Magyar Péter: minden jel arra utal, hogy nem tartható a dízelár

Anyázással kezelni az egészségügyet? – Hegedűs Zsolt beleállt Takács Péterbe

A Tisza-kormány első megbicsaklása után Magyar Péter is körültekintőbbé vált

Kapitány István kinevezte az embert, aki a külföldi befektetések Magyarországra hozataláért fog felelni

Kemény vélemény született Magyarországról: hőség és halmozódó feszültségek

Megszűnt az utolsó NAV-végrehajtás is Balásy Gyula cégeinél

A Szőlő utcai nevelőintézet egykori lakójának oldalán megnevezték „Zsolti bácsit”

Miért kerül egy jó gulyás kilencezer forintba? És egy rántott hús ötezerbe? Lebontottuk a magyar éttermi fogások árát

Orbán fapadoson repül – ezt látta a Frankfurter Allgemeine tudósítója Budapesten

Legalább 150 millió forint kenőpénz elfogadásával gyanúsították meg Bús Balázst

Altatógázos rablók fosztottak ki a magyar turistákat az olasz tengerparton

Harmadfokú hőségriasztást rendelt el az országos tiszti főorvos csütörtöktől keddig

Hiába járt le a megbízatása a volt berni nagykövetnek, párja évekig használta még diplomata-útlevélét

Japán déli részét nagyon erős földrengés rázta meg – videók

Sok halottal számolnak a hatóságok, miután a földrengés után robbanás volt egy japán bevásárlóközpontban

Elképesztő videón, ahogy fákat tép ki a szélvihar Fülesden

Váratlan kérdéssel szólíott meg az indiai ételfutár

A szolgálatból is távozik az a pénzügyőr tábornok, akinek a rendezvényén márciusban meghalt egy kollégája

Török Gábor: A Fidesz helyzete sok szempontból rosszabb, mint az MSZP-é volt 2010-ben

Nagy Ervin Hankó Balázsnak: Nincs értelme tagadni, hiszen az aláírása ott virít mindenhol

Para-Kovács Imre: Szijjártó Péter, a fehér majom

Orbán formális és informális befolyása még soha nem volt olyan alacsony a Fideszben, mint most

Hét olyan terület van, ahol a legsúlyosabb a helyzet – interjú Buga László fekvőbeteg-ellátásért felelős államtitkárral

Elhunyt a „trollkodó” filozófus, aki 14 évesen verset írt Nagy Imréék kivégzéséről