Bár a kínai Alibaba neve sokakban az e-kereskedelmet idézi (nem is alaptalanul), azonban a vállalat alapvető üzleti prioritásként kezeli a mesterséges intelligenciát is. Ehhez kapcsolódik, hogy a MI-világ egyik vezető hardverszállítójával az Nvidiával kötött partnerséget, illetve hogy piacra dobott egy nagy nyelvi modellt, a cég eddigi legnagyobb és legképzettebb modelljét. A Qwen3-MAX több mint egybillió paramétert, vagyis változót tartalmaz, amelyek meghatározzák, hogyan dolgozza fel egy mesterséges intelligencia rendszer az információkat.
De nem csupán az egybillió paraméter lenyűgöző, hanem az is, hogy a modell állítólag 36 billió tokenen lett előképezve. Akár egymillió szó vagy szimbólum hosszúságú bemeneteket is képes feldolgozni – ami nagyjából több könyv hosszát teszi ki –, ami messze meghaladja a mai mesterséges intelligencia rendszerek képességeit. Mixture of Experts (Szakértők keveréke) elnevezésű kialakításának a lényege, hogy olyan, mintha egy igazán okos csapat lenne, ahol mindig csak azok a megfelelő szakértők lépnek be, akikre éppen szükség van. Ahelyett tehát, hogy minden alkalommal aktiválnák a teljes billió paraméteres hálózatot, minden egyes továbbításkor csak bizonyos részhalmazok indulnak el, és ez így sokkal hatékonyabb, mintha csak nyers számításokkal próbálnák megoldani a feladatot.

Egy blogbejegyzésben azt is közölték, hogy új módszerekkel finomították a betanítási folyamatot, így az hatékonyabb és megbízhatóbb lett. Az egyik megközelítés, a ChunkFlow, megháromszorozta a rendszer sebességét hosszú bemenetek esetén, miközben az általános betanítási hatékonyság 30 százalékkal javult az előző Qwen2.5-höz képest. Új biztonsági intézkedések pedig a korábbi modellekhez képest a töredékére csökkentik a hardverhibák miatti állásidőt.
A vállalat éves konferenciáján bemutatott modellről az Alibaba Cloud technológiai igazgatója, Zhou Jingren azt állította, hogy különösen erős a kódgenerálás és az autonóm ágensek képességei terén. Mindez pedig azt (is) jelenti, hogy a mesterséges intelligencia rendszer kevesebb emberi utasítást igényel, mint egy chatbot, és önállóan képes döntéseket hozni és cselekedni az emberi felhasználó által kitűzött cél elérése érdekében.
Jelenleg két verzió bevezetése történik: az Instruct modell már működik az Alibaba Cloudon és a Qwen Chaten, míg egy fejlettebb „Thinking” verzió, amely az érvelésre és az eszközintegrációra összpontosít, még fejlesztés alatt áll. A fejlesztők az OpenAI-val kompatibilis API-kon keresztül csatlakozhatnak a Qwen3-Maxhoz, így azok, akik más vezető modellekkel dolgoztak, könnyebben építhetnek az Alibaba platformjára – tájékoztat az eWeek.
A Qwen3-MAX a tesztekben is igen jól szerepelt. A Qwen3-MAX-Instruct, a modell egyik változatának előzetes verziója a harmadik helyen végzett a Text Arena ranglistáján, bizonyos tesztekben megelőzve a GPT-5-Chatet. Az SWE-Bench Verified teszten, amely a valós kódolási feladatok megoldását méri, 69,6 pontot ért el – ez felülmúlja a DeepSeek V3.1-et, és versenyképes a Claude Opus 4-gyel. A Tau2-Bench teszten pedig, amely a mesterséges intelligencia modelljeinek eszközhasználatát firtatja, áttörést jelentő 74,8 pontot ért el, megelőzve mind a Claude Opus 4-et, mind a DeepSeek V3.1-et.
A Qwen3-MAX mellett az Alibaba bemutatta a Qwen3-Omnit is, egy multimodális rendszert olyan alkalmazásokhoz, mint az okosszemüvegek és az intelligens műszerfalak. A lépés azt jelzi, hogy a vállalat nemcsak a kutatókat és a fejlesztőket célozza meg, hanem a mesterséges intelligencia integrálását is a fogyasztói eszközökbe.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.