szerző:
MTI
Tetszett a cikk?

Az Eötvös Loránd Tudományegyetem (ELTE) kutatói az emberi agy kapcsolatainak leírását használták innovatív gépi tanulási módszerek teszteléséhez. Az új módszer a Newton-elmosás nevet kapta, és nemcsak a képi adatokat lehet megsokszorozni vele, hanem kémiai és biológiai adathalmazokra is alkalmazható.

Az ELTE kutatói szerint a mesterséges intelligencia felhasználásaiban és a gépi tanulásban szükség van olyan óriási, oktató adathalmazokra, amelyekkel hatékonyan meg lehet tanítani a programokat arra, hogy az adatok bizonyos sajátságait felismerjék. Sokszor azonban nem állnak rendelkezésre milliós adathalmazok. Ezekben az esetekben adatsokszorozást, úgynevezett augmentálást végeznek az adatokon.

A közleményben példaként említik, hogy az önvezető autó vezérlésének beállításakor a közlekedési szituációkat leíró képek egy-egy – többnyire nem lényeges – részét elhomályosítják, elmossák, és így egyetlen eredetiből sok képet tudnak származtatni. A módszer a népszerű képszerkesztő programokban is megtalálható Gauss-homályosítás vagy elmosás (Gaussian blurring).

Pixabay/geralt

Az eljárás azonban a biológiai, kémiai szerkezetek és képletek esetében nem működik: erre a problémára kerestek megoldást a magyar kutatók. Az ELTE Matematikai Intézete PIT Bioinformatikai Csoportjának kutatói – Keresztes László, Szögi Evelin és Varga Bálint Grolmusz Vince professzor vezetésével – kidolgozták a Newton-elmosás módszerét, amellyel nem csak képi adatokat lehet megsokszorozni.

Az új, Newton-elmosás az adatok javítási mechanizmusát variálja: a nagyobb megbízhatóság kedvéért többször mérünk vagy számolunk ki valamilyen mennyiséget, és ezeket átlagolva használjuk. Ha valamit például tízszer mérünk meg, és a 10 mérésből minden lehetséges módon kiválasztunk mondjuk 7-et, és ezeket külön-külön átlagoljuk, akkor az adatokat megsokszorozhatjuk annyiszor, ahányszor 10 adatból 7-et ki lehet választani, a példában ez éppen 120.

„Az ELTE-s kutatók módszere nem visz be mesterséges „homályosítást”, mint a Gauss-elmosás, hanem az adatjavításba avatkozik bele: a megsokszorozott adatok minősége jobb, mint az egyedi adatoké, hiszen – a példánkban – hét mérés eredményeit átlagoltuk” – magyarázzák a kutatók.

Forschungszentrum Julich / Katrin Amunts

A kutatók a Newton-elmosást először az emberi agy kapcsolatait leíró, 1 053 alanytól származó agygráfokra alkalmazták, és így az adathalmaz méretét százhúszszorosára növelték, azaz, mint írják, 126 360 agygráfot készítettek az adathalmazból.

A kutatók minden agygráfot öt különböző felbontásban számoltak ki, így 5-ször 126 360, azaz 631 800 agygráfot tehettek közzé. A megnövelt adathalmazon igazolták a módszer használhatóságát a gépi tanulásban.

A közlemény szerint az új agygráfok kiszámítása mintegy három hetet vett igénybe a kutatócsoport 36 számítógépén. Az új, a szerzők által Newton-elmosásnak nevezett módszer nem csak agygráfokra, de sok más, köztük kémiai és biológiai adathalmazra is használható.

Az ELTE kutatóinak tanulmánya a Scientific Reports című szaklapban jelent meg februárban.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!