szerző:
hvg.hu
Tetszett a cikk?

Nem hiányozhat a mesterséges intelligenciára alapuló megoldások hosszú sora a TIME magazin 2023 legjobb találmányait bemutató listáról. Nézzük a legizgalmasabb MI-innovációkat.

Nincs reprezentatív kutatásunk, de valószínűleg nem túlzás azt állítani, hogy a legtöbb idei újításnak így vagy úgy, de része a mesterséges intelligencia (MI) kapcsolódik. Bár a tudósok évtizedek óta dolgoznak ezeken megoldásokon, igazán nagy lökést akkor kapott a terület, amikor az OpenAI 2022 végén bemutatta a ChatGPT-t. Ennek fényében nem túl meglepő, hogy a TIME magazin összesítésében – amelyben az év 200 legjobb innovációját szedte össze a lap –, 14 olyan fejlesztést is találunk, amit az MI hajt.

Photoshop-megoldások

Az Adobe jókorát okosított a Photoshopon: a a Generative Expand és a Generative Fill funkciók közül előbbi kiszélesíti a perspektívát, amelyben a kép készült – magyarul: nagyobb látószögből láthatjuk ugyanazt a témát –, míg a második kitöröl vagy hozzáad bizonyos elemeket a felvételhez. Ehhez csak be kell gépelni a megfelelő parancsot, és már meg is oldja a feladatot a rendszer, ami új korszakot nyithat a képszerkesztésben – és a képhamisításban is, de ez egy másik történt. A funkciók mögött a Firefly, az Adobe saját MI-alapú képgenerátora dolgozik.

OpenAI GPT-4

Az OpenAI márciusban mutatta be a GPT-4 modellt, ami azóta is az egyik legerősebb MI, ami a nyilvánosság számára is elérhető chatbotot üzemeltet. Míg az elődje, a ChatGPT csupán az ügyvédi vizsgát letevő hallgatók 10 százalékát múlta felül, a GPT-4 már a 90 százalékuknál bizonyult jobbnak. Ügyesen érvel, bonyolult fogalmakat képes egyszerűsíteni, és el tudja magyarázni, mitől vicces egy vicc.

Runway Gen-2

A Runway neve ismerős lehet a szemfülesebb filmrajongók számára, ez volt ugyanis az a cég, amelynek vizuális effektusait láthatjuk a Minden, mindenhol, mindenkor című Oscar-díjas filmben. A cég a nyáron mutatta be MI-modellje újabb változatát, a Gen-2-t, amely segítségével bárki képes teljes értékű videót generálni szöveges parancsokból, képekből vagy más videókból. A Runway társalapítója és vezérigazgatója, Cristóbal Valenzuela szerint a fejlesztés annyira fontos, mint a kamera volt, amikor 200 évvel ezelőtt feltalálták.

FeaturePrint

Az Alitheon nevű cég újdonsága, a FeaturePrint a mesterséges intelligencia segítségével, a telefon kameráján keresztül képes megállapítani, hogy egy adott termék eredeti-e, vagy hamis. A rendszer egyedi jellemzőket keres, és ha nem találja meg az összeset, amellyel az adott tárgynak mindenképp rendelkeznie kellene, akkor jelez, hogy hamisítványról van szó.

Alitheon

City-Wide Drone Detection

A fejlesztés a Dedrone nevű amerikai cég nevéhez fűződik, a lényege pedig, hogy riasztást küld a hatóságoknak, ha egy drón egy meghatározott földrajzi terület fölé merészkedik. Mindezt másodpercek alatt teszi meg, így a hatóságok szinte azonnal reagálhatnak. A cég ügyfelei között a barcelonai rendőrséget, illetve számos repteret is megtalálni.

SeamlessM4T

A Meta fejlesztése a vállalat eddig használt fordítóprogramját váltotta le, az új mögött pedig már a mesterséges intelligencia dolgozik. Ennek köszönhetően 100 nyelvet képes megérteni és lefordítani az algoritmus, mindezt valós időben. A Meta szerint teljesen mindegy, hogy milyen típusú fordításról van szó – szöveg-szöveg alapúról, vagy esetleg élő beszédet kell élő beszédként tolmácsolni –, az újdonság megállja a helyét. A megoldás képes egy szövegen belül több nyelvet is felismerni. Nyílt forráskódú.

So-VITS-SVC

A listában a TikTokon Ghostwriter néven tevékenykedő felhasználó fejlesztése is helyett kapott. Ez a mesterséges intelligencia segítségével készített egy dalt, ami úgy szól, mintha Drake és a The Weeknd közös szerzeménye lenne. Csakhogy a hangokat a mesterséges intelligencia generálta, ami olyan meggyőzőre sikerült, hogy a dal még a streamingszolgáltatóknál is fellelhető volt – amíg rá nem jöttek a csalásra.

AlertCalifornia és Cal Fire

Az elmúlt években egyre súlyosabb problémát jelentenek az Egyesült Államokban – főként Kaliforniában – az erdőtüzek. A Kaliforniai Egyetem tudósai ezért egy olyan mesterséges intelligenciát fejlesztettek ki, amely detektálja és azonnal jelzi a hatóságoknak, ha valahol tűz ütne ki. Az algoritmus egy kamerahálózat képeit elemzi valós időben. A rendszer már éles helyzetben is vizsgázott, segítségével 45 perc alatt sikerült megfékezni a felcsapó lángokat.

AFP/Desiree Martin

Stable Audio

A Stability AI által létrehozott generatív mesterséges intelligencia, a Stable Audio egy olyan zenekészítő algoritmus, ami képes néhány beírt utasítás alapján bármilyen hangot vagy dalt legenerálni. A rendszert egy olyan weboldalon képezték ki, ami több mint 800 000 hangfájlt tartalmaz. A végeredményt bárki letöltheti és szabadon felhasználhatja, annyi megkötéssel, hogy a forrást meg kell jelölni.

TrailGuard AI

Az orvvadászattal veszi fel a küzdelmet az amerikai Resolve fejlesztése, a TrailGuard AI. A cég egy olyan kütyüt készített, ami a kamerái segítségével érzékeli, ha egy ember közelít egy veszélyeztetett állat felé. A kütyü 30 másodperc alatt képes továbbítani a képet a hatóságoknak, így azok gyorsan tudnak reagálni a történésekre. A segítségével eddig 30 orvvadászt tartóztattak le Afrikában és Indiában.

Dall-E 3

Az OpenAI az idei évben tette elérhetővé a képgeneráló mesterséges intelligencia, a Dall-E legújabb változatát, a Dall-E 3-at. Az újdonság az elődökkel ellentétben már érti a természetes nyelvet, így úgy adhatunk neki információt, mint a ChatGPT-nek.

Project Gutenberg Open Audiobook Collection

Még az 1970-es években indult el a Project Gutenberg nevű kezdeményezés, melynek lényege, hogy az e-könyvek hozzáférhetők legyenek. A Microsoft és a Massachusettsi Műszaki Egyetem nemrég összefogott, és egy olyan mesterséges intelligenciát készített, ami 5000 ingyenesen elérhető könyvből csinált narrált hangoskönyvet. A gyűjtemény már elérhető a Spotify-on.

AudioShake

Maradva a hangokkal foglalkozó mesterséges intelligenciánál, a Time az AudioShake-et is beválogatta az idei év legjobb MI-fejlesztései közé. A szoftver képes arra, hogy a hangsávokból összeállított dalt újra elemeire bontsa, így úgy vehető ki például a gitár a zenéből, hogy semmilyen más hangszer nem hallatszódik közben.

Humane AI Pin

Igen izgalmas elképzeléssel állt elő nemrég a Humane nevű amerikai cég. Az Apple két volt alkalmazottja által életre hívott vállalat olyan eszközt fejleszt, amely az alapítók reménye az okostelefonokkal is leszámolhat: kijelzője nincs, ehelyett az ember kezére vetíti az információkat.

Humane

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!