szerző:
hvg.hu
Tetszett a cikk?

A DALL-E 2 nevű mesterséges intelligenciának elég egyetlen mondatot adni: azt nemcsak megérti, de egy képet is készít belőle.

Bő egy évvel ezelőtt egy igen izgalmas mesterséges intelligenciát mutatott be Elon Musk egyik vállalkozása, az OpenAI. Ez a DALL-E, amelynek neve az ismert Pixar-mese, a Wall-E, valamint a világhírű festő, Salvador Dali nevének kombinációjából jött össze, és ami képes bármit szinte bármilyen stílusban megrajzolni.

Ennek alapját egy olyan szövegértésre készített algoritmus adja, ami képes a komplex leírásokat is értelmezni, majd ha ez megtörtént, a program képet konvertál abból. Bár az első verzió is szépen dolgozott, a szoftvernek most elkészült az újabb változata: ez lett a DALL-E 2, ami az elődjéhez képest sokkal jobban teljesít – írja a TechCrunch.

Ez a gyakorlatban azt jelenti, hogy nagyobb és részletesebb képeket készít, mint az előző verzió. Emellett gyorsabb is annak ellenére, hogy több képet kell létrehoznia. Az alábbi képen például a bemeneti szöveg az alábbi volt:

Egy tengeri vidra a Leány gyöngy fülbevalóval stílusában.

OpenAI

További újdonság, hogy amit az ember festésnek hív, az ebben az esetben nem más, mint egy kép adott területének intelligens helyettesítése. Például, ha egy olyan helyről készül kép, ahol van néhány mosatlan edény az asztalon, akkor elég csak kiválasztani az adott területet, majd megmondani, hogy mit szeretnénk látni – például egy „üres asztalt”, vagy egy „asztalt edények nélkül”. A modell másodpercekkel később megmutatja, ő miként értelmezte a feladatot, és milyen végeredményt hozott létre. A felkínált lehetőségekből pedig a felhasználó kiválaszthatja azt, amit látni szeretne.

Mivel a program felméri azt is, hogy milyen az adott képen a kicserélendő elem környezete, így azt is pontosan tudni fogja, hogy milyen anyagokat és színeket használjon, hogy ne üssön el a kicserélt rész a többi résztől.

Plüssmackók ukijo-e stílusban, és egy furcsa virágbolt.
OpenAI

Egy harmadik lehetőség a használatára, hogy adunk a rendszernek egy példaképet, és abból annyi változatot készít, amennyit csak szeretnénk.

Mivel a szoftver gyakorlatilag bármit meg tudna rajzolni, ezért néhány korlátozást vezetett be az OpenAI, hogy elejét vegye a visszaéléseknek és hamisításoknak. Az egyik ilyen, hogy a programot csak meghívásos alapon, ellenőrzött környezetben lehet használni. Ennek eredményeként nem lehet másokat sértő vagy megtévesztő, de erőszakos képeket sem készíttetni vele. Az eredményeket pedig moderátorok nézik át.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!