szerző:
HVG
Tetszett a cikk?

Az OpenAI bejelentése szerint minden felhasználó megkapja a ChatGPT új funkcióját, amivel parancs, beszélgetés és egy másik kép alapján is lehet képet generáltatni a mesterséges intelligenciával.

Hamarosan igen hasznos funkcióval bővül a ChatGPT: az OpenAI bejelentette, a felhasználók közvetlenül a chatbottal tudnak majd képeket generáltatni. Az újdonságot a ChatGPT Plus, Pro és a Team előfizetői is megkapják, de ami még ennél is fontosabb, az ingyenes verziót használók is hozzáférnek majd. Mindez azt jelenti, hogy a jövőben már nem kell külön elindítani a DALL-E-t, hogy képet készítsen valaki az OpenAI mesterséges intelligenciájával. Az újdonságot a Sora, a vállalat videógenerátora is megkapja majd.

A cég állítása szerint a rendszer kiváló minőségű képeket tud készíteni a szöveges prompt, egy beszélgetés vagy egy feltöltött fájl alapján. Ez utóbbi azt is jelenti, hogy át tudja alakítani a már meglévő képeket a hozzá megadott szöveges utasítások alapján. Emellett a cég javított a szöveges megjelenítésen és a kontextusokat is jobban érti a rendszer.

Mivel a funkciót személyes és professzionális felhasználásra is ajánlja az OpenAI, így igen különböző képeket lehet vele generáltatni. Ezek közé tartoznak az infografikák, a közösségi oldalakra szánt anyagok és a rengeteg szöveget tartalmazó képek létrehozása is. Ez utóbbira az alábbi példát hozta az OpenAI.

OpenAI

A cég szerint a rendszer kiváló minőségű, fotorealisztikus képeket tud előállítani, a kontextus megértése pedig nagyot lépett előre. Ha például a művészettörténetről beszélget a ChatGPT-vel az ember, akkor képes úgy is képet készíteni, hogy ha a felhasználó arra utal, hogy a korábban említett korszakot vizualizálja.

OpenAI on X (formerly Twitter): “Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqNText and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx / X”

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqNText and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx

A modell a GPT-4o modellre épül, ahol az o az omni szó rövidítése. Ez a rendszer multimodális képességeire utal.

A vállalat mostani lépése ahhoz visz közelebb, amiről Sam Altman néhány hete beszélt. Az OpenAI vezérigazgatója szerint a cél, hogy egy egységes mesterséges intelligencia jöjjön létre a tartalmak kezelésére és készítésére.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!