Elveszik a munkát a robot festők? – DALL-E

Az elmúlt hónapokban egyre elterjedtebbé váltak az úgynevezett „text-to-art” szoftverek, amelyek néhány begépelt szó alapján komplex képeket készítenek. Kipróbáltuk a DALL-E-t, az egyik legfejlettebb ilyen mesterséges intelligenciát.

Évek óta léteznek olyan programok, amelyek képeket generálnak, de ezek nem terjedtek el széles körben, mivel működésük inkonzisztensnek bizonyult. A nagy fordulópontot az idei év áprilisa jelentette, amikor az OpenAI a nyilvánosság elé tárta a DALL-E 2 névre hallgató szoftvert.


Ez a mesterséges intelligencia már néhány begépelt szó alapján is komplex, egyedi képeket készít. Az OpenAI jóvoltából szerkesztőségünk kipróbálhatta a forradalmi fejlesztést.

Első benyomások

Az első néhány generálás nem azt az eredményt hozta, amit vártam. A kép minősége kétségbevonhatatlanul elsőosztályú lett, viszont nem azt ábrázolta, amit begépeltem. Világossá vált, hogy ki kell ismerni, hogyan is kell megfogalmazni egy mondatot, milyen szórendet kell használni, ahhoz hogy az AI a lehető legpontosabban megértse mit is várok tőle.

A legelső generált kép, begépelt mondat: Portré egy emberről egy újságban, akinek ki van takarva a szeme.

A DALL-E megértése

Annak ellenére, hogy az első néhány próbálkozás nem biztos, hogy úgy fog sikerülni, ahogy elképzeljük, úgy gondolom, hogy a DALL-E használata mindenki számára könnyen megtanulható. Csupán 4-5 próbálkozás kellet ahhoz, hogy úgy érezzem, magabiztosan tudom kezelni az algoritmust. 

Mivel a képelőállítás – az írástudáson kívül – semmilyen előzetes ismeretet nem igényel, és az AI-t futtató weboldal is letisztult, egyszerű és egyértelmű, az informatika világától távol álló embereknek sem okozhat gondot a képalkotó igénybevétele. Egy valamire azért szükségünk lesz: némi angol tudásra. Az alkalmazás egyelőre még nem ismeri a magyar nyelvet, ezért elengedhetetlen, hogy meg tudjuk fogalmazni kívánságainkat angolul.

Begépelt mondat: Egy tál leves, amiben vitorlások úsznak

Mire képes a DALL-E?

A DALL-E nem csak azt ígéri, hogy bármilyen képet elkészít a számunkra, hanem azt is, hogy bármilyen stílusban. Mi választhatunk, hogy az adott kép realisztikus legyen és egy fotóhoz hasonlítson, hogy olyan legyen mint egy digitálisan létrehozott kép vagy mintha vízfestékkel, illetve olajfestékkel festették volna.

A készítők szerint találmányuk akár konkrét festők, művészek stílusjegyeit is képes felismerni és lemásolni. Így megtudhatjuk, hogyan nézne ki egy mai okostelefon, ha van Gogh vagy da Vinci festette volna le vagy. Természetesen le akartam tesztelni, hogy valóban képes-e erre a szoftver, ezért megnéztem mennyire tudja kedvenc képzőművészem, Hieronymus Bosch egyedi stílusát. Az eredmény alulmúlta várakozásaimat. Bár felismerhetőek közös jegyek a művész festményei és a mesterséges intelligencia képe között, a különbség mégis óriási.

Begépelt mondat: Zenei fesztivál, Hieronymus Bosch stílusában festve

Elvehetik a munkát a festő robotok?

Szeptemberben művészek körében nagy felháborodást okozott, amikor egy mesterséges intelligencia által generált kép megnyert egy szépművészeti versenyt. Az esetet követően jogosan merül fel a kérdés, hogy ha a szoftverek képei megkülönböztethetetlenek az emberi alkotásoktól, akkor nem válnak-e feleslegessé a képzőművészek, grafikusok? Az AI azonnal kész terméket nyújt, míg egy grafikus munkájára akár napokat-heteket is kellhet várni a projekt bonyolultságától függően. Emellett az AI jóval olcsóbb is, a DALL-E például 15 amerikai dollárért, azaz kevesebb, mint 7000 forintért, 115 kép generálási lehetőséget kínál. Ez az összeg még egy olcsó grafikusnál sem biztos, hogy elegendő egy komplex munka költségeinek fedezésére.


Ennek fényében tényleg lehetséges volna, hogy a jövőben ezt a szakmát teljesen elveszik az emberektől a mesterséges intelligenciák? Erről a témáról részletesen beszélünk tudományos podcastunk első adásában, melyet ide kattintva lehet meghallgatni.

Begépelt mondat: Próbababák egy tengerparton