AI Art to nie ilustracja. To imitacja.
Grafiki generowane przez systemy tzw. sztucznej inteligencji od kilku lat masowo zalewają Internet. Pojawiają się na zaśmiecających przestrzeń publiczną billboardach. Coraz częściej można je zobaczyć także w drukowanej prasie i w książkach. Zastanawiam się, jakie długofalowe skutki będzie miała ich rosnąca obecność, przy jednoczesnym zanikaniu ludzkich kompetencji artystycznych, oraz czym skończyłoby się wpatrywanie w wygenerowany przez system GenAI obraz przez trzy godziny bez przerwy…
Zacznijmy od ilustracji
W październiku prowadziłem czterodniowe warsztaty z nauki o złożoności na Akademii Sztuk Pięknych w Katowicach. W ramach jednej z aktywności wykorzystaliśmy model ASHEN do mapowania kompetencji uczestniczek i uczestników warsztatów. Zastanawialiśmy się, w jakim stopniu niektóre z ich kompetencji mogą zostać zastąpione przez systemy tzw. sztucznej inteligencji.
Jedna z uczestniczek analizowała kompetencję tworzenia ilustracji. Kiedy zaczęła opowiadać o umiejętnościach, nawykach i doświadczeniach, składających się na tę kompetencję, zobaczyłem jak bogata i skomplikowana jest to kompozycja i ilu lat potrzebowała, nie tylko na szlifowanie techniki, ale na pogłębianie swojej wiedzy z zakresu anatomii czy historii sztuki.
Zacząłem zastanawiać się, czy system GenAI wytrenowany na olbrzymich zbiorach danych, „spromptowany” (opisem kontekstu i wskazówek dotyczącego spodziewanego rezultatu i jego stylu) przez użytkownika, poprzez (w przypadku bardzo popularnych modeli dyfuzyjnych) przekształcanie losowego szumu w obrazek, tworzy w rezultacie ilustrację? Ujmując to inaczej, czy syntetyczny rezultat działania systemu cyfrowego można nazwać ilustracją?
//Poruszony tym spotkaniem postanowiłem wziąć ilustrację, wspaniałą reprezentankę sztuk wizualnych, jako przykład w niniejszym artykule. Jednak ilustrację można śmiało zastąpić słowem obraz, rysunek, wideo, animacja, czy fotografia, zachowując sens mojej wypowiedzi.
Produkt ilustracjoprawdopodobny
W przeciwieństwie do wspomnianej ilustratorki system generujący obraz nie posiada świadomości ani wiedzy o anatomii czy historii sztuki. Nie ma mięśni, ani dłoni, która trzyma ołówek. Nie ma oczu przyglądających się kartce, na której powstaje ilustracja. Nie rozumie szerszego kontekstu treści, którą ilustracja ma opisywać. Zamiast tego, na podstawie podanego promptu, analizuje wzorce w danych treningowych i probabilistycznie generuje grafikę odpowiadającą wskazówkom autora promptu. Uważam, że rezultat w takim przypadku nie jest ilustracją. Jest produktem „ilustracjopodobnym”, choć może lepiej w tym kontekście zabrzmi „ilustracjoprawdopodobnym”.
Dlaczego tak uważam?
Tworzenie ilustracji to proces, w którym ilustratorka podejmuje wiele świadomych i nieświadomych decyzji przy każdym ruchu ręki, a każdy ruch jest syntezą jej wiedzy, nawyków, talentu, wyobraźni, doświadczenia, wrażliwości oraz wpływu otoczenia, w którym tworzy.
Rapidograf w jej ręce, czy kursor w programie graficznym jest zdecydowanie czymś innym niż opisywanie oczekiwanego rezultatu w formie „promptu” do systemu GenAI, który generuje obraz (któremu spójność nadaje dopiero odbiorca).
Promptowanie nie jest procesem tworzenia, tylko procesem opisywania oczekiwanego rezultatu, którego generowaniem zajmuje się system cyfrowy (nie autor promptu). Osoba opisująca oczekiwany rezultat nie jest ilustratorem, tylko zamawiającym i zgłaszającym swoje uwagi recenzentem rezultatu. Czy osoby, które w kwietniu masowo tworzyły obrazki i awatarki generowane w stylu słynnego, japońskiego studia Ghibli, możemy nazwać rysownikami, ponieważ napisały odpowiedni prompt? Nie.
Podsumowując, w moim ujęciu, z którym można się zgadzać lub nie, na rezultat w postaci ilustracji składa się ilustrator oraz proces twórczy, a nie jedynie osoba formułująca prompt i system cyfrowy, który generuje obraz na podstawie algorytmu opartego nie na zrozumieniu i kompetencjach, lecz na danych treningowych i statystyce.
No dobrze, tylko co z tego wynika, skoro dla osoby niewytrenowanej w tworzeniu ilustracji różnice między ilustracją, a jej imitacją są niezauważalne?
To jest bardzo ciekawe pytanie, a odpowiedź na nie jest bardzo złożona.
Konsekwencje obserwowalne
Nie ulega wątpliwości, że upowszechnienie systemów GenAI spowodowało drastyczną dewaluację pracy wielu ilustratorek i ilustratorów. Gdy rezultaty pracy człowieka i systemu GenAI są trudne do odróżnienia, to sytuacja dla artystów staje się bardzo niekorzystna. Skoro rezultat można osiągnąć niższym kosztem, to coraz częściej zamawiający wybierają wytwory GenAI lub oczekują, że artyści obniżą swoje stawki albo przygotują więcej ilustracji za mniej (np. dzięki temu, że samodzielnie będą korzystać z systemów GenAI).
Osoby aktualnie żyjące z tworzenia ilustracji zaczynają kwestionować przydatność własnych kompetencji, na których rozwój poświęcili lata, a u wielu aspirujących ilustratorów rodzi się pytanie o sens dalszego rozwoju w tym zakresie. O tych dylematach i różnych „strategiach przetrwania” bardzo pięknie opowiada James Hughes w tym nagraniu (dziękuję Natalia za link ;)).
Być może w oceanie syntetycznych wytworów ludzka twórczość zyska na wartości, stając się bardziej pożądana i cenna. Bardzo bym chciał, żeby tak się stało, jednak moje życzenia nie zawsze przekładają się na rzeczywistość. Wiem jednak, że w firmach, które rozwijają systemy GenAI decydenci przedkładają zysk nad dobro społeczne. Skoro każdemu zależy na godnych warunkach życia, wiele osób może zrezygnować z rozwijania swoich talentów i pasji i poszukać pracy w innych obszarach gospodarki. A tak bardzo potrzebujemy w społeczeństwie ich wrażliwości, sposobów myślenia, perspektyw oraz szerokich kompetencji. Znacznie szerszych, niż mogłoby się wydawać.
Przyjmując czarny scenariusz, w którym bezpowrotnie zaczynamy tracić ilustratorów (oraz innych artystów) i ich twórcze kompetencje, zastanawiam się, co również stracimy.
Konsekwencje możliwe
Istnieje szereg możliwych konsekwencji takiego scenariusza, których kosztów nie jesteśmy w stanie w pełni zrozumieć, tym bardziej oszacować. Natomiast na pewno możemy zadawać pytania i rozmawiać.
Pierwszym pytaniem, które przychodzi mi do głowy, to pytanie o konsekwencje dla kultury, jeśli pracę artystek i artystów zastąpimy cyfrowymi wytworami. Co stracimy? Rzemiosło? Zrozumienie? Różnorodność? Dziedzictwo? A może wszystko to na raz?
A jaki wpływ na naszą rzeczywistość będzie miała utrata ludzi, którzy potrafią samodzielnie tworzyć, a nie “promptować” systemy cyfrowe generujące rezultaty? Czy jako ludzkość rozwiniemy się, czy zdegenerujemy? Jak to wpłynie na myślenie, ekspresję, kreatywność? Jak to wpłynie na umiejętność wyrażania sprzeciwu i kwestionowania status quo?
Jak będzie funkcjonować świat, kiedy nad większością „wizualnej twórczości” będzie sprawować kontrolę kilka firm technologicznych (de facto kilka osób) i od nich będzie zależało, co można wygenerować, a co nie?
A jaki wpływ na nas samych będzie miała stała, długofalowa ekspozycja na sztucznie wygenerowane obrazy? Co jeśli w kontakcie z syntetyczną imitacją, a nie z wytworem ludzkiej pracy, informacje o tym, że coś jest nie tak z tymi obrazami, docierają na poziomie nieświadomym, co rejestruje tylko ciało, ale już nie świadomość? Czy taka ekspozycja może doprowadzić do choroby psychicznej i/lub fizycznej?
Podobnych pytań mam bardzo wiele.
Trzy godziny
W trakcie warsztatów na ASP w Katowicach, podczas których znalazłem inspirację do napisania tego tekstu, długo rozmawialiśmy o tym, jak bardzo niespójne są grafiki generowane przez systemy GenAI. Imitowanie stylu czy fotorealizm nie zawsze wystarczą, by ustrzec się przed wytrenowanym i spostrzegawczym artystą, który dzięki swojemu doświadczeniu, wiedzy i zrozumieniu potrafi zauważyć, że jeden z elementów wystroju wnętrza jest z innej epoki niż pozostałe, albo że wyraz jednej z twarzy na obrazie wyraża emocje sprzeczne do przedstawionej sytuacji.
Rozmowa ta skojarzyła mi się z opowieścią Olivera Burkemana na temat jego wycieczki do Harvard Art Museum, aby w ramach treningu cierpliwości przez trzy godziny kontemplować obraz „A Cotton Office in New Orleans” Edgara Degasa.

Edgar Degas, Public domain, via Wikimedia Commons
Burkeman po wielu minutach spędzonych w bólu i dyskomforcie wywołanym odczuwaniem powolnego upływu czasu podzielił się następującymi obserwacjami:
A później, około osiemdziesiątej minuty [...] następuje przełom. [...] Degas ujawnia swoje pierwsze tajemne szczegóły: subtelne wyrazy skupienia i smutku na twarzach mężczyzn, z których jeden, zauważasz nareszcie, jest czarnoskórym kupcem, w zasadniczo białym środowisku. Dostrzegasz także zagadkowy cień, którego wcześniej nie widziałeś, jakby poza kadrem kryła się jeszcze jedna osoba. Intrygująca iluzja optyczna sprawia, że w zależności od tego, w jaki sposób oczy zinterpretują inne kontury obrazu, jedna z postaci może się wydać przeźroczysta, niczym duch. Niedługo później zaczynasz w pełni odczuwać zmysłowy krajobraz sceny: wilgotność i ścisk panujący w tej salce w Nowym Orleanie, skrzypienie desek podłogowych, zapach kurzu w powietrzu.”
– Oliver Burkeman, Cztery tysiące tygodni
Na poziomie świadomym jesteśmy w stanie dostrzec intencję artysty i głębię przekazu w jego dziele dopiero wtedy, gdy „porzucimy fantazję o kontrolowaniu tempa rzeczywistości na rzecz rzeczywistego poczucia kontaktu z rzeczywistością”. Do takich odkryć potrzebujemy jednak nie tylko cierpliwości, ale i prawdziwych twórców.
Jak myślcie, jakich odkryć dokonamy przez trzy godziny wpatrując się w obraz wygenerowany przez system GenAI? Wszak nie dostrzeżemy w nim spójności, tylko co najwyżej algorytmiczny konsensus.
Potrzebujemy artystów o szerokich kompetencjach, samodzielnie tworzących, bez użycia systemów AI. Od nich zależy nasza przyszłość, zdecydowanie bardziej, niż na pierwszy rzut oka może się wydawać.
Ps. W artykule skupiłem się tylko na ilustracji (a pośrednio na sztukach wizualnych) i świadomie nie poruszyłem tematu deepfake’ów, AI Slopu, muzyki czy tekstu. Nie chciałem łapać zbyt wielu srok za ogon, żeby nie pogubić się w mnogości wątków. Tematy te będę omawiać w kolejnych artykułach. Stay tuned!

Dzięki wsparciu czytelniczek i czytelników mogę przeznaczać więcej czasu na research i samodzielne pisanie artykułów na ten blog. Jeśli publikowane tutaj treści są dla Ciebie wartościowe, dorzuć symboliczną cegiełkę do mojej pracy. Dziękuję!