Sećate li se vremena, ne tako davno, kada je sama ideja da mašina može da „slika“ zvučala kao naučna fantastika? Gledali smo mutne, apstraktne prikaze koji su više ličili na snove grozničavog kompjutera nego na bilo šta upotrebljivo. Danas, u avgustu 2025. godine, ta vremena deluju kao daleka, arhaična prošlost.
Živimo u eri vizuelne renesanse, pokretane veštačkom inteligencijom. Prazan ekran više nije pretnja, već pozivnica. Za dizajnere, marketare, umetnike, arhitekte, pa čak i za preduzetnike u Srbiji koji žele da ožive svoju viziju, AI generatori slika postali su ono što je nekada bio Photoshop – nezaobilazan alat u arsenalu svakog kreativca.
Ali, kao što svaki majstor zna, nije svaki alat isti. U uzavreloj areni AI kreativnosti, tri imena su se izdvojila kao neprikosnoveni titani, svaki sa svojom filozofijom, snagom i armijom vernih sledbenika:
- Midjourney: Umetnik sa dušom, poznat po svom prelepom, često sanjivom i neverovatno koherentnom stilu.
- DALL-E 3: Pragmatik i poliglota, savršeno integrisan u ekosisteme koje već koristimo, majstor razumevanja prirodnog jezika.
- Stable Diffusion: Buntovnik otvorenog koda, naučnik i kameleon, koji nudi beskrajnu moć i kontrolu onima koji su voljni da zavire „ispod haube“.
Koji od njih je pravi za vas? Koji najbolje razume suptilnosti našeg podneblja – kako da prikaže jutarnju maglu iznad Petrovaradinske tvrđave, teksturu ajvara na parčetu hleba ili ponosni pogled Nikole Tesle?
Ovo nije samo tehnički pregled. Ovo je dubinsko putovanje u srce svake od ovih mašina. Testiraćemo ih do krajnjih granica, zadavaćemo im zadatke koji spajaju globalnu pop kulturu sa lokalnim srpskim motivima i pomoći ćemo vam da donesete najvažniju odluku: koji od ovih digitalnih Pikasa će postati vaš kreativni kopilot?
Vežite se. Budućnost stvaranja slika je stigla, a mi ćemo vam pokazati kako da je ukrotite.
Pre nego što počnemo: Kratka evolucija – kako smo stigli dovde?
Da bismo razumeli sadašnjost, moramo poštovati prošlost. Put od prvih AI slika do fotorealističnih čuda 2025. bio je meteorski. Sve se zasniva na konceptu difuzionih modela.
Pojednostavljeno rečeno, zamislite da uzmete savršeno jasnu fotografiju i postepeno joj dodajete „šum“ (noise), sve dok ne postane potpuno neprepoznatljiva. Difuzioni AI modeli su naučeni da rade obrnut proces: da iz nasumičnog šuma, vođeni vašim tekstualnim uputstvom (promptom), postepeno „čiste“ sliku i stvaraju nešto koherentno i novo.
Ono što se promenilo od 2022. do danas je eksponencijalni rast u razumevanju jezika, efikasnosti modela i, što je najvažnije, u kvalitetu podataka na kojima su trenirani. Modeli iz 2025. ne samo da razumeju reči „pas“ i „mačka“, već razumeju razliku između „zlatnog retrivera koji srećno trči kroz polje suncokreta tokom zlatnog sata, fotografisan objektivom od 50mm sa malom dubinom polja“ i „šarenog mačeta koje se igra sa klupkom vune u stilu Van Gogovih slika“.
Ta nijansa je ključ svega. A sada, da vidimo kako se naši titani nose sa njom.
Upoznavanje titana: Umetnik, Pragmatik i Buntovnik
1. Midjourney: Umetnik u svom ateljeu na Discordu
Midjourney je, za mnoge, prva asocijacija na „lepe“ AI slike. Od samog početka, njegov kreator Dejvid Holc i njegov mali, nezavisni tim, nisu jurili za pukim fotorealizmom. Oni su jurili za estetikom.
- Filozofija: Midjourney je oduvek bio „opinionated“ softver. To znači da ima svoj izražen stav i stil. Dok drugi alati teže da budu neutralno platno, Midjourney je kao talentovani asistent koji uvek doda svoj prepoznatljiv, umetnički pečat. Njegov cilj nije samo da stvori sliku, već da stvori lepu sliku. To ga čini miljenikom umetnika, ilustratora i dizajnera.
- Kako „stvara“? Njegov model je zatvoren i obavijen velom tajne, ali ono što vidimo u verziji 7, aktuelnoj u 2025. godini, jeste neverovatna sposobnost za koherenciju i kompoziciju. Slike koje Midjourney stvara retko imaju anatomske greške (poput šest prstiju, što je bio problem ranijih verzija), a kompozicija elemenata na slici deluje promišljeno, kao da ju je postavio iskusan fotograf ili slikar.
- Radno okruženje: Jedinstven i za neke zbunjujući aspekt Midjourney-ja je što on „živi“ na Discordu, popularnoj platformi za komunikaciju. Ne postoji klasična veb aplikacija. Slike generišete kucanjem komande
/imagineu četu. Iako deluje neintuitivno, ovaj pristup je stvorio nešto neprocenjivo: zajednicu. Korisnici u realnom vremenu gledaju šta drugi stvaraju, uče jedni od drugih, dele promptove i inspirišu se. To je živi, dišući organizam kreativnosti.
Prednosti u 2025:
- Vrhunska estetika: „Out-of-the-box“ rezultati su skoro uvek lepi, stilizovani i vizuelno prijatni.
- Izvanredna koherencija: Najbolji je u stvaranju slika sa kompleksnim scenama i više subjekata koji međusobno interaguju na prirodan način.
- Lakoća dobijanja dobrih rezultata: Čak i sa jednostavnim promptovima, Midjourney daje impresivne rezultate, zahvaljujući svom „ugrađenom“ umetničkom stilu.
- Konzistentnost karaktera: Nove funkcije poput
cref(character reference) omogućavaju stvaranje istog lika u različitim scenama, što je revolucionarno za stripove, storyboarding i marketing kampanje.
Mane:
- Discord interfejs: Može biti prepreka za početnike i one koji preferiraju klasičan softverski interfejs.
- Manja kontrola nad detaljima: Teže je naterati Midjourney da se drži tačno i bukvalno veoma specifičnih i bizarnih uputstava. On voli da interpretira.
- Cena: Ne postoji besplatna verzija. To je isključivo plaćeni servis zasnovan na pretplati.
2. DALL-E 3 (Integrisan u ChatGPT & Microsoft Designer): Pragmatik i majstor jezika
DALL-E, kreacija kompanije OpenAI (koja stoji i iza ChatGPT-a), krenuo je drugačijim putem. Njegova najveća snaga nikada nije bila samo estetika, već neverovatno razumevanje ljudskog jezika.
- Filozofija: Pristupačnost i integracija. OpenAI želi da AI alati budu dostupni i korisni svima, ne samo tehničkim stručnjacima. Zato su DALL-E 3 genijalno integrisali direktno u ChatGPT Plus. Ne morate da učite kompleksan „prompt engineering“. Možete jednostavno da razgovarate sa ChatGPT-om kao sa asistentom: „Hej, napravi mi sliku za Instagram. Treba mi vesela ilustracija porodice na pikniku pored Dunava, u stilu crtanog filma. Neka bude sunčan dan.“ ChatGPT će sam napisati detaljan prompt za DALL-E 3.
- Kako „stvara“? DALL-E 3 je majstor u bukvalnom praćenju instrukcija. Ako mu kažete da nacrta „crveni kvadrat levo od plavog kruga“, on će to i uraditi, dok bi Midjourney možda „umetnički“ interpretirao scenu. Ovo ga čini neverovatno moćnim za specifične komercijalne zahteve, dizajn logotipa, i sve situacije gde je preciznost važnija od estetike.
- Radno okruženje: Najčešće se koristi kroz prozor za četovanje sa ChatGPT-om ili unutar Microsoft alata poput Designer-a i Bing Image Creator-a. Ovo ga čini neverovatno lakim za korišćenje za milione ljudi koji već koriste ove platforme.
Prednosti u 2025:
- Superiorno razumevanje prirodnog jezika: Najbolji alat za pretvaranje govornog jezika u vizuelne koncepte.
- Preciznost i praćenje prompta: Izvanredan u generisanju slika koje se striktno drže zadatih, čak i veoma kompleksnih, instrukcija.
- Lakoća korišćenja: Integracija sa ChatGPT-om eliminiše potrebu za učenjem pisanja promptova. To je najlakši put od ideje do slike.
- Generisanje teksta na slikama: DALL-E 3 je daleko ispred konkurencije u sposobnosti da ispravno ispiše tekst unutar slike, što je ključno za postere, mimove i reklame.
Mane:
- Manje „umetnički“ stil: Slike ponekad mogu delovati pomalo generički, digitalno ili „plastično“ u poređenju sa Midjourney-jevom filmskom estetikom.
- Cenzura i ograničenja: Kao deo velikog korporativnog ekosistema, DALL-E 3 ima stroža pravila i cenzuru u pogledu sadržaja koji se može generisati.
- Manja kontrola nad procesom: Manje opcija za fino podešavanje (reroll, varijacije) u poređenju sa Midjourney-jem.
3. Stable Diffusion: Buntovnik, naučnik i beskrajno platno
Stable Diffusion nije samo alat; to je pokret. Kreiran od strane Stability AI u saradnji sa akademskom zajednicom, njegov ključni adut je jedna reč: open-source (otvoreni kod).
- Filozofija: Demokratizacija i sloboda. Za razliku od zatvorenih modela Midjourney-ja i DALL-E-a, osnovni model Stable Diffusion-a je besplatan i svako ga može preuzeti, modifikovati i pokretati na svom računaru (ako je dovoljno snažan). Ovo je pokrenulo globalnu eksploziju inovacija.
- Kako „stvara“? Osnovni Stable Diffusion model je kao motor. Sam po sebi je moćan, ali prava snaga dolazi od zajednice koja gradi neverovatne „šasije“ i „dodatke“ oko njega. To uključuje:
- Prilagođeni modeli (Checkpoints): Korisnici treniraju osnovni model na specifičnim stilovima. Želite sliku u stilu renesansnih majstora? Postoji model za to. Želite anime stil? Postoji na stotine modela. Želite fotorealizam? Postoje modeli kao što je „Absolute Reality“ ili „Juggernaut XL“ koji su specijalizovani samo za to.
- ControlNet: Ovo je verovatno najvažnija inovacija u AI generisanju slika. ControlNet vam omogućava da „zaključate“ određene aspekte slike. Možete mu dati grubu skicu, pozu ljudske figure (pose), ili mapu dubine, i reći mu: „Generiši sliku koja prati ovu kompoziciju“. Ovo daje neviđen nivo kontrole.
- Radno okruženje: Najčešće se koristi kroz veb interfejse kao što je „AUTOMATIC1111“ ili „ComfyUI“, koje instalirate lokalno na svom računaru. Zahteva tehničko znanje, ali nudi potpunu kontrolu nad svakim parametrom generisanja – od broja koraka difuzije do jačine prompta. Postoje i plaćene online usluge koje nude jednostavniji pristup.
Prednosti u 2025:
- Apsolutna kontrola: Kroz ControlNet, LoRA modele (mali modeli za specifične stilove ili likove) i detaljna podešavanja, imate hiruršku preciznost nad finalnim rezultatom.
- Beskrajna fleksibilnost: Mogućnost menjanja modela („checkpoints“) znači da možete generisati slike u bukvalno bilo kom zamislivom stilu.
- Besplatan i otvoren: Osnovni softver je besplatan za korišćenje. Plaćate samo struju za vaš računar.
- Privatnost i sloboda: Pošto radi lokalno, možete generisati šta god želite bez cenzure, a vaši podaci ostaju vaši.
Mane:
- Visoka tehnička zahtevnost: Instalacija i korišćenje zahtevaju učenje i strpljenje. Nije za apsolutne početnike.
- Zahteva snažan hardver: Za brzo generisanje slika na lokalnom računaru potrebna je skupa i snažna grafička kartica (NVIDIA RTX serije).
- Kvalitet varira: Rezultati direktno zavise od vašeg znanja, umešnosti u pisanju promptova i izbora pravog modela. Lako je dobiti loše rezultate ako ne znate šta radite.
Veliki test 2025: Beogradski vizuelni izazov
Da bismo videli kako se titani snalaze u praksi, zadali smo im tri specifična izazova koja kombinuju globalne trendove sa lokalnim, srpskim duhom.
Izazov 1: Fotorealizam i lokalni duh
Prompt:
„Fotorealistična slika, kinematografski stil. Mlada žena sa osmehom pije espreso u bašti kafića u Skadarliji, Beograd. Jutarnje sunce se probija kroz lišće, stvarajući prelepe senke na kaldrmi. U pozadini se nazire autentična srpska arhitektura. Fotografisano sa FujiFilm kamerom, filmski izgled.“
Analiza rezultata (kako bi izgledali u 2025.):
- Midjourney (V7): Rezultat je apsolutno zapanjujući, ali na svoj način. Slika je prelepa. Svetlost je božanstvena, boje su bogate, a kompozicija savršena. Žena na slici je atraktivna, ali možda i previše „instagramski“ savršena. Kaldrma i arhitektura deluju kao idealizovana, romantična verzija Skadarlije, a ne nužno 100% autentična. Midjourney ne prodaje realnost, on prodaje san o realnosti. Savršeno za turističku kampanju ili naslovnicu časopisa.
- DALL-E 3 (u ChatGPT-u): Slika je veoma precizna. Arhitektura u pozadini zaista podseća na Skadarliju, devojka deluje kao obična osoba, a ne model, a detalji poput šoljice za espreso su tačni. Međutim, slika nema „dušu“ Midjourney-jevog rezultata. Osvetljenje je korektno, ali ravno. Deluje više kao kvalitetna stock fotografija nego kao kadar iz filma. Njegova snaga je u preciznosti, ne u atmosferi.
- Stable Diffusion (sa fotorealističnim modelom + ControlNet): Ovde imamo najviše posla, ali i najveću moć. Prvi rezultati su možda promašili atmosferu, ali onda kreće magija. Koristimo ControlNet da zadamo tačnu pozu devojke. Učitavamo LoRA model istreniran na „FujiFilm“ estetici. Malo podešavamo prompt da dodamo „blaga nesavršenost, zrno filma“. Nakon nekoliko iteracija, dobijamo rezultat koji je zastrašujuće realan. Možda nije lep kao Midjourney-jev, ali je stvaran. Vidi se svaka pukotina na kaldrmi. Svetlost je realistična, sa oštrim senkama. Ovo je alat za perfekcioniste koji žele potpunu kontrolu nad svakim pikselom.
Presuda za fotorealizam:
- Stable Diffusion: Za one koji jure apsolutnu realnost i kontrolu.
- Midjourney: Za one koji jure idealizovanu, kinematografsku lepotu.
- DALL-E 3: Za brze, korektne i precizne stock fotografije.
Izazov 2: Umetnička interpretacija i nacionalni simboli
Prompt:
„Spomenik Pobednik na Kalemegdanu, preobražen u stilu H.R. Gigera, biomehanički detalji, mračna i teskobna atmosfera, olujno nebo iznad ušća Save u Dunav.“
Analiza rezultata:
- Midjourney: Ovo je Midjourney-jev teren. Rezultat je remek-delo mračne umetnosti. Savršeno je spojio prepoznatljivu siluetu Pobednika sa Gigerovom košmarnom estetikom. Metal se pretvorio u organske kablove i cevi, a kamen postolja u egzoskelet. Olujno nebo nije samo sivo, već ima zlokobne, vanzemaljske nijanse. Midjourney je razumeo suštinu oba stila i stvorio nešto potpuno novo i moćno.
- DALL-E 3: Rezultat je korektan, ali bukvalan. Vidi se Pobednik, i vide se elementi koji podsećaju na Gigera „nalepljeni“ na njega. Fali fuzija. Deluje kao da je mašina razumela oba koncepta odvojeno, ali nije uspela da ih organski spoji u jedinstvenu viziju. Nebo je olujno, ali na generički način.
- Stable Diffusion: Sa pravim modelom (npr. nekim istreniranim na mračnoj fantaziji) i dobrim promptom, Stable Diffusion može da parira Midjourney-ju. Možda će biti potrebno više pokušaja, kombinovanje negativnih promptova („izbegavaj previše sjaja, izbegavaj ljudsko lice“) da bi se dobio željeni rezultat, ali potencijal je tu. Njegova prednost je što možete ići u još veće ekstreme ako to želite, dok vas Midjourney drži u okvirima svoje „dobre estetike“.
Presuda za umetnost:
- Midjourney: Apsolutni pobednik za umetničku interpretaciju i spajanje stilova.
- Stable Diffusion: Veoma moćan, ali zahteva više truda i znanja od korisnika.
- DALL-E 3: Upotrebljiv za osnovne stilske zahteve, ali mu fali umetnička dubina.
Izazov 3: Bizarni zahtevi i kulturološke reference
Prompt:
„Digitalna slika, visoki detalji. Sveti Sava kao cyberpunk nindža sedi na krovu Hrama Svetog Save u Beogradu, meditira dok neonske reklame za pljeskavicu i rakiju osvetljavaju noć.“
Analiza rezultata:
- Midjourney: Mučio se sa identitetom Svetog Save. Pošto je treniran na globalnim podacima, verovatno je stvorio generičku figuru sveca ili monaha u cyberpunk opremi. Hram i reklame su verovatno bili sjajno izvedeni, ali ključni subjekat nije bio pogođen. Midjourney-ju nedostaje specifično kulturološko znanje.
- DALL-E 3: Ovde DALL-E 3 briljira. Njegova sposobnost da se drži prompta je ključna. Slika bi verovatno imala prepoznatljive crte Svetog Save sa fresaka, ali integrisane u cyberpunk oklop. Uspeo bi da ispiše „Пљескавица“ i „Ракија“ na ćirilici na neonskim reklamama. Slika možda ne bi bila lepa kao Midjourney-jeva, ali bi bila duhovita, tačna i ispunila bi svaki, pa i najbizarniji, deo prompta.
- Stable Diffusion: Rezultat bi bio potpuna lutrija. Bez specifičnog LoRA modela istreniranog na liku Svetog Save, dobili bismo generičku figuru. Međutim, ako bi se neko u srpskoj AI zajednici potrudio da istrenira takav model, Stable Diffusion bi mogao dati najbolje rezultate, kombinujući preciznost karaktera sa potpunom kontrolom nad stilom i kompozicijom. Ovo pokazuje njegovu najveću snagu i slabost – sve zavisi od vas i alata koje je zajednica već stvorila.
Presuda za bizarnost i specifičnost:
- DALL-E 3: Pobednik zbog neverovatne sposobnosti da razume i izvrši najluđe zahteve.
- Stable Diffusion: Potencijalno najbolji, ali zavisi od dodatnog truda i postojećih modela.
- Midjourney: Najslabiji u praćenju specifičnih, kulturološki vezanih instrukcija.
Šta ovo znači za vas? Budućnost kreativnosti je personalizovana
Nakon svega ovoga, jasno je da ulazimo u eru gde AI nije samo „dugme koje pravi slike“. To je instrument, a vi ste muzičar. Koji instrument ćete izabrati zavisi od muzike koju želite da svirate.
Uloga modernog kreativca u 2025. godini više nije samo u tehničkoj veštini crtanja ili fotografisanja. Ključne veštine postaju:
- Vizija i art direkcija: Sposobnost da imate jasnu ideju u glavi.
- Prompt Engineering (Umetnost zadavanja komandi): Sposobnost da tu viziju precizno opišete mašini.
- Kustostvo i selekcija: Sposobnost da od deset generisanih opcija izaberete onu pravu i da je doradite.
- Post-produkcija: Korišćenje klasičnih alata kao što je Photoshop za finalno spajanje, korekciju boja i dodavanje onog finalnog ljudskog dodira.
AI vam neće ukrasti posao. Ali, kreativac koji majstorski vlada AI alatima biće deset puta produktivniji i kreativniji od onoga koji ih ignoriše. To je nova realnost.
Zaključak: Koji AI instrument je za vaš orkestar?
Ne postoji jedan „najbolji“ AI generator slika. Postoji samo onaj koji je najbolji za vas, za vaš projekat i za vaš stil rada.
- Ako ste umetnik, ilustrator, dizajner interfejsa ili marketing stručnjak kome je potrebna vrhunska estetika bez mnogo tehničkog petljanja, Midjourney je vaš izbor. On je partner koji će svaku vašu ideju učiniti lepšom. Plaćate za kvalitet i konzistentnost.
- Ako ste pisac, menadžer društvenih mreža, vlasnik malog biznisa ili vam treba alat koji savršeno razume vaše reči i pretvara ih u precizne vizuale, DALL-E 3 (u okviru ChatGPT-a) je nepobediv. Njegova lakoća korišćenja i moć razumevanja jezika čine ga najpristupačnijim alatom na tržištu.
- Ako ste profesionalni fotograf, arhitekta, 3D umetnik, developer, eksperimentator, ili jednostavno želite apsolutnu kontrolu, slobodu i ne plašite se učenja, onda je Stable Diffusion vaš univerzum. To je put koji zahteva najviše truda, ali nudi i najveće nagrade, uključujući i onu finansijsku, jer je u osnovi besplatan.
Budućnost nije u biranju jednog alata, već u njihovom kombinovanju. Možda ćete koristiti Midjourney da generišete osnovnu ideju i atmosferu, zatim Stable Diffusion sa ControlNet-om da tu ideju prenesete u preciznu kompoziciju, i na kraju DALL-E 3 da dodate specifičan tekst na sliku.
Mi u Srbiji imamo jedinstvenu priliku. Naša bogata istorija, vizuelna kultura i specifičan humor su nepresušan izvor inspiracije. Ovi alati nam daju moć da te naše, lokalne priče ispričamo na svetskom nivou, na načine koji nikada pre nisu bili mogući.
Zato, ne čekajte. Zaronite. Eksperimentišite. Stvorite nešto što niko pre vas nije. Pobednika na Kalemegdanu kao Gigerovog vanzemaljca. Teslu kako pije kafu sa Da Vinčijem na obali Dunava. Mogućnosti su, po prvi put, zaista beskonačne.



