Kilovati po promptu: Da li će glad veštačke inteligencije za strujom ugasiti našu zelenu budućnost?

Negde 2023. godine, u kancelarijama najvećih svetskih tech kompanija, desio se tihi ali dramatičan zaokret. Ekipe zadužene za sustainability (održivost) – koje su godinama objavljivale grafikone sa impresivnim padom CO2 emisija, sve većim udelom obnovljive energije i ambicioznim net-zero ciljevima – počele su da dobijaju poruke od tehničkih timova koji su implementirali nove AI workloade.

Poruke su bile direktne: brojevi više ne idu u dobrom smeru.

Google je u svom Environmental Report za 2024. godinu objavio nešto što bi pre tri godine bilo nezamislivo za kompaniju koja se godinama hvalila klimatskim vođstvom: njene ukupne CO2 emisije nisu pale – porasle su za 48% u poređenju sa 2019. godinom, direktno zbog rasta AI infrastrukture. Kompanija koja je bila primer zelene transformacije tech sektora suočila se sa činjenicom da su joj vlastiti AI ambicije nadmašile vlastite zelene ciljeve.

Microsoft je 2024. objavio da su mu emisije porasle za 29% u poređenju sa 2020. baznom godinom – godinom kada je proglasio ambiciozni cilj da postane carbon negative do 2030. AI workloadi su bili eksplicitno navedeni kao primarni uzrok.

Ovo nisu mala podešavanja. Ovo su strukturni pokreti u pogrešnom smeru, od kompanija koje imaju i novac i motivaciju da budu zelene.

Šta ćete naći u ovom tekstu:

Konkretni brojevi: koliko tačno troši jedan AI upit, trening modela i ceo AI ekosistem globalno
Zašto „koristimo obnovljivu energiju“ nije tako jednostavan odgovor kao što Tech kompanije sugerišu
Vodeni problem koji niko ne pominje dovoljno glasno
Muscle car analogija i šta ona znači za AI policy (politiku)
Da li efikasniji modeli poput DeepSeek-a menjaju jednačinu – ili samo pomeraju problem
Šta developer može konkretno da uradi
Kuda ide ova priča do 2030. i šta bi se moralo desiti da bude okej

Ako koristite AI alate svakodnevno – a verovatno koristite – ovo se tiče vas. Ne kao krivica, već kao kontekst koji menjа svesnost o tome šta zapravo pokreće ove sisteme.

Muscle car koji vozi do prodavnice: Analogija koja ne laže

Američki muscle car iz 70-ih je inžinjersko dostignuće. 500+ konjskih snaga, zvuk motora koji se oseća u grudnoj kosti, ubrzanje koje guši. Inžinjeri koji su ga napravili su bili geniji unutar zadatih parametara.

Ali taj auto troši 25-30 litara na 100 kilometara. I kada ga vozite do prodavnice po hleb – koriste se svi ti kilovati, sav taj benzin, sva ta snaga za misiju koja bi se završila i biciklom.

GPT-5.4, Claude 4.6, Gemini Ultra – to su muscle car modeli digitalne ere. Neverovatna inžinjerska dostignuća. Ogromna moć. I kada ih pitate da vam napišu subject line za email, ili da vam kažu kako se kaže „hvala“ na japanskom, ili da generišu sliku mačke u svemiru – pokrećete muscle car za vožnju do prodavnice.

Problem nije u tome što muscle car postoji. Problem je u tome što je parking ispred prodavnice pun isključivo muscle car automobilima, svi konstantno upaljeni, čak i kada niko nije u njima.

Brojevi koji bi trebalo da vas zabrinu – ili bar razmisle

Hajde sa konkretnim ciframa, jer apstraktne brige nisu dovoljno nelagodne.

Po upitu: Istraživači sa Univerziteta Massachusetts Amherst procenjuju da jedan ChatGPT upit troši otprilike 2,9 Wh električne energije. Google pretraga troši oko 0,3 Wh. Dakle, ChatGPT po upitu troši gotovo 10 puta više od standardne Google pretrage. Ovo zvuči malo u apsolutnim brojevima – ali pomnožite sa milijardama upita dnevno koje obrađuju ChatGPT, Gemini, Copilot i stotine manjih servisa.

Po generisanoj slici: Studija objavljena u časopisu Joule, reklamirana kao jedna od prvih peer-reviewed analiza energetskog otiska generativnog AI-a, procenjuje da generisanje jedne AI slike troši energiju ekvivalentnu punjenju smartphone baterije od 0% do 100%. Ovo zvuči bezazleno dok ne pomislite na Midjourney, DALL-E, Stable Diffusion i sve druge servise koji dnevno generišu desetine miliona slika.

Trening modela: Trening GPT-3 modela procenjen je na emisiju od oko 552 metričkih tona CO2 ekvivalenta. Trening GPT-4, čiji su detalji nikad potpuno objavljeni, procenjuje se konzervativno na 10-100 puta više. Za kontekst: prosečan automobil emituje oko 4,6 metričkih tona CO2 godišnje. Trening jednog naprednog LLM-a emituje koliko 100 do 1000 automobila tokom celog životnog veka.

Globalna potrošnja: IEA (International Energy Agency – Međunarodna agencija za energiju) u svom Electricity 2025 izveštaju procenjuje da će globalna potrošnja energije data centara dostići 945 TWh do 2026. To je više nego što cela Nemačka – četvrta ekonomija sveta – potroši godišnje. I AI je identifikovan kao primarni driver rasta te potrošnje.

Za 2030. godinu, projekcije govore o 1.500 do 2.000 TWh godišnje za data centre globalno, uz AI koji čini sve veći udeo te potrošnje. Da se razumemo: to je veličina celog elektroenergetskog sistema Brazila.

„Koristimo 100% obnovljivu energiju“ – i zašto to nije potpun odgovor

Kada se suoče sa ovim brojevima, tech kompanije uvek imaju isti odgovor: „Ali mi koristimo 100% obnovljivu energiju.“ Google, Microsoft, Amazon Web Services – svi su proglasili ovaj cilj ili ga već navodno ostvarili.

Ovo je tačno i netačno istovremeno, na način koji zahteva razumevanje kako električna mreža zapravo funkcioniše.

Additionality problem (problem adicionalnosti): Kada Microsoft kaže da koristi 100% obnovljivu energiju, to u praksi znači da kupuje RECs (Renewable Energy Certificates – sertifikate obnovljive energije) koji finansiraju solarne i vetroelektrane negde u mreži. Ali da li ta struja fizički ide u njihov data centar u Virdžiniji u trenutku kada je potrebna? Ne nužno. Fizičke elektrane – često fosilne – pokrivaju potražnju u realnom vremenu, dok se matematika usklađuje kroz certifikate.

Grid impact (uticaj na mrežu): Novo potražnje uvek se pokriva novom ponudom. Kada Microsoft izgradi novi ogromni data centar i poveća potrošnju za 5 GW, ta potražnja u kratkom roku nije pokrivena novim solarnim panelima – ona je pokrivena postojećim, dostupnim kapacitetom na mreži, koji u Americi i dalje uključuje značajan udeo gasa i uglja.

Google-ov vlastiti izveštaj kao dokaz: Ovo nije teorija. Google je sam dokumentovao u Environmental Report-u 2024. da mu apsolutne emisije rastu uprkos ogromnim investicijama u obnovljive izvore. Matematika je jednostavna: ako vaša potrošnja raste brže nego što možete da dodate čiste kapacitete – apsolutne emisije rastu, čak i ako procentualno ste na 100% obnovljive.

Ovo ne znači da su investicije u obnovljive izvore bezvredne – apsolutno nisu. Znači da je rast AI potrošnje energije toliko brz da čak i masovne zelene investicije ne mogu da ga prate tempom koji bi bio ekološki neutralan.

Vodeni problem: Kriza o kojoj se govori pretiho

Energija je tema koja dobija pažnju. Voda – mnogo manje. A vodeni otisak AI-a je možda ozbiljniji dugoročni problem od energetskog.

Data centri se hlade vodom. Ogromnim količinama vode. Serveri koji rade 24/7 generišu toplotu koja mora da se odvodi, i evaporativno hlađenje – evaporacija vode – je najefikasniji i najjeftiniji metod.

Microsoft je u svom Environmental Sustainability Report-u objavio da je potrošnja vode u njihovim data centrima porasla za 34% između 2021. i 2022. – direktno zbog AI workloada. To je godišnja potrošnja od skoro 7 miliona kubnih metara vode. Google je objavio 20% porast potrošnje vode u istom periodu.

Istraživači sa Universiteit van Colorado u studiji iz 2023. procenjuju da jedan razgovor sa ChatGPT-om od 20 do 50 pitanja potroši oko pola litre vode za hlađenje servera koji ga obrađuju. Ponovo – zvuči malo. Dok ne pomislite na globalnu skalu.

A onda pomislite gde se ti data centri grade. Često u regionima koji imaju pristup jeftinom struju ali ne i obilju vode. Iowa, Arizona, Nevada – sve su to američki centri data centar ekspanzije koji se nalaze u regionima sa rastućim водним stresem. Kada Microsoft najavi novi gigantski data centar u Phoenixu, gradu koji se bori sa sušom i padom nivoa Lake Mead – to nije samo energetsko pitanje.

U Čileu, lokalna zajednica je 2022. protestovala protiv Google data centra koji je planirao potrošnju vode u regionu pogođenom hroničnom sušom. U Holandiji, vlada je 2023. uvela moratorijum na nove data centre u Amsterdamu delimično zbog vodnih resursa. Ovo su lokalni sukobi koji signalizuju globalnu tenziju.

DeepSeek momenat: Efikasnost koja menja – ili ne menja – računicu

U januaru 2026. kineski startup DeepSeek objavio je model – DeepSeek R1 – koji je demonstrirao performanse komparabilne sa GPT-4 klasom modela, ali sa dramatično manjim računarskim troškovima tokom treniranja.

Ovo je izazvalo pravu tržišnu reakciju – Nvidia akcije su pale za 17% u jednom danu, jer je impliciralo da moćni AI ne zahteva nužno ogromne klastere skupih GPU-ova. I to je bila dobra vest za ekologiju – zar ne?

Ovde se susrećemo sa jednim od najvažnijih koncepata u energetskoj ekonomici: Jevons Paradox (Jevonsov paradoks).

William Stanley Jevons je 1865. primetio da su poboljšanja u efikasnosti parnih mašina – koja su smanjila potrošnju uglja po jedinici rada – dovela do povećane, a ne smanjene ukupne potrošnje uglja. Efikasnost je snizila cenu, snižena cena je povećala potražnju, povećana potražnja je potrošila više goriva nego što je efikasnost uštedela.

Isti paradoks važi za AI. Ako je trening modela 10x jeftiniji zahvaljujući efikasnijem pristupu – to ne znači 10x manje energije. To znači da 10x više kompanija može da trenira modele, da se trenira 10x više varijanti, da se pokreće 10x više eksperimenata. Ukupna energetska potrošnja može da poraste čak i ako je svaki individualni model efikasniji.

Goldman Sachs analitičari su ovo eksplicitno upozorili u analizi DeepSeek momenta: „Niže troškove vidimo kao katalizator za povećanje AI adopcije i ukupnih investicija, ne kao smanjivanje potražnje za energijom.“

Efikasnost je potrebna. Ali efikasnost bez ograničenja ukupne upotrebe ne rešava energetski problem – ona ga preraspodeljuje i potencijalno povećava.

Srbija i region: Zašto je ovo relevantno i ovde

Srbija troši oko 36 TWh električne energije godišnje, sa značajnim udelom termoelektrana koje su i stare i ekološki problematične. Elektroenergetski sistem je pod konstantnim pritiskom.

U ovom kontekstu, data centar ekspanzija u regionu nije apstraktna tema. Srbija, Hrvatska i Rumunija su identifikovane kao potencijalne lokacije za European data centar kapacitete upravo zato što imaju relativno jeftinu struju i neiskorišćene lokacije. Za ekonomiju – to su investicije i radna mesta. Za elektroenergetski sistem koji već muči sa kapacitetima – to je dodatan pritisak.

Srpska IT zajednica u velikoj meri koristi cloud servise – AWS, Azure, Google Cloud. Svi ti servisi su u osnovi energetska potrošnja na daljinu. Kada srpski developer deployuje workload na AWS us-east-1 regiju, on indirektno doprinosi potrošnji data centara u Virdžiniji koji su jednim delom napajani gasnim elektranama.

Ovo ne znači da developer treba da se oseća kriv. Znači da razumevanje energetskog otiska sopstvenog koda – koji model se koristi, koliko API poziva se pravi, da li postoji caching koji bi smanjio broj upita – postaje deo profesionalne odgovornosti koja ranije nije bila na radaru.

Nije sve crno: Realni razlozi za oprezni optimizam

Ovaj tekst ne bi bio kompletan bez poštenog pogleda na ono što industrija radi dobro – i na realne tehnološke pravce koji mogu promeniti jednačinu.

Efikasnost hardware-a se dramatično poboljšava. Nvidia H100 GPU je oko 3 puta energetski efikasniji od prethodne generacije A100 za AI workloade. H200 i Blackwell arhitektura nastavljaju taj trend. TSMC-ovi 3nm i 2nm procesi smanjuju energetsku potrošnju po tranzistoru. Apsolutna potrošnja raste, ali potrošnja po unit of compute (jedinici računanja) pada konzistentno.

Mixture-of-Experts arhitektura (MoE – arhitektura mešavine eksperata) aktivira samo deo modela po upitu, umesto da prolazi kroz celu neuronsku mrežu. Modeli kao Mixtral i Google-ov Gemini koriste ovu arhitekturu i demonstriraju da je moguće postići visoke performanse sa manjom prosečnom energetskom potrošnjom po inferencing upitu.

Lokalni modeli eliminišu data centar potrošnju. Llama 3.2, Phi-3, Mistral 7B i slični modeli mogu da rade na consumer hardveru – laptopima, gaming PC-ovima, čak i pametnim telefonima. Kada model radi lokalno, nema data centar potrošnje za inferencing. Ovo je posebno relevantno za privacy-sensitive use caseve gde ionako ne žele da šaljete podatke u cloud.

Nuclear renaissance (nuklearni preporod) kao realan odgovor. Microsoft je 2023. potpisao ugovor o kupovini struje od reaktora na Three Mile Island nuklearnoj elektrani koji je bio zatvoren, a koji se ponovo otvara. Google investira u Small Modular Reactors (SMR – mali modularni reaktori). Amazon ima slične dogovore. Nuklearna energija je bezemisiona u operativnom smislu i pruža konzistentan baseload kapacitet koji obnovljivi izvori ne mogu sami da obezbede.

Waste heat recovery (oporavak otpadne toplote) je oblast gde napredak ide sporije ali postoji. Data centri u Skandinaviji zagrevaju stambene zgrade otpadnom toplotom servera. Stockholm Data Parks je primer projekta gde je data centar integrisan u urbanu grejnu mrežu. Ako se otpadna toplota koristi umesto da se baca, energetski bilans se poboljšava.

Odgovornost developera: Šta vi možete da uradite

Ovo nije deo teksta koji apeluje na individualnu odgovornost kao zamenu za sistemske promene. Sistemske promene su potrebne i one ne mogu biti zamenjene individualnim izborima. Ali svest o energetskim implikacijama koda koji pišemo i AI alata koje koristimo – to je informisana profesionalna pozicija, a ne moralizam.

Bira se model koji je dovoljno dobar, ne uvek najveći. Za klasifikaciju teksta, ekstrakciju informacija, sumiranje kratkih tekstova – GPT-4o-mini ili Claude Haiku daju 90%+ performansi GPT-4 za 5-10% energetskog troška. Ako task ne zahteva najveći model – koristite manji. To je i jeftinije i ekološki bolje.

Caching smanjuje pozive. Semantic caching (semantičko keširanje) – čuvanje rezultata sličnih upita – može smanjiti broj stvarnih API poziva za 40-70% u aplikacijama koje primaju ponavljajuće upite od korisnika. Manje API poziva znači manje servera koji rade, znači manje energije.

Prompt engineering nije samo o kvalitetu outputa. Kraći, precizniji prompti koji daju iste rezultate kao dugački generički prompti direktno smanjuju tokenCount (broj tokena), a time i energetski trošak. Ovo je zanimljiv slučaj gde su tehnička i ekološka optimizacija iste optimizacije.

Meri i znaj. CodeCarbon i ML CO2 Impact su open-source alati koji mere energetsku potrošnju machine learning workloada. Ako ne merite – ne možete optimizovati.

Budućnost do 2030.: Tri moguća scenarija

Scenario 1 – Status quo (sadašnje stanje), samo veće: AI rast nastavlja trenutnom putanjom. Data centar potrošnja dostiže 2.000 TWh do 2030. Tech kompanije kupuju RECs i proglašavaju se zelenim dok apsolutne emisije rastu. Obnovljiva energija raste apsolutno, ali ne prati tempo rasta potrošnje. Vodeni stres u pojedinim regijama postaje lokalna kriza. Klimatski ciljevi za 2030. ostaju neostvareni za tech sektor.

Scenario 2 – Efikasnost pobeđuje Jevonsa: Kombinacija efikasnijih arhitektura, lokalnih modela i specijalizovanih chipova smanjuje energetski trošak po inference upitu za 90% u narednih 5 godina. Ukupna potrošnja i dalje raste, ali sporije od projkcija. Nuklearni i geotermalni kapaciteti popunjavaju gap koji solarni i vetro ne mogu. Tech sektor ostaje izazov, ali ne postaje dominantni ekološki problem.

Scenario 3 – Regulatorna intervencija: EU – konsistentno najspremnija regulatorna jurisdikcija za tech – uvodi obavezno energetsko labelovanje za AI servise, slično kalorijama na hrani. Kompanije moraju da objavljuju energetski otisak po usluzi. Korporativni kupci uključuju AI carbon footprint u ESG (Environmental, Social, Governance – ekološki, socijalni, upravljački) evaluacije. Ovo kreira tržišni pritisak za efikasnost koji politička deklaracija ne može.

Scenario 3 je jedini koji ima prethodnika koji je funkcionisao: EU Energy Label za kućanske aparate je demonstrirao da transparentnost potrošnje menja tržišna ponašanja bez zabrane tehnologije.

Nije pitanje da li imamo AI, nego koji AI i za šta

Muscle car nije loš automobil. Za određene svrhe – trke, demonstracije inženjerske moći, specifične primene gde je sirova snaga vrednost – to je pravo vozilo. Problem je kada ga svi voze do prodavnice jer je to jedino vozilo koje postoji, ili zato što niko nije razmišljao da li postoji bolji izbor za tu vožnju.

AI nije loša tehnologija. Za određene primene – medicinska dijagnostika, klimatsko modelovanje, otkrivanje lekova, infrastrukturna optimizacija – energetski trošak je očigledno opravdan. Ako AI sistem može da ubrza otkrivanje leka za rak ili da optimizuje elektroenergetsku mrežu da smanjuje gubitke – taj energetski trošak ima jasnu vrednost koja premašuje trošak.

Problem je kada isti energetski intenzivni sistemi generišu slike mačaka u svemiru, pišu emailove umesto nas ili odgovaraju na pitanja na koja postoji Google pretraga – i niko se ne pita da li veličina alata odgovara veličini zadatka.

To nije pitanje zabrane tehnologije. To je pitanje svesti i proporcionalnosti. Profesionalne zajednice – kao što je ona okupljena na ITNetwork.rs imaju kapacitet da razviju tu svest bolje nego prosečan korisnik, jer razumeju infrastrukturu iza servisa koje svi ostali uzimaju zdravo za gotovo.

Kilovati po promptu nisu apstraktna statistika. Oni su konkretna bušotina u podzemnim vodama Arizone, konkretni tonovi CO2 u atmosferi i konkretan zalog energetske budućnosti koju delimo – IT industrija i svi ostali koji žive na istoj planeti.

Znati to ne menja svet. Ali promena počinje sa znanjem.