"Digitalne grejalice": Kako je AI stvorio energetski pakao, i zašto je budućnost u analognoj (i svetlosnoj) revoluciji

Nalazimo se usred najveće tehnološke revolucije od postanka interneta. Generativna AI (GenAI) je eksplodirala. ChatGPT, Sora, Claude, Midjourney. U dve godine, prešli smo put od „igračke“ do alata koji piše kod, stvara umetnost i preti da redefiniše svaku industriju. Mi, kao IT zajednica, aplaudiramo. Slavimo „inteligenciju“ koja se rađa.

Ali, na portalu ITNetwork.rs, gde se tehnologija gleda „ispod haube“ a ne kroz PR filtere, moramo da upalimo svetlo i pogledamo u mračni, bučni ugao sobe. Moramo da pričamo o prljavoj tajni ove revolucije. A tajna je: naša „digitalna“ AI revolucija radi na parnu mašinu.

Evo surove istine: Arhitektura koja pokreće ChatGPT – digitalni, silicijumski GPU (Graphics Processing Unit) – je fundamentalno zastarela i neodrživa za posao koji radi.

Nvidia H100, „zver“ koja pokreće AI svet, košta 40.000 dolara i troši 700W struje pod punim opterećenjem. Jedan rack (ormar) pun ovih kartica troši struje kao celo naselje.
Data centri koji treniraju ove modele (kao oni koje koristi Google ili Meta) postali su „digitalne grejalice“ veličine grada. Gutaju teravate električne energije, od čega ogroman deo bacaju na hlađenje. (Analizirali smo ovo u našem tekstu o „Zelenom Računarstvu“).

Mi smo u problemu. Murov zakon (Moore’s Law) (koji je predviđao da se broj tranzistora duploira svake dve godine) je mrtav. Ne možemo više da „smanjujemo“ čipove, a da ostanu efikasni. Silicijum je dostigao svoj fizički limit. A naša glad za AI-jem? Ona je eksponencijalna.

Tražimo spas. I mediji su nam dali „spasioca“ – Kvantno Računarstvo (Quantum Computing). Mitska mašina koja će rešiti sve. Ali, ovo je oštra polemika koja tvrdi: Kvantum je pogrešan odgovor na pogrešno pitanje.

Ovo je analiza stvarne revolucije. Revolucije koja se dešava sada, u tišini. Revolucije koja kaže da je budućnost – manje digitalna. Ovo je priča o Analognim AI Čipovima i Optičkom Računarstvu (Optical Computing). O mašinama koje ne računaju na elektronima, već na fotonima (svetlosti). O mašinama koje se vraćaju analognom signalu jer su shvatile da je priroda (i naš mozak) u pravu.

Zaboravite „apokalipsu“ (Y2Q) i „hajp“ (Quantum). Stvarna bitka za budućnost AI-ja vodi se na nivou fizike. A silicijum gubi.

Poglavlje 1: „Zid“ – Zašto je Nvidia (i Intel, i AMD) udarila u fiziku

Da bismo razumeli zašto nam treba nova arhitektura, moramo da seciramo zašto je stara (digitalna, silicijumska) propala. Problem nije u tome što Nvidia H100 nije „brz“. Problem je što je on fundamentalno neefikasan za posao koji radi (AI). Naš „digitalni“ svet pati od dva smrtonosna greha.

1.1. Greh #1: „Tiranija Nule i Jedinice“ (Digitalna neefikasnost)

Problem: Digitalni računari su opsednuti preciznošću. Sve mora biti savršena Nula (0 Volt) ili savršena Jedinica (npr. 1 Volt).
Posao AI-ja (Deep Learning): AI ne radi sa preciznošću. On radi sa „fazi“ (fuzzy) logikom. On radi sa verovatnoćama i ponderima (weights).
Analiza: Kada AI model (neuronska mreža) uči, on radi jednu operaciju bilionima puta: Matrix Multiplication (Množenje matrica). To je gomila „množenja i sabiranja“.
Neefikasnost: Da bi digitalni čip (GPU) pomnožio dva broja (npr. 0.345 i 0.789), on mora da koristi hiljade tranzistora i kompleksnu logiku (ALU) da bi dobio savršeno tačan rezultat (npr. 0.272205).
Pitanje: Da li AI-ju treba ta preciznost? Ne. AI-ju je dovoljno da zna da je rezultat „oko 0.27„.
Zaključak: Mi koristimo hirurški skalpel (digitalni čip) da bismo zakucali ekser. To je suludo rasipanje energije.

1.2. Greh #2: „Von Neumann-ov Zastoj“ (Problem transporta)

Ovo je najveći arhitektonski problem od 1945. godine. Zove se Von Neumann Bottleneck (Fon Nojmanovo usko grlo).

Arhitektura: Imamo CPU/GPU (mozak, procesor) i imamo Memoriju (RAM/VRAM, gde su podaci).
Problem: Da bi procesor obradio podatak, on mora da ga dovuče iz memorije. Taj put (magistrala, bus) je „seoski put“ (kako smo ga već nazivali).
AI Katastrofa: Moderni AI modeli (LLM-ovi) su džinovski. Imaju milijarde (uskoro trilione) parametara (pondera). Oni ne staju u memoriju čipa.
Realnost (Pakao latencije): Vaš moćni H100 GPU provodi 90% svog vremena čekajući! Čeka da podaci (ponderi) stignu iz spore VRAM memorije. On radi 10% vremena, a 90% „zeva“.
Posledica: Mi ne računamo brzinom čipa. Mi računamo brzinom „seoskog puta“ između čipa i memorije.
Gubitak energije: Ovo „šetanje“ podataka tamo-vamo troši 95% ukupne energije. Samo 5% se troši na stvarno računanje.

Rezime problema: Naš AI sistem je kao da imate 1.000 briljantnih kuvara (procesor) koji stoje u kuhinji, ali imate samo jedna vrata (memorijska magistrala) kroz koja im donosite jedan po jedan sastojak (podatak). To je skupo, sporo i neefikasno.

Poglavlje 2: Povratak korenima – Analogno Računarstvo (Rešenje #1)

Kako rešiti ova dva problema? Rešenje za problem #1 (digitalna neefikasnost) je radikalno: Hajde da prestanemo da budemo digitalni. Hajde da se vratimo u Analogno Računarstvo (Analog Computing).

2.1. Mozak kao inspiracija

Naš mozak je savršeni analogni kompjuter.

Brojke (Ljudski Mozak):
- Potrošnja: ~20 Vati (kao sijalica).
- Brzina: Spor. Neuroni „rade“ na ~100-200 Hz.
Brojke (Nvidia H100 GPU):
- Potrošnja: ~700 Vati (kao mikrotalasna).
- Brzina: Super-brz. Radi na ~1.8 GHz.
Zaključak: Mozak je milionima puta energetski efikasniji. Zašto? Zato što je analogan i masivno paralelan.
Mozak ne šalje „nule“ i „jedinice“. On šalje signale različite jačine (analogne). I ne premešta podatke iz „memorije“ u „procesor“. Njemu je memorija (sinapsa) istovremeno i procesor.

2.2. „Računanje u Memoriji“ (In-Memory / Analog AI)

Kako ovo primeniti na silicijum?

Problem: AI radi Množenje Matrica (A * B = C).
Digitalni način: Donesi A, donesi B, pomnoži, saberi, pošalji C nazad u memoriju. Ponavljaj milion puta. (Spora magistrala, Greh #2).
Analogni način (Genijalnost): Iskoristimo fiziku. Setimo se Omovog zakona (Ohm’s Law) iz osnovne škole: Struja (I) = Napon (V) / Otpor (R).
Arhitektura: Napravite „Crossbar“ (unakrsnu) mrežu.
- Horizontalne linije su ulazi (vaši podaci, V).
- Vertikalne linije su izlazi (rezultat, I).
- Na svakom ukrštanju (spoju) nalazi se memorijska ćelija koja se ponaša kao promenljivi otpornik (Resistor) (npr. Flash memorija, ReRAM). Taj otpor (R) jeste AI „ponder“ (težina) koji je naučen tokom treninga.
Kako radi:
1. Pustite sve vaše ulazne podatke (npr. pikseli slike) kao analogne napone (V) niz horizontalne linije… SVE ODJEDNOM.
2. Struja (I) prolazi kroz otpornike (R).
3. Po Kirhofovom zakonu (Kirchhoff’s Law), struje se automatski, fizički sabiraju na vertikalnim linijama.
4. Ono što očitate na dnu vertikalnih linija JESTE finalni rezultat množenja matrice.
Rezultat:
- Rešen Greh #2 (Von Neumann): Nema „šetanja“ podataka. Računanje se dešava direktno u memoriji (In-Memory Computing).
- Rešen Greh #1 (Digital): Operacija je analogna. Nema miliona tranzistora.
Posledica: Ovi čipovi su 100 do 1.000 puta energetski efikasniji od Nvidia GPU-a.

2.3. Ko ovo radi (i koji je „štos“)?

Igrači: Startapi kao Mythic, Ambient, Rain Neuromorphics, ali i giganti kao IBM Research (imaju proof-of-concept čipove).
„Štos“ (Problem): Analogno je „bučno“ (noisy). Nije savršeno precizno.
Odgovor: Koga briga? AI-ju ne treba savršena preciznost. „Dovoljno dobro“ je, u ovom slučaju, savršeno.
Tržište: Ovi čipovi neće zameniti Nvidiju u data centrima (za sada). Oni su savršeni za Edge AI – za vaš telefon, auto, dron ili pametnu kameru. Za uređaje koji moraju da budu „pametni“, ali nemaju pristup termoelektrani (ne mogu da troše 700W).

Poglavlje 3: Računanje brzinom svetlosti – Optičko Računarstvo (Rešenje #2)

Analogni pristup rešava energetski problem. Ali je i dalje (relativno) spor. Kako rešiti brzinski problem i energetski problem istovremeno? Odgovor: Prestanite da koristite elektrone. Počnite da koristite fotone (svetlost).

Ovo je Optičko Računarstvo (Optical Computing) ili Fotonika (Photonics).

3.1. Zašto su Elektroni „Smrt“

Kao što smo rekli, Fon Nojmanov zastoj je transportni problem. A mi za transport koristimo elektrone (struju) kroz bakarne žice (na čipu ili ploči).

Problem sa Elektronima:
1. Imaju masu i naboj (charge).
2. Kada se kreću, udaraju jedni u druge i u atome bakra. To stvara Otpor (Resistance).
3. Otpor stvara Toplotu (Heat).
4. Ta toplota ograničava koliko brzo možete da ih gurate (takt).
5. Takođe, jedna „žica“ može da nosi jedan signal. Ako hoćete 100 signala, treba vam 100 žica (zato je GPU ogroman).

3.2. Zašto su Fotoni (Svetlost) „Raj“

Problem sa Fotonima:
1. Nemaju masu. Nemaju naboj.
2. Kada se kreću (kroz optičko vlakno ili talasovod na čipu), oni ne stvaraju otpor. Ne udaraju jedni u druge.
3. Ne stvaraju (skoro) nikakvu toplotu.
4. Kreću se brzinom svetlosti.
5. Bonus (WDM): Kroz jedno optičko vlakno, možete poslati hiljade različitih signala istovremeno (različite boje/talasne dužine svetlosti).

Zaključak: Prelazak sa elektrona na fotone (bar za transport podataka) rešava i problem brzine (latencije) i problem energije (toplote).

3.3. Kako „Računati“ Svetlošću? (Arhitektura)

OK, transport je super. Ali kako da računamo svetlom? Kako da napravimo „optički procesor“? Ne možemo da napravimo „foton-ski tranzistor“ (bar ne lako). Moramo da koristimo druge trikove. Ispostavlja se da je Matrix Multiplication (opet on!) savršen za optiku.

Metod #1: „Hibridni“ (Analogno-Optički)
- Igrači: Lightmatter, Luminous Computing, Lightelligence.
- Kako radi: Ovo je genijalno. Spajaju oba rešenja.
1. Koriste Fotoniku (Svetlost) da reše Greh #2 (Transport). Podaci (AI ponderi) putuju brzinom svetlosti unutar čipa.
2. Koriste Analogno Računarstvo (Struja) da reše Greh #1 (Efikasnost). Računanje se dešava u memoriji (In-Memory Computing).
- Proizvod (Primer: Lightmatter „Envise“): Ovo je već komercijalni proizvod. To je čip koji spaja fotoniku i elektroniku. Tvrde da su 10-100 puta brži i efikasniji od Nvidia A100/H100 za specifične AI zadatke (kao BERT ili GPT).
Metod #2: „Čista“ Optika (Računanje objektivom)
- Ideja: Zašto uopšte koristiti elektrone? Možemo da računamo samo svetlom.
- Kako radi (Popularno): Množenje matrica je, u suštini, prelamanje svetlosti.
- Zamislite da su vaši ulazni podaci (matrica A) snopovi lasera različite jačine.
- Zamislite da su vaši AI ponderi (matrica B) sistem sočiva i filtera (npr. LCD ekran koji menja prozirnost).
- Računanje: Vi „propustite“ laser (A) kroz filter (B). Ono što izađe sa druge strane (snop svetlosti drugačije jačine) JESTE rezultat množenja (C).
- Brzina: Operacija se desila bukvalno brzinom svetlosti. Za vreme koje je elektronu trebalo da pređe 1 milimetar, foton je rešio ceo problem.
„Štos“ (Problem): „Programiranje“ ovih filtera je (za sada) sporo. I dalje morate digitalno reći filteru kakav da bude. Zato je hibridni model (kao Lightmatter) trenutno najrealnija opcija.

Poglavlje 4: Optika vs. Kvantum – Zašto je ovo „Sledeći Korak“?

E, sada stižemo do ključne teze. Zašto se kladiti na Optiku, kad je Kvantum „ultimativni“ odgovor? Ovo je fundamentalno nerazumevanje problema.

Kvantno Računarstvo (QC):
- Šta rešava: Rešava specifične, eksponencijalne probleme koje klasični računari nikada neće moći (npr. Shor-ov algoritam za lomljenje enkripcije, simulacija molekula za lekove).
- Status: U NISQ eri (Noisy Intermediate-Scale Quantum). „Bučan“ je, nestabilan.
- Uslovi: Radi na apsolutnoj nuli (-273.15°C). Zahteva „frižider“ veličine sobe.
- Metafora: To je „bolid Formule 1“. Neverovatno je brz za jednu specifičnu stazu (problem), ali je beskoristan za vožnju do prodavnice.
Optičko Računarstvo (OC) / Analogno:
- Šta rešava: Rešava današnji, najveći problem: AI i Big Data (Matrix Multiplication). Rešava energetsku krizu i Von Neumann-ov zastoj.
- Status: Komercijalno dostupan (ili na ivici).
- Uslovi: Radi na sobnoj temperaturi. Staje u isti rack u data centru gde stoji i Nvidia.
- Metafora: To je „Tesla“ (ili pre Rivian). Možda je još uvek skup, ali je dizajniran za današnje puteve i današnje probleme.

Oštra istina: Ovo dvoje nisu konkurenti. Oni su komplementarni. Optika je „Danas“ i „Sutra“ (2025-2035). Kvantum je „Prekosutra“ (2040+). Dok čekamo da Kvantum reši nemoguće, Optika će rešiti neophodno. A to je: kako da nastavimo AI revoluciju, a da ne ugasimo struju na celoj planeti?

Poglavlje 5: „Silicijumska Dolina“ protiv „Fakulteta Fizike“

Šta ovo znači za Srbiju? Gde smo mi u ovoj trci svetlosti? Mi ne pravimo čipove. Mi nismo TSMC (Tajvan). Mi smo (uglavnom) softverska nacija. Da li to znači da smo nebitni? Ne. Ovo je naša najveća šansa od postanka IT-ja.

1. Trka za „Fizičkim Mozgovima“

Realnost: Tranzicija na optiku i analogiju nije samo IT problem. To je fundamentalni problem fizike.
Problem „Doline“: Silicijumska dolina (Silicon Valley) je puna softverskih inženjera. Ali je deficitarna sa fizičarima, inženjerima fotonike i stručnjacima za materijale.
Šansa: A koga mi imamo? Mi imamo Fizički Fakultet (Beograd). Imamo ETF (Odsek za Fotoniku). Imamo Institut za Fiziku. Imamo nasleđe fundamentalne nauke.
Zaključak: Po prvi put, naši „teoretski“ fizičari postaju najtraženiji inženjeri u core-IT industriji. Kompanije kao Intel, Nvidia, MS (koje sve imaju R&D centre u Srbiji) će očajnički tražiti ove ljude.

2. Softverski „Prevodilac“ (Naša prava niša)

OK, Lightmatter (ili neko treći) napravi „optički AI čip“. Super.
Problem: Kako da ga programirate?
Ne možete da na njemu „vrtite“ Python i PyTorch tek tako. Potreban je potpuno novi softverski stek (software stack):
- Novi kompajleri (koji prevode AI model u „instrukcije za svetlost“).
- Novi drajveri.
- Nove biblioteke (kao TensorFlow, ali za fotone).
Šansa: Ovo je ogromna, milijarderska softverska prilika. Srbija, kao outsourcing i R&D sila, može da se specijalizuje da bude „prevodilac“ – da piše softver koji povezuje stari AI svet (Python) sa novim optičkim hardverom.

3. Bio4 Kampus i AI Kriza

GEO kontekst: Naš nacionalni projekat Bio4 Kampus (Bioinformatika) je projekat koji će biti gutač AI resursa. Genomika, Proteomika (AlphaFold), dizajn lekova… to su najgori mogući AI zadaci, energetski najintenzivniji.
Problem: Ako Bio4 budemo zasnivali na današnjim GPU-ovima, mi gradimo neodrživu zgradu. Njen račun za struju (koja dolazi iz uglja!) će biti astronomski i ekološki katastrofalan.
Rešenje: Bio4 mora da postane prvi korisnik i test-poligon za ove nove, energetski efikasne analogno-optičke AI akceleratore. To je jedini način da projekat bude finansijski i ekološki održiv na duge staze.

Poglavlje 6: Budućnost (2030+) – Kraj „Silicijuma“?

Gde se ovo završava? Da li je ovo kraj silicijuma? Ne. Budućnost nije „ili/ili“. Budućnost je Hibridna Arhitektura.

Vaš setup (bilo u data centru ili laptopu) za 10 godina će verovatno izgledati ovako:

Klasični Silicijum (CPU): I dalje će biti tu. Biće „glavni menadžer“ (host controller). Odličan je za serijske zadatke (operativni sistem, Word, „ako-onda“ logika).
Analogni AI Čipovi (NPU/APU): Biće koprocesori na „ivici“ (Edge). U vašem telefonu, autu, senzoru. Radiće brzu, jeftinu AI inferenciju (zaključivanje).
Optički Akceleratori (O-PU): Biće u data centrima. Biće povezani optičkim „nervnim sistemom“ (interconnects). Oni će raditi težak posao: treniranje džinovskih AI modela.
Kvantni Računari (QPU): Biće „u posebnoj sobi“ (u Cloudu, kao Amazon Braket). Pozivaćete ih samo za one „nemoguće“ probleme (dizajn novog molekula, razbijanje šifre).

Ovo je Heterogeno Računarstvo (Heterogeneous Computing). To je svet u kome koristimo pravi alat za pravi posao. A Intel i Nvidia to znaju. Njihova trka više nije „ko ima više GHz“. Njihova trka je: „Ko će prvi da integriše fotoniku (svetlost) na isti čip sa silicijumom (elektronima)?“ Taj proces se zove Silicon Photonics (Silicijumska Fotonika). I to je prava trka za bilion dolara.

Buđenje iz „Digitalnog Sna“

Era „glupog“ digitalnog rasta je gotova. Murov zakon nas je razmazio, ali fizika nam je ispostavila račun. A račun se zove toplota i potrošnja energije.

Glad za AI-jem je stvorila krizu, ali ta ista kriza tera industriju na najveću inovaciju u poslednjih 50 godina. Tera nas da se probudimo iz „digitalnog sna“ (0 i 1) i da se setimo da računanje može da se radi i drugačije. Analogno, kao naš mozak. Optički, brzinom svetlosti.

Za Srbiju, ovo je trenutak otrežnjenja. Možemo da nastavimo da budemo samo „potrošači“ Nvidijinih skupih, „vrućih“ kartica, radeći kao „digitalne grejalice“ na ugalj. Ili možemo da iskoristimo naše „tajno oružje“ – naše fundamentalno znanje fizike, matematike i softverskog inženjeringa – i da postanemo arhitekti ove nove, efikasne, svetlosne ere.

Voz je krenuo. A ovog puta, ne pokreću ga elektroni. Pokreću ga fotoni. I juri brzinom svetlosti.

„Digitalne grejalice“: Kako je AI stvorio energetski pakao, i zašto je budućnost u analognoj (i svetlosnoj) revoluciji

Analiza zašto je Nvidia GPU "dinosaur", zašto je Murov zakon mrtav, i da li je Optičko Računarstvo stvarna revolucija koju smo čekali (dok smo sanjali o Kvantumu).