Home AIRat za AI čipove: Ko pobeđuje i šta to znači za vaš sledeći PC, server ili projekat mašinskog učenja?

Rat za AI čipove: Ko pobeđuje i šta to znači za vaš sledeći PC, server ili projekat mašinskog učenja?

od itn
AI čipovi tržište

U srcu tehnološke revolucije koja definiše našu eru, odvija se tihi, ali nemilosrdni rat. To nije rat za teritoriju ili naftu, već za silicijum – osnovni element na kojem se gradi budućnost veštačke inteligencije. Veliki jezički modeli, autonomna vozila, medicinska dijagnostika i sve ono što smatramo „AI“ magijom, počiva na plećima specijalizovanih procesora enormne snage. Bitka za dominaciju u proizvodnji ovih AI čipova dostigla je tačku ključanja, a glavni borci – Nvidia, AMD, Intel i Apple – ne ulažu samo milijarde dolara u istraživanje i razvoj, već i oblikuju putanju celokupnog tehnološkog napretka.

Nvidia, neprikosnoveni kralj ovog prostora, sa svakom novom arhitekturom postavlja lestvicu više, trenutno sa zastrašujućom Blackwell platformom i već najavljenom Rubin generacijom. AMD, kao večiti i uporni izazivač, uzvraća udarac svojim moćnim Instinct akceleratorima, kladeći se na otvorene standarde. Intel, gigant koji se budi, agresivno se vraća u igru sa svojim Gaudi čipovima, dok Apple, iz svog besprekorno uređenog ekosistema, vodi sopstvenu, tihu revoluciju sa M-serijom čipova, fokusirajući se na AI na samom uređaju.

Ovaj sukob titana nije samo priča za poslovne magazine. Posledice njihovih pobeda i poraza direktno se prelivaju na sve nas. Od cene i mogućnosti vašeg sledećeg laptopa ili gejming računara, preko odluke da li vaša firma treba da investira u skupe servere ili da koristi cloud rešenja, do same dostupnosti tehnologije za AI projekte u Srbiji.

Ovaj tekst je detaljna mapa ovog bojnog polja za 2025. godinu. Zaronićemo duboko u arhitekture, analizirati strategije giganata, objasniti zašto je NPU (Neural Processing Unit) postao najvažniji novi termin u svetu laptopova i pružiti konkretne, praktične savete koji će vam pomoći da donesete najbolju moguću odluku – bilo da ste gejmer, student, developer ili donosilac odluka u kompaniji.

AI čipovi tržišteNvidia: Kralj na tronu od silicijuma

Da bismo razumeli trenutno stanje, moramo priznati jednu činjenicu: ovo je i dalje svet koji je Nvidia izgradila. Njihova vizija, koja je započela pre više od jedne decenije sa CUDA (Compute Unified Device Architecture) platformom, pretvorila je gejming GPU-ove u moćne alate za naučna izračunavanja, a kasnije i za mašinsko učenje. CUDA je danas Nvidijin „ekonomski šanac“ – ogroman ekosistem softvera, biblioteka i obučenih developera koji čini prelazak na konkurentske platforme teškim i sporim.

Dok su prethodne generacije poput Hopper (H100/H200) zacementirale njihovu dominaciju, lansiranje Blackwell arhitekture krajem 2024. i početkom 2025. godine nije bio samo korak, već tektonski skok.

Upoznajte Blackwell: Monstrum za AI trening

Platforma Blackwell, otelotvorena u čipovima kao što su B200 i superčip GB200 (koji spaja dva B200 GPU-a sa jednim Grace CPU-om), dizajnirana je sa jednim ciljem: da obučava sve veće i kompleksnije AI modele brže i efikasnije nego ikada pre. Šta je čini tako moćnom?

  1. Čista snaga: Jedan B200 GPU nudi performanse koje se mere u desetinama petaflopsa (jedan petaflops je hiljadu biliona operacija u sekundi) za AI radna opterećenja. To je red veličine više u odnosu na već impresivnu prethodnu generaciju.
  2. Druga generacija Transformer Engine-a: Transformer arhitektura je u srcu modela poput GPT-4. Blackwell poseduje specijalizovan hardver koji dramatično ubrzava ključne matematičke operacije potrebne za ove modele, inteligentno koristeći nižu preciznost računanja bez gubitka tačnosti.
  3. NVLink 5.0: U svetu treniranja velikih modela, nijedan GPU ne radi sam. NVLink je superbrza interkonekcija koja omogućava hiljadama Blackwell GPU-ova da komuniciraju i rade kao jedan, gigantski mozak. Peta generacija ovog linka ima propusnu moć od neverovatnih 1.8 terabajta u sekundi.

Rubin na horizontu: Nema odmora za konkurenciju

Kao da Blackwell nije bio dovoljan šok za sistem, CEO Nvidije, Jensen Huang, već je najavio naslednika – arhitekturu Rubin, planiranu za 2026. godinu. Ovo pokazuje nemilosrdan, jednogodišnji ritam inovacija koji ima za cilj da konkurenciji ne ostavi ni najmanje prostora za disanje. Detalji su šturi, ali poruka je jasna: dok se vi borite sa našom sadašnjom tehnologijom, mi već gradimo onu koja će je učiniti zastarelom.

Nvidijina dominacija je stvarna, ali njen najveći izazov nije samo tehnološki, već i filozofski. Zatvorenost CUDA ekosistema, iako je njihova najveća snaga, istovremeno je i najveća meta za napade konkurencije.

AI čipovi tržišteIzazivači: Borba za parče AI kolača

Tržište ne voli monopol. Visoke cene i ograničena dostupnost Nvidijinih čipova stvorili su ogroman apetit za alternativama. Nekoliko kompanija je spremno da uskoči u tu arenu.

AMD-ov otvoreni gambit: Instinct i ROCm

AMD (Advanced Micro Devices) je najozbiljniji takmac Nvidiji u data centru. Njihova strategija je dvostruka: parirati Nvidiji u performansama i napasti njihovu najveću slabost – zatvorenost CUDA ekosistema.

Njihov glavni adut je serija akceleratora Instinct, sa MI300X kao trenutnim šampionom i naslednicima (MI350/MI400 serija) koji se očekuju. MI300X je impresivan komad hardvera, koji kombinuje GPU i memoriju na način koji ga čini izuzetno efikasnim za pokretanje (inferenciju) velikih jezičkih modela.

Ali pravo oružje AMD-a nije samo hardver, već ROCm (Radeon Open Compute platform). ROCm je AMD-ov odgovor na CUDA – potpuno otvorena softverska platforma koja omogućava developerima da pišu kod koji može da se izvršava na različitim tipovima hardvera. Iako je ROCm ekosistem i dalje daleko manji i manje zreo od CUDA, njegova otvorenost privlači velike cloud provajdere i kompanije koje žele da izbegnu „zaključavanje“ u Nvidijin svet. AMD igra dugu igru, nadajući se da će želja za slobodom i nižim cenama postepeno nagrizati Nvidijin šanac.

Intel-ov povratak: Gaudi kao pragmatična alternativa

Nakon nekoliko posrtanja, Intel se vraća u AI arenu sa jasnom i pragmatičnom strategijom. Njihovi Gaudi akceleratori, trenutno u trećoj generaciji (Gaudi 3), ne pokušavaju da obore sve rekorde u sirovim performansama. Umesto toga, oni nude odličan odnos cene i performansi i, slično kao AMD, grade na otvorenim standardima.

Intelova prednost je njihova duboka integracija u data centre širom sveta sa Xeon CPU-ovima. Oni nude kompletno rešenje, od procesora opšte namene do specijalizovanih AI akceleratora, što je privlačno za velike enterprise klijente. Gaudi 3 se pozicionira kao direktan konkurent Nvidijinim starijim, ali i dalje popularnim H100 čipovima, nudeći slične performanse po znatno nižoj ceni.

rat aiApple-ov zlatni kavez: Revolucija na uređaju

Apple vodi potpuno drugačiju bitku. Njih ne zanima prodaja pojedinačnih čipova za data centre. Njihov cilj je dominacija u on-device AI – veštačkoj inteligenciji koja se izvršava direktno na vašem iPhone-u, iPad-u ili Mac-u.

Sa svojom M-serijom čipova (M4 i budući M5), Apple je postigao nešto izvanredno. Kroz potpunu kontrolu nad hardverom i softverom, oni su kreirali izuzetno efikasne čipove koji integrišu CPU, GPU i, što je najvažnije, moćan Neural Engine (Apple-ov naziv za NPU) na jednom komadu silicijuma. Ovo im omogućava da izvršavaju kompleksne AI zadatke, poput napredne obrade fotografija, prepoznavanja govora i novih funkcija u macOS-u i iOS-u, sa minimalnom potrošnjom energije. Apple-ov ekosistem je „zlatni kavez“ – neverovatno moćan i efikasan za one koji su unutra, ali potpuno zatvoren za spoljni svet.

Revolucija u vašem laptopu: Uspon NPU-a

Dok se rat za data centre vodi u medijima, tiša, ali podjednako važna revolucija dešava se unutar laptopova koje ćemo kupovati ove i sledeće godine. Ključna reč je NPU (Neural Processing Unit).

Šta je, zapravo, NPU?

Zamislite da je vaš laptop mala kompanija.

  • CPU (Central Processing Unit) je generalni direktor. On je svestran, donosi odluke i upravlja svim glavnim operacijama.
  • GPU (Graphics Processing Unit) je kreativni genije, umetnik. On je specijalizovan za masovne, paralelne zadatke, kao što je iscrtavanje miliona piksela u video igri.
  • NPU (Neural Processing Unit) je novi, visoko specijalizovani član tima – ekspert za finansije. On je dizajniran da radi samo jednu vrstu posla, ali to radi neverovatno efikasno i sa minimalnim utroškom resursa. Njegov posao su matrice i vektori, osnovni gradivni blokovi neuronskih mreža.

Zadaci poput zamućivanja pozadine tokom video poziva, prevođenja u realnom vremenu, ili pokretanja Windows Copilot+ funkcija su konstantna, ali ne previše intenzivna AI opterećenja. Kada NPU preuzme ove zadatke, on oslobađa CPU i GPU da se bave onim što najbolje rade, što rezultira boljim performansama sistema i, što je najvažnije, drastično dužim trajanjem baterije.

U 2025. godini, NPU postaje standard. Svi veliki igrači su u igri. Intel sa svojim Lunar Lake procesorima, AMD sa Strix Point (Ryzen AI) serijom, i Qualcomm, koji je sa svojim Snapdragon X Elite čipom napravio pometnju na tržištu Windows laptopova, svi oni integrišu moćne NPU-ove kao ključnu komponentu „AI PC“ ere. Kupovina laptopa bez sposobnog NPU-a danas je kao kupovina pametnog telefona bez dobre kamere pre nekoliko godina – kratkovida odluka.

aiDilema developera u Srbiji: Sopstveni hardver ili Cloud?

Sva ova tehnologija je impresivna, ali postavlja ključno pitanje za developere, startape i istraživače u Srbiji: kako joj pristupiti? Da li se isplati ulaziti u veliku investiciju i kupovati sopstveni hardver, ili je pametnije iznajmljivati snagu iz oblaka (cloud)? Odgovor zavisi isključivo od vaših potreba.

Kriterijum Sopstveni hardver (On-Premise) Cloud rešenja (AWS, Azure, GCP)
Početna investicija Visoka. Kupovina moćnog GPU-a (npr. Nvidia RTX 5090) ili radne stanice košta više hiljada evra. Niska. Nema početnih troškova, plaćate samo ono što koristite, po satu.
Operativni troškovi Fiksni. Nakon kupovine, glavni trošak je struja. Varijabilni. Mogu brzo da eskaliraju sa dužinom i intenzitetom korišćenja.
Pristup hardveru Konstantan. Vaša mašina je uvek dostupna za rad, eksperimentisanje i učenje, 24/7. Na zahtev. Pristup je trenutan, ali svaki sat košta. Nije idealno za duge, nepredvidive sesije učenja.
Najnovija tehnologija Ograničen. Teško je pratiti tempo i imati pristup najnovijim data centar čipovima (npr. Blackwell). Neograničen. Cloud provajderi nude pristup najmoćnijim i najnovijim akceleratorima čim postanu dostupni.
Skalabilnost Teška. Ako vam zatreba više snage, morate kupiti još hardvera. Laka. Možete skalirati sa jednog GPU-a na stotine ili hiljade za nekoliko minuta.
Održavanje Vaša odgovornost. Vi ste zaduženi za hlađenje, napajanje, softverske drajvere i održavanje sistema. Nema brige. Provajder se brine o svemu.
  • Studenti i istraživači: Za učenje osnova mašinskog učenja, eksperimentisanje sa manjim modelima i razvoj veština, posedovanje sopstvenog PC-a sa moćnim Nvidia RTX GPU-om je gotovo neprocenjivo. Sloboda da testirate i grešite bez gledanja na sat koji otkucava dolare je ključna za učenje.
  • Frilenseri i mali timovi: Ako konstantno radite na manjim i srednjim AI projektima (npr. fine-tuning postojećih modela, razvoj aplikacija sa AI komponentom), investicija u moćnu radnu stanicu se može isplatiti za 6-12 meseci u poređenju sa troškovima clouda.
  • Rad sa osetljivim podacima: Ako radite sa podacima koji ne smeju da napuste vašu lokaciju iz pravnih ili bezbednosnih razloga.

Kada koristiti cloud rešenja?

  • Treniranje velikih modela: Ako vaš projekat podrazumeva treniranje jezičkog ili vizuelnog modela od nule, cloud je jedina opcija. Potrebna snaga (desetine ili stotine GPU-ova koji rade nedeljama) je preskupa za kupovinu.
  • Startapi u ranoj fazi: Kada je vaš protok posla nepredvidiv, cloud nudi fleksibilnost da plaćate samo kada vam je snaga zaista potrebna, čuvajući vaš kapital za druge stvari.
  • Potreba za najnovijom tehnologijom: Ako vaš algoritam zahteva najnovije i najbolje, kao što su Nvidia B200 ili AMD MI300X, cloud je jedini način da im pristupite.

AI čipovi tržišteKonačna presuda: Koji čip je za vas u 2025. godini?

  • Za PC gejmera koji želi da eksperimentiše sa AI: Nvidia GeForce RTX 50-serija (npr. 5080/5090). Dobijate vrhunske gejming performanse i pristup zrelom CUDA ekosistemu za pokretanje Stable Diffusion-a, LLM-ova lokalno i drugih AI alata.
  • Za ozbiljnog ML developera ili istraživača u Srbiji: Nvidia RTX ili Pro serija. Iako je podrška za AMD ROCm sve bolja, realnost je da je 99% tutorijala, istraživačkih radova i gotovih rešenja i dalje bazirano na CUDA. Nvidia je pragmatičan i sigurniji izbor koji štedi vreme.
  • Za kupca novog laptopa (bilo koje namene): Bilo koji sa moćnim NPU-om. Proverite specifikacije za „TOPS“ (Trillions of Operations Per Second) koje NPU nudi. Veći broj je bolji i osigurava da će vaš laptop biti spreman za talas AI funkcija koje dolaze u operativne sisteme i aplikacije.
  • Za kompaniju koja trenira ili intenzivno koristi velike AI modele: Cloud pristup. Izaberite provajdera (AWS, Azure, GCP) koji nudi instance sa Nvidia Blackwell (za maksimalne trening performanse) ili AMD Instinct MI300X (za potencijalno isplativiju inferenciju).

Više od rata čipova

Rat za AI čipove je mnogo više od korporativnog nadmetanja. To je motor koji pokreće fundamentalne promene u načinu na koji živimo i radimo. Žestoka konkurencija između Nvidije, AMD-a, Intela i drugih, iako deluje haotično, na kraju donosi ogromnu korist celom ekosistemu. Ona ubrzava inovacije, tera inženjere da pomeraju granice mogućeg i, dugoročno gledano, postepeno će učiniti ovu neverovatnu tehnologiju dostupnijom i jeftinijom za sve.

Od superkompjutera u data centrima do NPU-a u vašem laptopu, silicijum postaje platno na kojem se slika naša budućnost. Razumevanje ko drži četkicu i kakve boje koristi ključno je za snalaženje u svetu koji se menja brže nego ikad pre. Jedno je sigurno: pobednik u ovom ratu neće biti samo jedna kompanija, već čovečanstvo koje će dobiti moćnije alate za rešavanje nekih od najvećih izazova sa kojima se suočava.

Banner

Banner

Možda će vam se svideti i