Svako ko je barem jednom u životu pokušao da pokrene najnoviju, grafički najzahtevniju video igru na starom računaru, tačno zna taj osećaj frustracije. Slika secka, teksture se ne učitavaju, a ventilator zuji kao da će kućište poleteti svakog trenutka. Igra je možda remek-delo, ali bez prave opreme, to remek-delo je neigrivo.
Kada danas razmišljam o veštačkoj inteligenciji, imam potpuno isti osećaj. Stalno slušamo o novim jezičkim modelima, pametnim algoritmima i neverovatnom softveru. Međutim, kao neko ko voli da „kopa“ ispod haube i testira granice tehnologije, brzo sam shvatio jednu stvar – softver je samo prelepa priča, ali sirovi hardver je taj koji je zapravo pokreće. Da bismo razumeli pravi napredak AI industrije, moramo da prestanemo da gledamo samo u kod i da počnemo da gledamo u silicijum.
Softver je priča, ali hardver je grafička karta koja je pokreće
Kada sam prvi put počeo da eksperimentišem sa lokalnim AI modelima na svom standardnom računaru, to je bilo bolno iskustvo. Ukucam prompt i onda čekam. I čekam. Podsetilo me je na učitavanje nivoa u starim igrama gde možete da odete da skuvate kafu dok se proces ne završi.
Softver veštačke inteligencije, poput onog koji pokreće popularne četbotove, baziran je na neuronskim mrežama sa milijardama parametara. Da bi softver bio „pametan“, on zahteva paralelno procesiranje – sposobnost da obavlja hiljade zadataka istovremeno. Klasični procesori (CPU) su fantastični, ali oni zadatke rešavaju linearno, jedan po jedan. Sa druge strane, grafičke karte (GPU) su dizajnirane upravo za paralelan rad. U gejmingu one računaju milione piksela u sekundi, a u svetu veštačke inteligencije računaju milione verovatnoća i parametara. Zato je napredak bez njih apsolutno nemoguć.
Nvidia i trka u naoružanju – ko ima najbolji rig?
U ovoj „igri“, kompanija Nvidia je trenutno apsolutni „final boss“. Njihovi čipovi, poput čuvene H100 serije, postali su zlatni standard industrije. Gledajući specifikacije ovih zveri, to me podseća na lansiranje najmoćnije RTX 4090 grafičke karte, samo što je ovo hardver pravljen specifično za data centre.
Ono što me najviše fascinira jeste kako se cela IT industrija utrkuje da obezbedi ove čipove. To više nije samo pitanje budžeta, već čistog opstanka na tržištu. Kao što u kompetitivnom multiplejeru ne možete da pobedite protivnika ako imate lošiji framerate, tako ni velike kompanije ne mogu da treniraju pametnije modele ako nemaju pristup najboljem mogućem hardveru. AMD i Google sa svojim TPU (Tensor Processing Unit) arhitekturama pokušavaju da pruže ozbiljan otpor, što ovu hardversku bitku čini jednom od najuzbudljivijih tehnoloških trka u modernoj istoriji.
Memorijski protok: usko grlo o kojem se malo priča
Dok sam testirao generisanje slika i obradu kompleksnih tekstova, shvatio sam da problem nije uvek samo u sirovoj snazi računanja, već u nečemu što gejmeri zovu VRAM (video memorija), a inženjeri „memorijski zid“.
Možete imati najbrži procesor na svetu, ali ako on mora da čeka da mu podaci stignu iz spore memorije, performanse padaju u vodu. AI modeli su toliko ogromni da zahtevaju ogromne količine ultra-brze memorije (HBM – High Bandwidth Memory). To je kao da imate najbrži sportski auto, ali ga vozite po seoskom putu. Napredak hardvera se danas u velikoj meri fokusira upravo na to – kako proširiti taj put i omogućiti podacima da lete od memorije do procesora bez ikakvih smetnji i zagušenja.
Šta nas čeka u sledećem nivou?
Dok pišem ovu „recenziju“ trenutnog stanja AI tehnologije, potpuno mi je jasno da smo tek na početku igre. Optimizacija softvera će uvek biti bitna, ali stvarni kvantni skokovi će se desiti tek kada se pojave nove, još naprednije generacije čipova, posvećene isključivo neuralnim operacijama (NPU).
Baš kao što su nekada igre zahtevale da kupujemo nove konzole ili skupe komponente kako bismo uživali u boljoj grafici i realističnijoj fizici, tako i veštačka inteligencija zahteva potpuno novu generaciju hardvera da bi dostigla svoj puni potencijal. Igra je tek počela, a ja jedva čekam da vidim kakav nas hardverski „update“ čeka u bliskoj budućnosti.



