Kompanija NVIDIA predstavila je B200 čip, baziran na arhitekturi Blackwell, koji obećava do 30 puta brže performanse u odnosu na prethodnu generaciju, cementirajući svoju apsolutnu dominaciju na tržištu AI akceleratora. Novi „superčip“ je dizajniran za obuku i pokretanje AI modela sa bilionima parametara.
Na godišnjoj GTC konferenciji, kompanija NVIDIA je još jednom potvrdila svoju ulogu ključnog igrača u „industrijskoj revoluciji“ koju pokreće generativna veštačka inteligencija. Glavna zvezda događaja bilo je predstavljanje B200 GPU čipa (nazvanog po poznatom američkom matematičaru), koji prema tvrdnjama kompanije predstavlja „najmoćniji čip za veštačku inteligenciju na svetu“.
Ovaj revolucionarni čip deo je nove Blackwell arhitekture i osmišljen je da premosti jaz između sve većih zahteva za računarskom snagom i energetske efikasnosti.
Arhitektura Blackwell: Dva čipa u jednom
Ključna inovacija B200 čipa leži u njegovom dizajnu. On se sastoji od dva silikonska kvadrata ili chipleta integrisana u jednu celinu, što mu omogućava da raspolaže sa neverovatnih 208 milijardi tranzistora. Ovi čipleti komuniciraju brzinom od 10 terabajta u sekundi, stvarajući cache-coherent GPU koji funkcioniše kao jedna, monolitna, super-jedinica.
U poređenju sa prethodnom generacijom (Hopper H100), B200 donosi dramatična poboljšanja performansi:
- Povećanje brzine za inferencu (zaključivanje): Tvrdi se da je do 30 puta brži pri specifičnim zadacima kao što je davanje odgovora u chatbot aplikacijama.
- Energetska efikasnost: Iz kompanije ističu da će B200 smanjiti operativne troškove i potrošnju energije za do 25 puta za zadatke inferense.
- Memorija: B200 dolazi sa masivnih 192 GB HBM3e (High Bandwidth Memory), što je znatno više od kapaciteta H100. Ova ogromna količina memorije omogućava obuku gigantskih AI modela u celosti na jednom GPU-u, eliminišući potrebu za kompleksnim deljenjem modela.
- Memorijski protok: Propusni opseg memorije dostiže impresivnih 8 TB/s, što je ključno za brzo unošenje podataka u Tensor Core jedinice.
GB200 superčip: Sinteza CPU-a i GPU-a
Pored samog B200 čipa, NVIDIA je predstavila i Grace-Blackwell Superčip (GB200). Ovo je hibridno rešenje koje kombinuje dva B200 GPU-a sa jednim Grace CPU-om. Ova kombinacija je skrojena da zadovolji najzahtevnija opterećenja, posebno u domenu Large Language Model (LLM) obuke.
NVIDIA tvrdi da GB200 pruža do 30 puta bolje performanse za LLM inferencu u poređenju sa ekvivalentnim brojem H100 GPU-ova. Značajna razlika se vidi i u zahtevima za energijom: dok bi obuka modela od 1,8 biliona parametara ranije zahtevala 8.000 H100 akceleratora i 15 megavata energije, novi sistem sa 2.000 B200 čipova to može da postigne uz potrošnju od samo četiri megavata.
NVIDIA planira da pakuje GB200 superčipove u masivne server sisteme nazvane GB200 NVL72, koji u sebi integrišu 72 Blackwell GPU-a i povezuju ih preko NVLink kontrolera sledeće generacije, stvarajući tako prava AI superračunala.
Tržište i konkurencija
Uvođenjem B200 čipa, NVIDIA dodatno učvršćuje svoju dominaciju na tržištu AI čipova, gde trenutno drži ogroman udeo. Najveći korisnici, uključujući gigantske kompanije kao što su Amazon, Google, Microsoft i Oracle, najavili su da će koristiti Blackwell platformu u svojim cloud servisima i AI ponudama. Time se stvara ekosistem koji programere tera da nastave da koriste NVIDIA-inu tehnologiju, bez obzira na sve češće pokušaje konkurenata (poput AMD-a sa MI300 serijom ili internih čipova koje razvijaju giganti poput Google-a i Amazona) da ponude alternative.
U suštini, B200 nije samo brži čip; to je inženjersko remek-delo koje redefiniše granice moguće AI obrade i smanjuje energetski otisak, dok istovremeno omogućava obuku i rad sa veštačkom inteligencijom na dosad neviđenom nivou složenosti i brzine.



