Kineska AI laboratorija DeepSeek ove nedelje dospela je u centar pažnje nakon što je njena chatbot aplikacija zauzela prvo mesto na listi Apple App Store-a. DeepSeek-ovi AI modeli, koji su obučeni pomoću računarski efikasnih tehnika, naveli su analitičare sa Vol Strita i tehnološke stručnjake da preispitaju da li SAD može da zadrži svoju prednost u AI trci i da li će potražnja za AI čipovima ostati stabilna.
Ali odakle je došao DeepSeek i kako je tako brzo stekao međunarodnu slavu?
DeepSeek-ovi trgovački počeci
DeepSeek ima podršku kompanije High-Flyer Capital Management, kineskog kvantitativnog hedž fonda koji koristi veštačku inteligenciju za donošenje trgovačkih odluka.
AI entuzijasta Liang Venfeng suosnovao je High-Flyer 2015. godine. Venfeng, koji je navodno počeo da se bavi trgovanjem dok je bio student na Univerzitetu Džeđang, osnovao je High-Flyer Capital Management kao hedž fond 2019. godine sa fokusom na razvoj i primenu AI algoritama.
Godine 2023, High-Flyer je pokrenuo DeepSeek kao laboratoriju posvećenu istraživanju AI alata odvojenih od svog finansijskog poslovanja. Sa High-Flyerom kao jednim od investitora, laboratorija se izdvojila u zasebnu kompaniju, takođe nazvanu DeepSeek.
Od samog početka, DeepSeek je izgradio sopstvene klastere data centara za obuku modela. Međutim, kao i druge AI kompanije u Kini, DeepSeek je pogođen američkim zabranama izvoza hardvera. Kako bi obučio jedan od svojih novijih modela, kompanija je bila primorana da koristi Nvidia H800 čipove, manje moćnu verziju čipa H100, koji je dostupan američkim kompanijama.
DeepSeek-ov tehnički tim navodno je pretežno mlad. Kompanija agresivno regrutuje doktorske istraživače iz oblasti veštačke inteligencije sa vodećih kineskih univerziteta. Takođe zapošljava ljude bez ikakvog iskustva u računarstvu kako bi njena tehnologija bolje razumela širok spektar tema, prema pisanju The New York Times-a.
Snažni modeli DeepSeek-a

DeepSeek je predstavio svoj prvi set modela — DeepSeek Coder, DeepSeek LLM i DeepSeek Chat — u novembru 2023. godine. Međutim, tek kada je prošlog proleća startup lansirao novu generaciju modela DeepSeek-V2, AI industrija je počela ozbiljno da obraća pažnju.
DeepSeek-V2, višenamenski sistem za analizu teksta i slika, ostvario je odlične rezultate na različitim AI testovima, a istovremeno je bio znatno jeftiniji za korišćenje od konkurentskih modela u to vreme. Njegov uspeh je naterao domaće rivale, uključujući ByteDance i Alibabu, da snize cene korišćenja nekih svojih modela, a neke su čak učinili potpuno besplatnim.
DeepSeek-V3, lansiran u decembru 2024. godine, dodatno je učvrstio reputaciju kompanije.
Prema internim testovima DeepSeek-a, model DeepSeek V3 nadmašuje i preuzimajuće, otvorene modele poput Metinog Llama, kao i „zatvorene“ modele kojima se može pristupiti samo putem API-ja, poput OpenAI-jevog GPT-4o.
Jednako impresivan je i DeepSeek-ov R1 model za „razmišljanje“, koji je objavljen u januaru. DeepSeek tvrdi da R1 postiže iste rezultate kao OpenAI-ov O1 model na ključnim testovima.
Kao model za razmišljanje, R1 efektivno proverava tačnost svojih odgovora, što mu pomaže da izbegne neke od uobičajenih grešaka koje često pogađaju modele. Modeli za razmišljanje obično potrebno više vremena — od nekoliko sekundi do minuta — da dođu do rešenja u poređenju sa tipičnim modelima koji ne koriste razmišljanje. Prednost toga je što su obično pouzdaniji u oblastima poput fizike, nauke i matematike.
Međutim, postoji i nedostatak kod R1, DeepSeek V3, i drugih DeepSeek-ovih modela. Kao kineski razvijen AI, oni podlegaju ocenjivanju od strane kineskog internet regulatora kako bi se osiguralo da njihovi odgovori „odražavaju osnovne socijalističke vrednosti“. Na primer, u DeepSeek-ovoj aplikaciji za chat, R1 neće odgovarati na pitanja o Tiananmen trgu ili autonomiji Tajvana.
Disruptivan pristup
Ako DeepSeek ima poslovni model, nije jasno šta tačno taj model podrazumeva. Kompanija svoje proizvode i usluge nudi po cenama koje su znatno niže od tržišnih — a neke čak i besplatno.
Prema tvrdnjama DeepSeek-a, tehnološki napreci u efikasnosti omogućili su joj da održi izuzetnu konkurentnost po ceni. Međutim, neki stručnjaci osporavaju podatke koje je kompanija dostavila.
Bez obzira na to, developeri su počeli da koriste DeepSeek-ove modele, koji nisu open-source u klasičnom smislu, ali su dostupni pod permisivnim licencama koje omogućavaju komercijalnu upotrebu. Prema Clemu Delangueu, CEO-u Hugging Face-a, jedne od platformi na kojima su hostovani DeepSeek-ovi modeli, developeri na Hugging Face-u su stvorili više od 500 „derivativnih“ modela R1 koji su zajedno zabeležili 2,5 miliona preuzimanja.
Uspeh DeepSeek-a protiv većih i etabliranijih rivala opisuje se kao „preokret u AI industriji“ i uvođenje „nove ere AI diplomacije“. Uspeh kompanije je barem delimično doprineo tome da cena akcija Nvidia-e padne za 18% u ponedeljak, kao i da izazove javni odgovor od Sam Altmana, CEO-a OpenAI-a.
Što se tiče budućnosti DeepSeek-a, teško je reći. Poboljšani modeli su gotovo izvesni, ali američka vlada očigledno postaje sve opreznija prema onome što smatra štetnim stranim uticajem.



