Pomeri se, DeepSeek. Novi AI šampion je tu – i dolazi iz Amerike.
U četvrtak, Ai2, nevladin istraživački institut za AI sa sedištem u Sijetlu, predstavio je model koji tvrdi da je bolji od DeepSeek V3, jednog od vodećih sistema kineske AI kompanije DeepSeek.
Ai2-ov model, nazvan Tulu3-405B, takođe nadmašuje OpenAI GPT-4o na određenim AI benchmark testovima, prema internim testiranjima Ai2. Štaviše, za razliku od GPT-4o (pa čak i DeepSeek V3), Tulu3-405B je open source, što znači da su svi komponenti neophodni za njegovu repliciranje od nule slobodno dostupni i pod dozvolama koje omogućavaju upotrebu.
Portparol Ai2 je izjavio da laboratorija veruje da Tulu3-405B „naglašava potencijal SAD-a da predvodi globalni razvoj najboljih generativnih AI modela.“
„Ovaj mileston je ključan trenutak za budućnost otvorenog AI, potvrđujući poziciju SAD-a kao lidera u konkurentnim, open-source modelima“, rekao je portparol. „S ovim lansiranjem, Ai2 predstavlja moćnu, američki razvijenu alternativu DeepSeek modelima – označavajući ključan trenutak ne samo u razvoju AI, već i u pokazivanju da SAD mogu biti lideri u konkurentnom, open-source AI nezavisno od tehnoloških gigante.“
Tulu3-405B je prilično veliki model. Sa 405 milijardi parametara, za njegovu obuku bilo je potrebno 256 GPU-ova koji su radili u paraleli, prema Ai2. Parametri se otprilike odnose na sposobnost modela da rešava probleme, a modeli sa više parametara obično imaju bolje performanse od onih sa manjim brojem parametara.
Prema Ai2, jedan od ključnih faktora za postizanje konkurentnih performansi sa Tulu3-405B bio je tehnika nazvana „učenje pojačanja sa proverljivim nagradama“. Učenje pojačanja sa proverljivim nagradama, ili RLVR, trenira modele na zadacima sa „proverljivim“ ishodima, kao što su rešavanje matematičkih problema i praćenje uputstava.
Ai2 tvrdi da je na benchmarku PopQA, skupu od 14.000 specijalizovanih pitanja sa Wikipedije, Tulu3-405B pobedio ne samo DeepSeek V3 i GPT-4o, već i Meta Llama 3.1 405B model. Tulu3-405B je takođe imao najbolje performanse od svih modela u svojoj klasi na GSM8K testu, koji sadrži matematičke zadatke na nivou osnovne škole.
Tulu3-405B je dostupan za testiranje putem Ai2-ove chatbot web aplikacije, a kod za obuku modela nalazi se na GitHubu i AI razvojnoj platformi Hugging Face. Uzmite ga dok je vruće — i pre nego što stigne sledeći model koji će oboriti sve rekorde.