Home AI Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela

Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela

by Ivan Radojevic
Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela

Pomeri se, DeepSeek. Novi AI šampion je tu – i dolazi iz Amerike.

U četvrtak, Ai2, nevladin istraživački institut za AI sa sedištem u Sijetlu, predstavio je model koji tvrdi da je bolji od DeepSeek V3, jednog od vodećih sistema kineske AI kompanije DeepSeek.

Ai2-ov model, nazvan Tulu3-405B, takođe nadmašuje OpenAI GPT-4o na određenim AI benchmark testovima, prema internim testiranjima Ai2. Štaviše, za razliku od GPT-4o (pa čak i DeepSeek V3), Tulu3-405B je open source, što znači da su svi komponenti neophodni za njegovu repliciranje od nule slobodno dostupni i pod dozvolama koje omogućavaju upotrebu.

Portparol Ai2 je izjavio da laboratorija veruje da Tulu3-405B „naglašava potencijal SAD-a da predvodi globalni razvoj najboljih generativnih AI modela.“

„Ovaj mileston je ključan trenutak za budućnost otvorenog AI, potvrđujući poziciju SAD-a kao lidera u konkurentnim, open-source modelima“, rekao je portparol. „S ovim lansiranjem, Ai2 predstavlja moćnu, američki razvijenu alternativu DeepSeek modelima – označavajući ključan trenutak ne samo u razvoju AI, već i u pokazivanju da SAD mogu biti lideri u konkurentnom, open-source AI nezavisno od tehnoloških gigante.“

Tulu3-405B je prilično veliki model. Sa 405 milijardi parametara, za njegovu obuku bilo je potrebno 256 GPU-ova koji su radili u paraleli, prema Ai2. Parametri se otprilike odnose na sposobnost modela da rešava probleme, a modeli sa više parametara obično imaju bolje performanse od onih sa manjim brojem parametara.

Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela 1

Prema Ai2, jedan od ključnih faktora za postizanje konkurentnih performansi sa Tulu3-405B bio je tehnika nazvana „učenje pojačanja sa proverljivim nagradama“. Učenje pojačanja sa proverljivim nagradama, ili RLVR, trenira modele na zadacima sa „proverljivim“ ishodima, kao što su rešavanje matematičkih problema i praćenje uputstava.

Ai2 tvrdi da je na benchmarku PopQA, skupu od 14.000 specijalizovanih pitanja sa Wikipedije, Tulu3-405B pobedio ne samo DeepSeek V3 i GPT-4o, već i Meta Llama 3.1 405B model. Tulu3-405B je takođe imao najbolje performanse od svih modela u svojoj klasi na GSM8K testu, koji sadrži matematičke zadatke na nivou osnovne škole.

Tulu3-405B je dostupan za testiranje putem Ai2-ove chatbot web aplikacije, a kod za obuku modela nalazi se na GitHubu i AI razvojnoj platformi Hugging Face. Uzmite ga dok je vruće — i pre nego što stigne sledeći model koji će oboriti sve rekorde.

Možda će vam se svideti i