Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela

od Ivan Radojevic 30/01/2025

30/01/2025

Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela

Pomeri se, DeepSeek. Novi AI šampion je tu – i dolazi iz Amerike.

U četvrtak, Ai2, nevladin istraživački institut za AI sa sedištem u Sijetlu, predstavio je model koji tvrdi da je bolji od DeepSeek V3, jednog od vodećih sistema kineske AI kompanije DeepSeek.

Ai2-ov model, nazvan Tulu3-405B, takođe nadmašuje OpenAI GPT-4o na određenim AI benchmark testovima, prema internim testiranjima Ai2. Štaviše, za razliku od GPT-4o (pa čak i DeepSeek V3), Tulu3-405B je open source, što znači da su svi komponenti neophodni za njegovu repliciranje od nule slobodno dostupni i pod dozvolama koje omogućavaju upotrebu.

Portparol Ai2 je izjavio da laboratorija veruje da Tulu3-405B „naglašava potencijal SAD-a da predvodi globalni razvoj najboljih generativnih AI modela.“

„Ovaj mileston je ključan trenutak za budućnost otvorenog AI, potvrđujući poziciju SAD-a kao lidera u konkurentnim, open-source modelima“, rekao je portparol. „S ovim lansiranjem, Ai2 predstavlja moćnu, američki razvijenu alternativu DeepSeek modelima – označavajući ključan trenutak ne samo u razvoju AI, već i u pokazivanju da SAD mogu biti lideri u konkurentnom, open-source AI nezavisno od tehnoloških gigante.“

Tulu3-405B je prilično veliki model. Sa 405 milijardi parametara, za njegovu obuku bilo je potrebno 256 GPU-ova koji su radili u paraleli, prema Ai2. Parametri se otprilike odnose na sposobnost modela da rešava probleme, a modeli sa više parametara obično imaju bolje performanse od onih sa manjim brojem parametara.

Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela 1

Prema Ai2, jedan od ključnih faktora za postizanje konkurentnih performansi sa Tulu3-405B bio je tehnika nazvana „učenje pojačanja sa proverljivim nagradama“. Učenje pojačanja sa proverljivim nagradama, ili RLVR, trenira modele na zadacima sa „proverljivim“ ishodima, kao što su rešavanje matematičkih problema i praćenje uputstava.

Ai2 tvrdi da je na benchmarku PopQA, skupu od 14.000 specijalizovanih pitanja sa Wikipedije, Tulu3-405B pobedio ne samo DeepSeek V3 i GPT-4o, već i Meta Llama 3.1 405B model. Tulu3-405B je takođe imao najbolje performanse od svih modela u svojoj klasi na GSM8K testu, koji sadrži matematičke zadatke na nivou osnovne škole.

Tulu3-405B je dostupan za testiranje putem Ai2-ove chatbot web aplikacije, a kod za obuku modela nalazi se na GitHubu i AI razvojnoj platformi Hugging Face. Uzmite ga dok je vruće — i pre nego što stigne sledeći model koji će oboriti sve rekorde.

Ai2 tvrdi da je njegov novi AI model bolji od DeepSeek modela

Spider-Man 2 dolazi na Steam sa pristupačnim PC specifikacijama

Tetrimatch

Možda će vam se svideti i