DeepSeek-R1: AI model koji parira OpenAI-u

od Ivan Radojevic 21/11/2024

21/11/2024

Kineska laboratorija je predstavila ono što izgleda kao jedan od prvih „razmišljajućih“ AI modela koji parira OpenAI modelu o1. U sredu, DeepSeek, AI istraživačka kompanija koju finansiraju kvantitativni trgovci, objavila je pregled DeepSeek-R1, koji firma tvrdi da je razmišljajući model konkurentan o1.

Za razliku od većine modela, razmišljajući modeli efikasno proveravaju sebe tako što više vremena provode razmatrajući pitanje ili upit. Ovo im pomaže da izbegnu neke od zamki koje obično zbunjuju modele.

Slično kao o1, DeepSeek-R1 razmišlja kroz zadatke, planira unapred i izvršava niz radnji koje pomažu modelu da dođe do odgovora. To može potrajati neko vreme. Kao i o1, u zavisnosti od složenosti pitanja, DeepSeek-R1 može „razmišljati“ i desetine sekundi pre nego što da odgovor.

DeepSeek-R1 AI model koji parira OpenAI-u 1

DeepSeek tvrdi da DeepSeek-R1 (tačnije, DeepSeek-R1-Lite-Preview) ima performanse uporedive sa OpenAI-ovim o1-preview modelom na dva popularna AI benchmarka, AIME i MATH. AIME koristi druge AI modele za ocenjivanje performansi modela, dok je MATH zbirka matematičkih problema. Međutim, model nije savršen. Neki komentatori na X-u su primetili da DeepSeek-R1 ima poteškoća sa igrom „tic-tac-toe“ i drugim logičkim problemima (kao i o1).

DeepSeek takođe može biti lako „jailbroken“ — tj. može se podstaći na način da ignoriše sigurnosne mere. Jedan korisnik na X-u je uspeo da modelu postavi pitanje koje je dovelo do generisanja detaljnog recepta za proizvodnju metamfetamina.

Takođe, DeepSeek-R1 se čini da blokira upite koji se smatraju previše politički osetljivim. U našem testiranju, model je odbio da odgovori na pitanja o kineskom lideru Si Đinpingu i geopolitičkim implikacijama.

Kineska laboratorija predstavila razmišljajući AI model koji parira OpenAI-u 1

Povećana pažnja prema razmišljajućim modelima dolazi u vreme kada se zakonitost „zakona skaliranja“, dugotračno prihvaćenih teorija prema kojima bi dodavanje više podataka i računarske moći modelu stalno povećavalo njegove sposobnosti, dovodi u pitanje. Niz izveštaja sugeriše da modeli iz velikih AI laboratorija, uključujući OpenAI, Google i Anthropic, više ne poboljšavaju svoje performanse onako dramatično kao pre.

To je dovelo do žurbe u potrazi za novim pristupima, arhitekturama i tehnikama razvoja AI. Jedan od tih pristupa je test-time compute, koji je osnova za modele kao što su o1 i DeepSeek-R1. Takođe poznat kao inference compute, test-time compute modelima omogućava dodatno procesiranje vremena za izvršavanje zadataka.

„Vidimo pojavu novog zakona skaliranja“, rekao je Satya Nadella, CEO Microsoft-a, ove sedmice tokom svog govora na Microsoft-ovoj Ignite konferenciji, govoreći o test-time compute-u.

DeepSeek-R1 AI model koji parira OpenAI-u 2

DeepSeek, koji planira da open-source-uje DeepSeek-R1 i lansira API, predstavlja zanimljivu operaciju. Podržava ga High-Flyer Capital Management, kineski kvantitativni hedge fond koji koristi AI za donošenje odluka o trgovanju.

Jedan od prvih modela DeepSeek-a, univerzalni model za analizu teksta i slika pod nazivom DeepSeek-V2, naterao je konkurente kao što su ByteDance, Baidu i Alibaba da smanje cene korišćenja nekih svojih modela — i učine druge potpuno besplatnim.

High-Flyer gradi sopstvene serverske klastere za obuku modela, od kojih je poslednji navodno opremljen sa 10.000 Nvidia A100 GPU-a, a vrednost mu je 1 milijarda jena (~138 miliona dolara). Osnovan od strane Lianga Wenfenga, diplomiranog računarca, High-Flyer ima za cilj da postigne „superinteligentni“ AI kroz svoju DeepSeek organizaciju.

prethodna objava

OpenAI slučajno obrisao potencijalne dokaze u tužbi za autorska prava sa NY Times-om

sledeća objava

DeepSeek-R1: AI model koji parira OpenAI-u

OpenAI slučajno obrisao potencijalne dokaze u tužbi za autorska prava sa NY Times-om

OpenAI lansira vodič za učitelje o ChatGPT-u

Možda će vam se svideti i