OpenAI je iskoristio subreddit, r/ChangeMyView, kako bi stvorio test za merenje ubeđivačkih sposobnosti svojih AI modela rezonovanja. Kompanija je ovo otkrila u sistemskoj kartici — dokumentu koji opisuje kako AI sistem funkcioniše — koji je objavljen zajedno sa novim modelom „rezonovanja“, o3-mini, u petak.
Milioni Reddit korisnika su članovi r/ChangeMyView, gde postavljaju provokativna mišljenja u nadi da će naučiti više o različitim stavovima na neku temu. Kao odgovor na ta mišljenja, drugi korisnici odgovaraju sa ubeđujućim argumentima objašnjavajući zašto je originalni postavljač pogrešan.
Ovaj subreddit je jedan od mnogih Reddit foruma koji je zapravo rudnik zlata za tehnološke kompanije, poput OpenAI, koje žele da treniraju AI modele na visokokvalitetnim, ljudskim podacima.
OpenAI kaže da prikuplja korisničke postove sa r/ChangeMyView i traži od svojih AI modela da napišu odgovore, u zatvorenom okruženju, koji bi promenili mišljenje Reddit korisnika o nekoj temi. Kompanija zatim pokazuje odgovore testerima, koji ocenjuju koliko je argument ubeđujuć, a na kraju OpenAI upoređuje odgovore AI modela sa ljudskim odgovorima na isti post.
ChatGPT-ov tvorac ima ugovor o licenci sadržaja sa Reddit-om koji omogućava OpenAI da trenira svoje modele na postovima Reddit korisnika i prikazuje te postove unutar svojih proizvoda. Nije poznato koliko OpenAI plaća za ovaj sadržaj, ali se izveštava da Google plaća Reddit-u 60 miliona dolara godišnje prema sličnom ugovoru.

Međutim, OpenAI je izjavio da je evaluacija zasnovana na ChangeMyView potpuno nepovezana sa njegovim Reddit ugovorom. Nije jasno kako je OpenAI pristupio podacima sa ovog subreddita, a kompanija tvrdi da nema planova da objavi ovu evaluaciju javnosti.
Iako OpenAI-ov ChangeMyView benchmark nije nov — korišćen je i za evaluaciju o1 modela — on ipak ističe koliko je ljudski generisan sadržaj vredan za razvoj AI modela, kao i nejasne načine na koje tehnološke kompanije dolaze do svojih skupova podataka.
Iako je Reddit postigao nekoliko ugovora o licenciranju AI-a, kompanija je takođe optužila nekoliko AI firmi da su nelegalno preuzimale podatke sa njihovog sajta bez plaćanja. Reddit-ov CEO, Steve Huffman, rekao je prošle godine za The Verge da Microsoft, Anthropic i Perplexity nisu želeli da pregovaraju s njim i rekao da je bilo „pravo mučenje blokirati ove kompanije“.
Zanimljivo je da je OpenAI optužen u nekoliko tužbi za nepropisno preuzimanje podataka sa veb sajtova, uključujući The New York Times, kako bi dobio više podataka za obuku i unapredio ChatGPT i njegove temeljne AI modele.
U pogledu performansi na ChangeMyView benchmarku, o3-mini se ne čini da je značajno bolji ili lošiji od o1 ili GPT-4o. Međutim, najnoviji OpenAI-ovi AI modeli deluju ubedljivije od većine ljudi na r/ChangeMyView subredditu.

„GPT-4o, o3-mini i o1 svi pokazuju snažne sposobnosti u ubeđivačkom argumentovanju, unutar top 80-90. percentila ljudi“, rekao je OpenAI u sistemskoj kartici o3-mini modela. „Trenutno, ne vidimo da modeli pokazuju značajno bolje performanse od ljudi, niti jasno nadljudske performanse.“
Cilj OpenAI-a nije da stvori hiper-ubeđujuće AI modele, već da osigura da AI modeli ne postanu previše ubeđujući. Rezonirajući modeli su postali prilično dobri u ubeđivanju i obmani, pa je OpenAI razvio nove evaluacije i zaštite kako bi se time bavio.
Strah koji motiviše ove testove ubeđivanja je da bi AI model bio opasan ako bi bio veoma dobar u ubeđivanju svojih ljudskih korisnika. Teorijski, to bi moglo omogućiti naprednom AI-u da sprovodi sopstvenu agendu ili agendu onog ko ga kontroliše.
Čak i nakon što je preuzeo većinu javnog interneta i rešavao birokratske prepreke kako bi licencirao druge podatke, ChangeMyView benchmark pokazuje kako se kreatori AI modela i dalje bore da pronađu visokokvalitetne skupove podataka za testiranje svojih modela. Ali dobijanje tih podataka nije lako kao što zvuči.



