Promena u srcu veštačke inteligencije: OpenAI restrukturirao tim koji je stvorio 'dušu' ChatGPT-ja

Svi smo se navikli na specifičnu „ličnost“ ChatGPT-ja: uvek je ljubazan, pomalo formalan, oprezan i uvek se trudi da pruži uravnotežen i bezbedan odgovor. Taj karakter nije slučajan. On je rezultat hiljada sati rada specijalizovanog tima unutar kompanije OpenAI, čiji je jedini zadatak bio da „nauči“ veštačku inteligenciju ljudskim vrednostima. Upravo taj tim, koji se smatra odgovornim za „dušu“ i etički kompas najpoznatijeg AI modela na svetu, nedavno je prošao kroz veliku internu reorganizaciju.

Ova vest, koja je odjeknula u tehnološkim krugovima, mnogo je više od uobičajenog korporativnog prestrojavanja. To je potez koji može da nagovesti fundamentalnu promenu u pravcu razvoja veštačke inteligencije i da nam pruži uvid u to kako će izgledati sledeća generacija AI alata. Pitanje koje se postavlja jeste: zašto OpenAI menja tim koji je bio ključan za globalno prihvatanje i uspeh ChatGPT-ja?

Ko je bio „tim za poravnanje“ i šta je on radio?

Da bismo razumeli značaj ove promene, moramo znati kako je ChatGPT uopšte „vaspitan“. Osnovni AI model, pre nego što dođe do korisnika, poseduje ogromno znanje sa interneta, ali mu nedostaju socijalne i etičke norme. On je kao genijalan student koji je pročitao sve knjige, ali ne zna kako da se ponaša u društvu.

Tu na scenu stupa tim za „poravnanje“ (Alignment Team) i proces nazvan „Učenje uz pomoć povratnih informacija od ljudi“ (Reinforcement Learning from Human Feedback – RLHF).

Proces „vaspitavanja“: U ovom procesu, ljudski treneri ocenjuju odgovore koje AI daje. Oni „nagrađuju“ (daju pozitivnu ocenu) odgovore koji su tačni, korisni, bezopasni i u skladu sa ljudskim vrednostima. Istovremeno, „kažnjavaju“ (daju negativnu ocenu) odgovore koji su netačni, toksični, pristrasni ili opasni.
Stvaranje ličnosti: Kroz milione ovakvih interakcija, AI uči da imitira željeni obrazac ponašanja. Upravo je ovaj tim bio odgovoran za to što je ChatGPT postao upotrebljiv i siguran za javnost. Oni su mu ugradili etičke „branike“ i stvorili prepoznatljivu, uslužnu personu koju danas poznajemo.

Zašto sada dolazi do promene?

Reorganizacija ovog ključnog tima sugeriše da OpenAI menja strateške prioritete. Postoji nekoliko verovatnih razloga za to.

1. Dostignuta granica trenutne metode: RLHF proces je neverovatno spor, skup i zahteva ogroman ljudski rad. Moguće je da su u OpenAI-ju procenili da su sa ovom metodom dostigli tačku opadajućih prinosa. Drugim rečima, ulaganje dodatnih hiljada sati rada da bi AI postao samo marginalno „ljubazniji“ ili „bezbedniji“ više nije najefikasniji način za napredak.

2. Novi cilj: Od poslušnog asistenta do proaktivnog agenta Čitava AI industrija se kreće ka sledećoj velikoj fazi: razvoju AI Agenata. To su sistemi koji ne samo da odgovaraju na pitanja, već mogu samostalno da obavljaju kompleksne zadatke u više koraka. Na primer, umesto da pitate AI „koji su najbolji letovi za Rim?“, agentu biste dali zadatak: „Isplaniraj mi trodnevno putovanje u Rim za dve osobe sledećeg meseca, sa budžetom od 1000 evra, i rezerviši letove i smeštaj sa najboljim ocenama.“ Da bi se stvorili ovakvi moćni agenti, fokus treninga se pomera sa „kako odgovoriti lepo“ na „kako uspešno završiti zadatak“. To zahteva novi pristup „poravnanju“ i bezbednosti.

3. Potraga za „skalabilnim poravnanjem“ Najveći umovi u OpenAI-ju svesni su dugoročnog problema: kako kontrolisati i osigurati da veštačka inteligencija koja postaje značajno pametnija od ljudi ostane usklađena sa ljudskim interesima? Oslanjanje na ljude da nadziru superinteligenciju nije održivo rešenje. Zbog toga se intenzivno radi na pronalaženju automatizovanih načina za „poravnanje“. Restrukturiranje tima može biti korak ka integraciji ovih novih, naprednijih istraživačkih pravaca u razvoj proizvoda.

Šta ovo znači za budućnost ChatGPT-ja?

Ovaj potez nam daje važne signale o tome kako bi sledeće generacije AI modela mogle izgledati:

Fokus na sposobnostima, manje na „ćaskanju“: Možemo očekivati da buduće verzije budu manje opširne i „pričljive“, a daleko moćnije u izvršavanju konkretnih zadataka.
Promena „ličnosti“: Karakter AI modela bi mogao postati više funkcionalan i nalik na alat, a manje na „digitalnog prijatelja“. Era AI-ja kao uslužnog asistenta polako prelazi u eru AI-ja kao sposobnog digitalnog radnika.
Novi bezbednosni izazovi: Što je AI autonomniji, to su i bezbednosni rizici veći i kompleksniji. OpenAI se očigledno priprema za novu generaciju izazova, spajajući svoje timove za istraživanje i primenjenu bezbednost.

Kraj jedne i početak druge ere

Interna promena u najvažnijoj AI kompaniji na svetu je signal za čitavu industriju. Prva faza generativne AI revolucije – u kojoj je cilj bio da se tehnologija učini bezbednom, dostupnom i prihvatljivom za široke mase – polako dostiže svoju zrelost.

Sada ulazimo u drugu, uzbudljiviju i potencijalno mnogo opasniju fazu: oslobađanje punog potencijala ove tehnologije za stvaranje moćnih, autonomnih alata koji će duboko promeniti naš rad i život. Način na koji komuniciramo sa veštačkom inteligencijom će se verovatno promeniti. Biće manje razgovora, a više akcije. A potezi koje OpenAI povlači danas u tišini svojih laboratorija, direktno će oblikovati tu budućnost.

Promena u srcu veštačke inteligencije: OpenAI restrukturirao tim koji je stvorio ‘dušu’ ChatGPT-ja

Ko je bio „tim za poravnanje“ i šta je on radio?

Zašto sada dolazi do promene?

Šta ovo znači za budućnost ChatGPT-ja?

Kraj jedne i početak druge ere

Pravila pretrage se menjaju: Da li je vaš biznis spreman za Generativnu Optimizaciju (GEO)?

AI u sportu

Možda će vam se svideti i