U budućem dobu pametnih domova, nabavka robota za olakšavanje kućnih poslova neće biti retkost. Međutim, frustracija može da se pojavi kada ovi automatizovani pomoćnici ne uspeju da obave jednostavne zadatke. Tu ulazi Andi Peng, studentkinja iz Odseka za elektroinženjering i računarske nauke na MIT-u, koja zajedno sa svojim timom radi na razvoju načina za poboljšanje krive učenja robota.
Peng i njen multidisciplinarni tim istraživača pioniri su ljudsko-robotni interaktivni okvir. Glavna karakteristika ovog sistema je njegova sposobnost da generiše kontraverzne priče koje ukazuju na promene potrebne da robot uspešno obavi zadatak.
Kako bi ilustrovala, kada robot ima problema sa prepoznavanjem čudno oslikane šolje, sistem nudi alternativne situacije u kojima bi robot uspeo, možda ako bi šolja bila uobičajene boje. Ove kontraverzne objašnjene, zajedno sa povratnim informacijama od strane ljudi, pojednostavljuju proces generisanja novih podataka za fino podešavanje robota.
Peng objašnjava, „Fino podešavanje je proces optimizacije postojećeg modela mašinskog učenja koji već dobro obavlja jedan zadatak, omogućavajući mu da obavi drugi, sličan zadatak.“
Skok u efikasnosti i performansama

Kada je stavljen na test, sistem je pokazao impresivne rezultate. Roboti obučeni ovom metodom pokazali su brzo učenje, smanjujući angažman vremena njihovih ljudskih instruktora. Ako se uspešno primeni u većem obimu, ovaj inovativni okvir može pomoći robotima da se brzo prilagode novim okruženjima, minimizirajući potrebu da korisnici poseduju napredno tehničko znanje. Ova tehnologija može biti ključ za otključavanje univerzalnih robota sposobnih da efikasno pomažu starijim ili onesposobljenim osobama.
Peng veruje: „Krajnji cilj je osnažiti robota da uči i funkcioniše na apstraktnom nivou kao čovek.“
Revolicioniranje obuke robota
Glavna prepreka u učenju robota je „promena distribucije,“ termin koji se koristi za objašnjenje situacije kada robot naiđe na objekte ili prostore s kojima nije bio izložen tokom svog obuke. Istraživači su, da bi rešili ovaj problem, primenili metod poznat kao „imitaciono učenje.“ Ali imao je svoja ograničenja.
„Zamislite da morate demonstrirati sa 30.000 šolja da bi robot podigao bilo koju šolju. Umesto toga, radije bih demonstrirala samo sa jednom šoljom i naučila robota da razume da može podići šolju bilo koje boje“, kaže Peng.
Kao odgovor na to, timov sistem identifikuje koje karakteristike objekta su ključne za zadatak (kao što je oblik šolje) i koje nisu (kao što je boja šolje). Sa ovim informacijama, generiše sintetičke podatke, menjajući „neključne“ vizuelne elemente, čime optimizuje proces učenja robota.
Povezivanje ljudskog razmišljanja sa robotskom logikom

Da bi procenili efikasnost ovog okvira, istraživači su sproveli testove sa ljudskim korisnicima. Od učesnika je traženo da li su kontraverzna objašnjenja sistema poboljšala njihovo razumevanje izvođenja zadatka od strane robota.
Peng kaže: „Otkrili smo da su ljudi inherentno vešti u ovom obliku kontraverznog razmišljanja. Upravo ovaj kontraverzni element omogućava nam da ljudsko razmišljanje prevedemo u robotsku logiku bez problema.“
U toku više simulacija, robot je konzistentno učio brže njihovim pristupom, nadmašujući druge tehnike i zahtevajući manje demonstracija od korisnika.
U narednom periodu, tim planira da ovaj okvir implementira na stvarnim robotima i radi na skraćivanju vremena generisanja podataka putem generativnih modela mašinskog učenja. Ovaj inovativni pristup ima potencijal da transformiše putanju učenja robota, otvarajući put budućnosti u kojoj roboti harmonično koegzistiraju u našem svakodnevnom životu.



