Pred praznike, Microsoft je najavio unapređenje AI modela iza Bing Image Creator-a, alata za uređivanje slika zasnovanog na veštačkoj inteligenciji ugrađenog u Bing pretraživač. Kompanija je obećala da će novi model — najnovija verzija OpenAI-jevog DALL-E 3 modela, kodnog naziva PR16 — omogućiti korisnicima da kreiraju slike „dvostruko brže nego ranije“ uz „viši kvalitet“.
Međutim, to obećanje nije ispunjeno. Pritužbe su ubrzo preplavile platforme X i Reddit.
„DALL-E koji smo voleli zauvek je nestao“, napisao je jedan korisnik Reddit-a. „Sada koristim ChatGPT jer je Bing postao beskoristan za mene“, dodao je drugi.
Reakcije korisnika bile su takve da je Microsoft najavio povratak na prethodni model u Bing Image Creator-u dok ne reši probleme.
„Uspešno smo [reprodukovali] neke od prijavljenih problema i planiramo da se vratimo na [DALL-E 3] PR13 dok ih ne rešimo“, izjavio je Jordi Ribas, direktor pretrage u Microsoft-u, u objavi na platformi X u utorak uveče. „Nažalost, proces implementacije je veoma spor. Počeo je pre više od nedelju dana i trajaće još 2-3 nedelje da bi dostigao 100%.“
Šta je pošlo po zlu?
Teško je precizno uporediti rezultate modela na osnovu anegdotalnih izveštaja, posebno kada upiti nisu standardizovani. Međutim, mnogi korisnici su primetili da PR16 generiše slike koje izgledaju manje realistično. Mayank Parmar, pišući za Windows Latest, istakao je da slike generisane modelom PR16 nedostaju detalji i završna obrada, a često deluju čudno crtano i „beživotno“.
Ovo nije prvi put da neki model, koji je očigledno prošao interne provere, naiđe na loš prijem u javnosti. Još u februaru, Google je bio primoran da pauzira sposobnost svog AI chatbota Gemini da kreira slike ljudi nakon pritužbi na istorijske netačnosti.
Ovi propusti ukazuju na to koliko je izazovno meriti poboljšanja modela u realnim uslovima. Prema Ribasu, Microsoft-ovi interni testovi pokazali su da je kvalitet PR16 modela „malo bolji u proseku“ u poređenju sa prethodnim modelom Bing Image Creatora.
Bez obzira na metrikе koje je kompanija koristila, očigledno je da one nisu bile u skladu sa preferencijama većine korisnika.