Meta pokreće novi program u partnerstvu sa UNESCO-om, koji ima za cilj prikupljanje snimaka govora i transkripcija, a kako je kompanija saopštila, ovo će pomoći u razvoju buduće otvorene AI tehnologije.
Program, pod nazivom Program partnerstva za jezičke tehnologije, traži saradnike koji mogu doprineti sa više od 10 sati snimaka govora sa transkripcijama, velikim količinama pisanog teksta i skupovima prevedenih rečenica na „različitim jezicima“. Prema Meta-i, partneri će raditi sa AI timovima kompanije na integraciji ovih jezika u modele za prepoznavanje govora i prevođenje, koji će nakon završetka biti otvorenog koda.
Partneri do sada uključuju vladu Nunavuta, retko naseljene teritorije na severu Kanade. Neki stanovnici Nunavuta govore Inuit jezike, koji su poznati kao Inuktut.
„Naši napori su posebno usmereni na nedovoljno zastupljene jezike, u okviru UNESCO-ovog rada“, napisala je Meta u blog postu koji je dostavljen TechCrunch-u. „Naš krajnji cilj je da kreiramo inteligentne sisteme koji mogu da razumeju i odgovore na kompleksne ljudske potrebe, bez obzira na jezik ili kulturno poreklo.“
Kao dopuna novom programu, Meta je saopštila da pušta otvoreni izvorni referentni sistem za mašinski prevod kako bi ocenila performanse modela za prevođenje jezika. Ovaj sistem, koji se sastoji od rečenica koje su kreirali lingvisti, podržava sedam jezika i može se pristupiti — i doprinositi — sa AI razvojne platforme Hugging Face.

Meta predstavlja obe inicijative kao filantropske. Međutim, kompanija ima koristi od unapređenih modela za prepoznavanje govora i prevođenje.
Meta nastavlja da širi broj jezika koje njen AI asistent, Meta AI, podržava, kao i pilot funkcije poput automatskog prevođenja za kreatore. Prošlog septembra, Meta je saopštila da će početi testiranje alata za prevođenje glasova na Instagram Reels-u, omogućavajući kreatorima da sinhronizuju svoj govor i automatski ga usklade sa pokretima usana.
Tretman Meta-e prema sadržaju na jezicima osim engleskog na njenim platformama bio je predmet velikih kritika. Prema jednom izveštaju, Facebook je ostavio gotovo 70% dezinformacija o COVID-u na italijanskom i španskom jeziku označenih kao netačne, dok je samo 29% sličnih dezinformacija na engleskom jeziku bilo označeno. Takođe, procureli dokumenti iz kompanije otkrivaju da se postovi na arapskom jeziku redovno greškom označavaju kao govor mržnje.
Meta je izjavila da preduzima korake kako bi poboljšala svoje tehnologije za prevođenje i moderaciju.



