Home AINeočekivani izvori informacija: Da li ChatGPT tajno koristi podatke kompanije xAI?

Neočekivani izvori informacija: Da li ChatGPT tajno koristi podatke kompanije xAI?

od itn
Veštačka inteligencija izvori podataka

U svetu gde se tehnološki giganti bore za svaki delić digitalnog prostora, vesti o „pozajmljivanju“ podataka uvek podignu veliku prašinu. Najnovija testiranja koja su sproveli nezavisni istraživači sugerišu da novi modeli kompanije OpenAI, konkretno ChatGPT, u svojim odgovorima koriste specifične baze podataka koje pripadaju platformi Grokipedia, iza koje stoji Elon Musk i njegova kompanija xAI.

Tragovi u kodu: Kako je otkrivena povezanost?

Sve je počelo kada su korisnici primetili neobične sličnosti u načinu na koji ChatGPT i Grok (AI asistent na mreži X) formulišu odgovore na veoma specifična, nišna pitanja. Detaljnijom analizom i testiranjem putem „prompt engineering“ tehnika, primećeno je da ChatGPT ponekad citira podatke ili koristi strukture rečenica koje su jedinstvene za Grokipedia ekosistem.

Grokipedia je zamišljena kao masovna arhiva znanja koja se napaja podacima u realnom vremenu sa mreže X (nekadašnji Twitter). Ako su ovi navodi tačni, to znači da OpenAI koristi podatke svog direktnog konkurenta kako bi unapredio ažurnost i „dosetljivost“ sopstvenog modela.

Veštačka inteligencija izvori podatakaRat za podatke i pitanje etike u svetu veštačke inteligencije

Ovaj slučaj otvara mnogo širu priču o tome odakle zapravo dolazi znanje koje nam AI servira. Poznato je da se modeli treniraju na javno dostupnim informacijama sa interneta (Common Crawl), ali granica između javnog dobra i intelektualne svojine postaje sve tanja.

Evo nekoliko ključnih tačaka koje ovaj sukob stavlja u prvi plan:

  • Reciklaža informacija: Ako jedan model uči od drugog, dolazi do fenomena „AI kanibalizma“, gde se originalnost teksta gubi u krugu stalnog prepričavanja.

  • Problem autorskih prava: Elon Musk je više puta kritikovao OpenAI zbog korišćenja podataka sa njegove platforme bez adekvatne kompenzacije ili dozvole, što je čak dovelo i do sudskih sporova.

  • Kvalitet odgovora: Grokipedia je poznata po svom nekonvencionalnom, često „anti-woke“ tonu. Korisnici se pitaju da li će ChatGPT, preuzimajući ove izvore, promeniti i svoj prepoznatljivi, neutralni ton.

Zašto je ovo važno za budućnost interneta?

Ako se trend korišćenja tuđih baza podataka nastavi, mogli bismo se naći u situaciji gde svi veliki AI modeli – bilo da ih pravi Google, Microsoft ili OpenAI – počnu da zvuče isto jer koriste iste izvore. Za običnog korisnika, to znači manje raznolikosti u informacijama i potencijalno veći rizik od širenja dezinformacija ako se jedan pogrešan podatak „preseli“ iz jednog modela u sve ostale.

Osim toga, ovaj incident dodatno produbljuje jaz između onih koji zagovaraju „otvoreni“ internet i onih koji žele da svoje podatke zaključaju iza skupih pretplata. Elon Musk je već preduzeo korake da ograniči pristup podacima na mreži X za botove i „scraper-e“, ali čini se da tehnološki giganti uvek pronađu način da zaobiđu te barijere.

Veštačka inteligencija izvori podatakaKo zapravo drži ključeve znanja?

Priznanje ili otkriće da ChatGPT koristi Grokipedia izvore podseća nas na to koliko je borba za kvalitetne podatke surova. U trci da postanu što pametniji i što brži, modeli veštačke inteligencije postaju zavisni od sadržaja koji kreiraju ljudi na društvenim mrežama, često bez svesti tih istih ljudi da njihove misli postaju deo algoritma.

Ostaje da se vidi kako će OpenAI odgovoriti na ove optužbe i da li će se u budućnosti uvesti jasniji protokoli o citiranju izvora unutar samih AI četova. Do tada, uvek je pametno uzeti odgovore sa dozom rezerve, bez obzira na to koliko samouvereno oni zvučali.

Banner

Banner

Možda će vam se svideti i