OpenAI-jev alat agent možda uskoro izlazi

od Ivan Radojevic 21/01/2025

21/01/2025

OpenAI-jev alat agent možda uskoro izlazi

OpenAI bi uskoro mogao objaviti alat veštačke inteligencije koji može preuzeti kontrolu nad vašim računarom i izvršavati radnje u vaše ime.

Tibor Blaho, softverski inženjer poznat po tačnom otkrivanju budućih AI proizvoda, tvrdi da je pronašao dokaze o OpenAI-jevom dugo očekivanom alatu pod nazivom Operator. Publikacije, uključujući Bloomberg, ranije su izveštavale o Operatoru, za koji se kaže da je „agentski“ sistem sposoban za autonomno obavljanje zadataka poput pisanja koda i rezervacije putovanja.

Prema izveštaju The Information-a, OpenAI cilja januar kao mesec za objavljivanje Operatora. Kod koji je Blaho otkrio tokom vikenda dodatno potvrđuje ta saznanja.

OpenAI-jev ChatGPT klijent za macOS dobio je, za sada skrivene, opcije za definisanje prečica poput „Toggle Operator” i „Force Quit Operator”, navodi Blaho. Takođe, Blaho tvrdi da je OpenAI dodao reference na Operator na svojoj veb stranici, iako te reference još uvek nisu javno vidljive.

OpenAI-jev alat agent možda uskoro izlazi 1

Prema Blahovim tvrdnjama, na sajtu OpenAI-a postoje tabele koje još uvek nisu javno dostupne, a koje upoređuju performanse Operatora sa drugim AI sistemima koji koriste računare. Ove tabele bi mogle biti samo privremene, ali ako su brojevi tačni, sugerišu da Operator nije 100% pouzdan, u zavisnosti od zadatka.

Na OSWorld-u, referentnom testu koji pokušava da oponaša realno računarsko okruženje, “OpenAI Computer Use Agent (CUA)” — verovatno AI model koji pokreće Operator — postigao je rezultat od 38,1%. To je bolje od modela za kontrolu računara kompanije Anthropic, ali znatno ispod rezultata ljudi, koji iznosi 72,4%. OpenAI CUA nadmašuje ljudske performanse na WebVoyager-u, testu koji procenjuje sposobnost veštačke inteligencije da se kreće i interaguje sa veb sajtovima. Međutim, model zaostaje za ljudima na drugom veb-testu, WebArena, prema procurelim podacima.

OpenAI-jev alat agent možda uskoro izlazi 2

Operator takođe ima problema sa zadacima koje bi ljudi lako obavili, ako su procurele informacije tačne. U testu koji je zahtevao od Operatora da se prijavi kod provajdera oblaka i pokrene virtuelnu mašinu, uspeo je samo u 60% slučajeva. Kada mu je zadat zadatak kreiranja Bitcoin novčanika, Operator je bio uspešan u samo 10% slučajeva.

OpenAI-jev skorošnji ulazak u prostor AI agenata dolazi u trenutku kada konkurenti, uključujući pomenuti Anthropic, Google i druge, ulažu napore u ovu oblast. Iako AI agenti mogu biti rizični i spekulativni, tehnološki giganti ih već predstavljaju kao sledeću veliku stvar u veštačkoj inteligenciji. Prema analitičkoj kompaniji Markets and Markets, tržište za AI agente moglo bi dostići vrednost od 47,1 milijardu dolara do 2030. godine.

Današnji agenti su relativno jednostavni, ali neki stručnjaci su izrazili zabrinutost za njihovu bezbednost ukoliko tehnologija brzo napreduje.

OpenAI-jev alat agent možda uskoro izlazi 3

Jedna od procurelih tabela pokazuje da Operator postiže dobre rezultate na odabranim bezbednosnim evaluacijama, uključujući testove koji ispituju sposobnost sistema da izvede „nezakonite aktivnosti“ ili pronađe „osetljive lične podatke“. Navodno je bezbednosno testiranje jedan od glavnih razloga za dugu razvojnu fazu Operatora. U nedavnoj objavi na platformi X, jedan od osnivača OpenAI-a, Vojćeh Zaremba, kritikovao je kompaniju Anthropic zbog objavljivanja agenta za kojeg tvrdi da nema adekvatne bezbednosne mere.

„Mogu samo da zamislim negativne reakcije kada bi OpenAI objavio nešto slično,“ napisao je Zaremba.

OpenAI-jev alat agent možda uskoro izlazi 4

Vredno je napomenuti da su OpenAI kritikovali istraživači veštačke inteligencije, uključujući bivše članove osoblja, zbog navodnog zanemarivanja rada na bezbednosti u korist bržeg komercijalnog plasiranja svojih tehnologija.

prethodna objava

Veštačka inteligencija i HR: Neophodna simbioza za 2025. godinu

sledeća objava

OpenAI-jev alat agent možda uskoro izlazi

Veštačka inteligencija i HR: Neophodna simbioza za 2025. godinu

DeepSeek tvrdi da njegov model za „rezonovanje“ nadmašuje OpenAI o1 na određenim testovima

Možda će vam se svideti i