Ako iz nekog razloga želite da predate potpunu kontrolu nad vašim ličnim računarom AI modelu, sada to možete učiniti sa Anthropic-om.
Rival OpenAI-a koji podržava Amazon objavio je novu verziju svog Claude 3.5 Sonnet modela u utorak, koja je sposobna da izvršava niz osnovnih zadataka na vašem desktopu, kao što su unos tastera i klikova mišem, što joj omogućava korišćenje potencijalno bilo koje aplikacije koju imate instaliranu.
„Mislim da ulazimo u novu eru u kojoj model može koristiti sve alate koje koristite kao osoba kako bi obavio zadatke,“ rekao je Jared Kaplan, glavni naučni saradnik Anthropic-a, za Wired.
Ova ažuriranja su Anthropic-ov pokušaj da se uključi u trku u industriji kako bi komercijalni AI modeli izašli iz okvira chat box-a i postali potpuni „AI agenti“.
Zadatak je uspešno neuspešan
„AI agenti“ su pomalo nejasan termin koji se koristi za opisivanje AI modela usmerenih na produktivnost, dizajniranih da koriste softver i izvršavaju druge računarom obavljene zadatke kao što bi to činila osoba, sa različitim stepenima svestranosti.
Neki, poput Devin-a iz Cognition AI-a, posebno su dizajnirani za programiranje. Anthropic, s druge strane, trži svoj AI agent kao svestranog, tvrdeći da može da pretražuje internet i koristi bilo koju web stranicu ili aplikaciju. Šta ćete raditi sa njim zavisi od vas: mogu to biti tehnički zadaci, poput programiranja, ili jednostavniji zadaci, poput planiranja putovanja.
U demonstraciji koju opisuje Wired, na primer, Claude dobija zadatak da isplanira putovanje da vidi Zlatnu kapiju u zoru sa prijateljem. AI otvara web pretraživač, pronalazi dobru lokaciju za gledanje na Google-u zajedno sa drugim detaljima i dodaje putovanje u aplikaciju za kalendar. Impresivno, ali Wired napominje da nije uključilo druge korisne informacije — kao što je, na primer, kako zapravo da se stigne tamo.
U drugoj demonstraciji, Claude je zamoljen da postavi jednostavnu web stranicu, što i čini koristeći Microsoft Visual Studio Code. Čak otvara lokalni server da testira web stranicu koju je upravo napravio. Došlo je do male greške prilikom kreiranja, ali AI ispravlja kod kada je to zatraženo.
Dvostruki agenti
Iako tehnologija može izgledati obećavajuće, AI modeli se i dalje bore sa pouzdanošću, posebno kada je reč o pisanju koda — a ni Anthropic nije izuzetak.
Čak i u jednostavnom testu koji je uključivao rezervaciju letova i izmene rezervacija, Claude 3.5 Sonnet uspeo je da završi manje od polovine ovih zadataka, prema TechCrunch-u.
Iako mogu biti nespretni, takvi AI agenti takođe predstavljaju očigledan bezbednosni rizik. Da li biste želeli da ova eksperimentalna i ponekad nepredvidiva tehnologija pretražuje vaše računarske datoteke i koristi vaš web pretraživač?
Anthropic tvrdi da će njihovo puštanje na tržište na ovaj način pomoći AI agentima da budu sigurniji — iako, možda, na vaš račun.
„Mislimo da je daleko bolje omogućiti pristup računarima današnjim ograničenijim, relativno sigurnijim modelima,“ napisao je Anthropic u saopštenju, prema TechCrunch-u. „To znači da možemo početi da posmatramo i učimo o bilo kakvim potencijalnim problemima koji se javljaju na ovom nižem nivou, postepeno i istovremeno gradeći upotrebu računara i mere bezbednosti.“