Dvīņi 2.5 'Dators Lietot' AI modelis var autonomi orientēties vietnēs

Google izlaiž ambiciozu jaunu AI modeli, kas izstrādāts, lai mijiedarbotos ar internetu pārsteidzoši cilvēciskā veidā. Saukts par Gemini 2.5 datora lietošanu, šī specializētā AI var orientēties tīmekļa pārlūkprogrammās, noklikšķināt uz pogām, aizpildīt veidlapas un pat ritināt lapas – tas viss ir atkarīgs no vienkāršas teksta uzvednes. Tas ir nozīmīgs solis uz AI aģentu izveidi, kas var autonomi veikt sarežģītus digitālos uzdevumus. Modelis var pārsniegt vienkāršas tērzēšanas robotu atbildes, lai aktīvi iesaistītos lietotāja saskarnēs.

Šis AI modelis, kas veidots uz Dvīņu 2.5 Pro iespējām, atšķir sevi, darbojoties virtuālā pārlūka vidē. Atšķirībā no dažiem konkurējošiem AI aģentiem, kas var piekļūt visai darbvirsmas operētājsistēmai, Google modelis īpaši koncentrējas uz tīmekļa un mobilajām saskarnēm. Šī pieeja ļauj tai risināt ikdienas digitālos darbus, kas iepriekš bija nepieciešama cilvēka iejaukšanās vai sarežģīta API integrācija. Padomājiet par AI, kas aizpilda detalizētu tiešsaistes veidlapu, pārvietojošu vietni navigē vai pievieno preces iepirkumu grozam, pamatojoties uz sarakstu – tas viss ir ar minimālu satraukumu.

Dvīņi 2.5 datora modelis ir Google jaunais AI aģents

Gemini 2.5 datora lietošanas kodols atrodas iteratīvā atgriezeniskās saites cilpā. Kad lietotājs veic AI uzdevumu, modelis vispirms saņem pieprasījumu, pašreizējā ekrāna ekrānuzņēmumu un iepriekšējo darbību vēsturi. Pēc tam tas apstrādā šo informāciju un ierosina konkrētu lietotāja saskarnes darbību, piemēram, noklikšķinot uz saites, ierakstot tekstu laukā vai ritinot uz leju. Klienta puses kods izpilda darbību, ekrāna atjauninājumus un jaunu ekrānuzņēmumu tiek nosūtīts atpakaļ uz AI. Šī cilpa turpinās, līdz sākotnējais uzdevums nav pabeigts.

https://www.youtube.com/watch?v=_Lu-fcpuifm

Google ir optimizējis šo modeli galvenokārt tīmekļa pārlūkiem. Tomēr tas parāda arī solījumu mobilo lietotņu kontrolei. Iekšējā pārbaude Google jau izmanto šī modeļa versijas tādiem uzdevumiem kā UI pārbaude, paātrinot programmatūras izstrādi.

https://www.youtube.com/watch?v=slolc1nkky0

Veiktspēja un drošība fokusā

Google apgalvo, ka Gemini 2.5 datora izmantošanas modelis “pārspēj vadošās alternatīvas vairākos tīmekļa un mobilajos etalonos” ar zemāku latentumu. Demonstrācijas rāda, ka AI kompetenti vada uzdevumus, piemēram, spēles 2048 spēlēšanu vai vietņu pārlūkošanu. Interesanti, ka īsi testi pat parāda, ka tas atrisina Google Search Captchas, kas ir ievērojams šķērslis lietotājiem, kas nav cilvēki.

Tomēr Google arī uzsver drošību. Uzņēmums apzinās unikālos riskus, kas saistīti ar AI aģentiem, kas kontrolē datorus. Slikti aktieri varētu izraisīt iespējamu ļaunprātīgu izmantošanu vai pat negaidītu AI izturēšanos. Paturot to prātā, uzņēmums ir izveidojis drošības funkcijas tieši modelī. Izstrādātāji saņem arī rīkus, lai neļautu AI veikt augsta riska darbību, piemēram, kompromitēt sistēmas drošību vai apiet Captchas bez skaidras lietotāja atļaujas.

Pašlaik izstrādātājiem ir pieejama Gemini 2.5 datora lietošana, izmantojot Gemini API Google AI Studio un Vertex AI. Tas vēl nav tieši pieejams patērētājiem. Tas nozīmē, ka šī tehnoloģija paver ceļu nākotnei, kurā AI apstrādā vairāk mūsu ikdienas digitālās mijiedarbības.