OpenAI atzīst, ka tūlītēja injekcija ir ilgstošs drauds AI pārlūkprogrammām

OpenAI saka, ka tā smagi strādā, lai padarītu savu Atlas AI drošāku, jo eksperti brīdina par tūlītējiem injekcijas uzbrukumiem. Sliktākais ir tas, ka šādus uzbrukumus ir ļoti grūti apturēt. Viņi slēpj kaitīgus norādījumus e-pastos vai tīmekļa lapās un piemāna AI aģentus rīkoties nepareizi. Tehnoloģiju gigants saka, ka problēma pilnībā nepazudīs.

AI pārlūkprogrammas ir pakļautas tūlītēju injekciju uzbrukumu riskam

OpenAI savu jauno AI pārlūkprogrammu ChatGPT Atlas bija laidusi klajā šī gada oktobrī. Tomēr drīz pēc palaišanas drošības pētnieki parādīja, kā daži slēpti vārdi dokumentā vai e-pastā var mainīt pārlūkprogrammas uzvedību. OpenAI arī atzina, ka pārlūkprogrammas aģenta režīms varētu palielināt drošības riskus. Tas galvenokārt ir tāpēc, ka AI var kontrolēt sistēmu lietotāja vārdā.

Citi uzņēmumi visā pasaulē piekrita, ka tā nav tikai OpenAI problēma. Brave, viena no populārākajām pārlūkprogrammām, arī brīdināja, ka tūlītēja injekcija var ietekmēt daudzas AI pārlūkprogrammas. Citi tehnoloģiju giganti, piemēram, Anthropic un Google, saka, ka šie uzbrukumi ir ilgtermiņa problēmas. Lai to padarītu vēl sliktāku, Apvienotās Karalistes Nacionālais kiberdrošības centrs saka, ka tūlītējus injekcijas uzbrukumus nekad nevarēs pilnībā novērst.

Bojājumu kontrole ir vienīgais risinājums uzbrukumam

Apvienotās Karalistes pētniecības centrs arī iesaka uzņēmumiem koncentrēties uz bojājumu ierobežošanu, nevis mēģināt pilnībā pārtraukt tūlītēju injekciju. OpenAI saka, ka tā vairogs pret šādiem uzbrukumiem ir ātrāka testēšana un ātrāki atjauninājumi.

Lai vēl vairāk atrisinātu problēmu, uzņēmums ir izstrādājis AI modeli, kas ir apmācīts, izmantojot pastiprinošo mācīšanos, lai darbotos kā hakeris. Tā nepārtraukti meklē veidus, kā apmānīt AI aģentus, un simulācijās pārbauda uzbrukumus. Tas palīdz uzņēmumam novērst vai novērst uzbrukumu, pirms to var izmantot īsts uzbrucējs. OpenAI arī saka, ka sistēma jau ir atzīmējusi jaunas uzbrukuma metodes, kuras cilvēku testētāji palaiduši garām.

Turklāt tas nav viss par pārlūkprogrammām un tehnoloģiju uzņēmumiem. Arī lietotāja uzvedībai ir liela nozīme. Wiz pētnieks Rami McCarthy skaidro, ka šādu uzbrukumu risks pieaugs vēl vairāk, kad AI būs lielāka brīvība un piekļuve lietotāju sensitīviem datiem.