Waymo izmantot Google Gemini autonomai robotaksei

Waymo ir norādījis, ka izmantos Google Gemini AI savai pašpiedziņas “robotaksei”. Šķiet, ka uzņēmums izstrādā jaunu apmācības modeli saviem autonomajiem transportlīdzekļiem, kas apkopos datus no Google Multimodal Large Language Model (MLLM) Gemini.

Waymo izdod jaunu pētījumu par MLLM, kas palīdz robotaxis

Waymo LLC agrāk bija pazīstams kā Google pašbraucošo automašīnu projekts. Tas ir amerikāņu autonomās braukšanas tehnoloģiju uzņēmums. Waymo pakāpeniski izstrādā aparatūru un programmatūru robotaxis, lai droši pārvadātu pasažierus uz noslogotiem ceļiem.

Waymo izlaida jaunu pētniecības darbu, ziņots The Verge. Nosaukums “Pilnīgs multimodāls modelis autonomai braukšanai” vai EMMA, pētnieciskajā dokumentā ir norādīts uz jaunu MLLM, kas ir paredzēts autonomiem transportlīdzekļiem.

Šis jaunais visaptverošais apmācības modelis apstrādātu sensoru datus un radītu “nākotnes trajektorijas autonomiem transportlīdzekļiem”. Lieki piebilst, ka tas palīdzētu Waymo bezvadītāja transportlīdzekļiem pieņemt gudrus lēmumus uz ceļa. Waymo robotaxis varēja droši paredzēt, kurp doties un kā izvairīties no šķēršļiem.

Kā Google Gemini palīdzēs Waymo?

Jau vairākus gadus bezvadītāja transportlīdzekļu algoritmi ir pieņēmuši nodalījumus vai moduļus, lai risinātu katru kritisko funkciju. Citiem vārdiem sakot, tehnoloģiju uzņēmumi mēģināja risināt tādus aspektus kā uztvere, kartēšana, prognozēšana un plānošana neatkarīgi viens no otra.

Šāda pieeja ir palīdzējusi atrisināt autonomo transportlīdzekļu problēmas. Tomēr, izmantojot šo pieeju, uzņēmumi ir saskārušies ar problēmām, pielāgojot savus risinājumus. Tas ir saistīts ar “uzkrātajām kļūdām moduļos un ierobežotu starpmoduļu saziņu”, pētnieciskajā dokumentā minēja Waymo.

Turklāt “iepriekš definētie” parametri lika šādiem risinājumiem traucēt, reaģējot uz “jaunām vidēm”, jo tiem bija grūti “pielāgoties”. Google Gemini ir ģeneratīvais mākslīgais intelekts (Gen AI). Tas ir “ģenerālists” AI, ko meklēšanas gigants ir apmācījis, izmantojot milzīgus datu kopumus no interneta.

Otrkārt, Gen AI platformas ir pierādījušas, ka tās demonstrē “pārspējamas” spriešanas spējas, izmantojot tādas metodes kā “domu ķēdes spriešana”, ierosināja Waymo. Vienkārši sakot, Dvīņi var atdarināt cilvēka domāšanu, un līdz ar to LLM varētu “domāt” kā autovadītājs.

Lai gan Google Gemini varētu palīdzēt Waymo, EMMA AI joprojām būtu labi jāspēlē ar jauniem datiem, kas autonomiem transportlīdzekļiem ir jādara pastāvīgi. Konkrēti, EMMA ir saskārusies ar problēmām, iekļaujot 3D sensora ieejas no lidara vai radara, atzina Waymo.