Google demonstrēja savu jauno mākslīgā intelekta modeli Gemini, kas daudziem no mums palika bez vārdiem, bet Izrādās, viņš krāpās, lai tīši mūs maldinātu.
Ir sākusies sacensība par mākslīgo intelektu (AI), un OpenAI ir atstājuši lielus uzņēmumus ārpus spēles. Apple turpina darīt savu, nesteidzoties, bet šķiet, ka tas strādā pie sava modeļa, ko mēs varētu sākt redzēt no nākamā iPhone 16. Šķiet, ka Google steidzas un ir parādījis, ko Gemini var darītviņa jaunais AI modelis, ar video, kas ir iespaidīgs, pareizāk sakot, tā būtu, ja tā būtu patiesība, jo viņš ir krāpies.
Videoklipā, kuram pēc nepilnām 48 stundām jau ir gandrīz divi miljoni skatījumu, mēs varam redzēt, kā Gemini darbojas tādā veidā, kādu līdz šim nebijām redzējuši. Izmantojot tiešos attēlus un balsi, AI Google atbild uz mūsu balss jautājumiem, vienmēr atpazīstot attēlos notiekošo, tajā pašā laikā tas notiek, bez gaidīšanas laikiem. Ja veltīsit dažas minūtes video skatīšanai, jūs, bez šaubām, būsiet pārsteigts.
Taču izrādās, ka Dvīņi tā nedarbojas. Google modelis neatpazīst redzamos video attēlus, bet gan drīzāk tas patiešām atpazīst nekustīgus attēlus un rakstiskus jautājumus, nav nekāda sakara ar video redzamo. Piemēram, lai jūs labi saprastu, ko es domāju, 4:27 minūtē mēs varam redzēt, kā tiek parādīti trīs zīmējumi (Saule, Saturns un Zeme), un mums tiek jautāts, vai tā ir pareizā secība. Dvīņu atbilde ir, ka tā nav pareiza, un pievieno karalisko kārtību. Taču lietas nenotiek tā, Dvīņi redz trīs zvaigžņu fotogrāfiju un rakstisku jautājumu: «Vai tā ir pareizā secība? Apsveriet attālumu līdz saulei un izskaidrojiet savu argumentāciju.
Viss Google video ir montāža, kurai nav nekā kopīga ar to, kā Dvīņi patiesībā darbojas. Tā ir taisnība, ka Google AI sniedz mums atbildes, ko mēs redzam videoklipā, un ka tajā redzamie attēli tiek izmantoti, taču “Kā” ir ļoti svarīgi, un šeit Google mūs ir maldinājis. Parādīt mums, kā modelis patiesībā darbojas, būtu bijis pareizi, bet tas noteikti nebūtu bijis tik iespaidīgs, vai ne?