Google Gemini video tika iestudēts, kas ir sava veida atvieglojums

Tātad, Google tikko laida klajā savu multimodālo juggernautu ar nosaukumu Gemini. Tas ir jaunais ārkārtīgi jaudīgais AI modelis no uzņēmuma, un tas ir paredzēts, lai cīnītos pret tādiem modeļiem kā GPT-4. Visu atklāšanas svētku ietvaros mēs redzējām praktisku video, kurā tika parādītas Dvīņu spējas. Nu, Google atzina, ka tā Gemini praktiskais video tika iestudēts.

Tātad, lai jūs uzzinātu, kad Google palaida Gemini, tas parādīja praktisku video, kurā persona demonstrēja dažas no Gemini spējām. Tas radīja izskatu, ka Gemini apstrādā reāllaika audio un video datus. Kad cilvēks ievieto kamerā objektu, tas uzdod Dvīņiem jautājumus par to, ko tas “redz”, un sniedz atbildes. Mēs dzirdētu AI ģenerētu balsi atbildam.

Tā ir lieliska Dvīņu spēju demonstrācija… vai arī tā būtu, ja tā būtu ĪSTA.

Google atzīst, ka tās Gemini praktiskais video ir iestudēts

Bloomberg viedokļu raksts izlēja šo tējas gabaliņu. Tajā teikts, ka Google atklāja, ka video nebija 100% īsts. Reāllaika vokālās mijiedarbības starp vadītāju un Dvīņiem nebija. Tas viss notika ar video rediģēšanas burvību. Arī mijiedarbība tika paātrināta ziņā, kas lika tam šķist ātrāka nekā patiesībā.

Bet, lai gan videoklips nebija 100% īsts, mēs nevaram teikt, ka tas bija 100% viltots. Tā ir Dvīņu spēju demonstrācija, un mēs joprojām redzam tās spējas. Google izmantoja “nekustīgu attēlu kadrus no filmētā materiāla un pamudinājumus, izmantojot tekstu”. Tā vietā, lai nejauši sarunātos ar Gemini, uzņēmums modelē ievadīja nekustīgus attēlus un ierakstīja to, ko vēlas, lai Gemini ražotu.

Būtībā mēs joprojām redzam Dvīņu spējas; mēs joprojām skatāmies, ko tas var dot, ņemot vērā ievadi. Google izmantoja Holivudas maģiju, lai padarītu to spēcīgāku, nekā tas ir. Runājot par atbilžu ātrumu, Google aprakstā norādīja, ka atbildes tika paātrinātas īsuma labad.

Vai uzņēmums to dara nepareizi? Kas zina? Tās ir debates par YouTube komentāru sadaļu.

Video tika iestudēts, un tas ir neliels atvieglojums

Neatkarīgi no tā, vai videoklips ir viltots, tas joprojām ir daudz spēcīgāks par Bardu. Modelis ir gudrāks ar vairāk žetonu un parametru, bla bla bla. Neatkarīgi no tā, kas notiek, uzņēmumiem joprojām būs instrumenti, lai paātrinātu ražošanu un efektivitāti. Ir arī vairāki veidi, kā piekļūt Dvīņiem.

Tomēr videoklips kļuva diezgan biedējošs ikvienam, kas to skatījās. Mēs burtiski redzējām, kā Dvīņi dažās sekundēs izveido foršu tropisku dziesmu, kas komponistam prasīs daudz ilgāku laiku. Mēs arī redzējām, kā tas dažu sekunžu laikā rada attēlus no dzijas. Kopš DALL-E beidzot kļuva labs un kopš ChatGPT nonāca tirgū, cilvēku radītāji ir novecojuši. Situācija neuzlabojas, un praktiskais video patiešām lika izskatīties, ka Google beidzot ir ielikusi pēdējo naglu veidotāju zārkā.

Tomēr fakts, ka tas tika iestudēts, liecina, ka tehnoloģija vēl nav pilnībā izveidota. Veidotājiem ir tikai nedaudz vairāk laika. Tas ir viss, ko mēs šobrīd varam lūgt.