Openai palaiž vietējo attēlu paaudzi Chatgpt – nav Dall · e, un tā ir atvērta visiem

Openai uzsāka nozīmīgu jauninājumu uz Chatgpt, un tas ir pieejams visiem. Otrdien uzņēmums paziņoja par vietējās attēla ģenerēšanas uzsākšanu, ko darbina GPT-4O modelis, ļaujot lietotājiem izveidot attēlus tieši ChatGpt lietotnē-nav nepieciešami ārējie rīki, piemēram, Dall · e.

Funkcija jau ir tieša un atvērta visiem lietotājiem, ieskaitot tos, kuri atrodas bezmaksas līmenī, veidojot attēlu radīšanu ātrāku, vienmērīgāku un pilnībā integrētu tērzēšanas pieredzē.

“Ir ieradusies 4o attēlu ģenerēšana. Tas šodien sāk ieviest Chatgpt un Sora visiem Plus, Pro, komandu un bezmaksas lietotājiem,” Openai sacīja ziņojumā X.

Teksts uz attēlu, būvēts tieši iekšā

Pirms tam attēla pieprasījumi tika novirzīti, izmantojot atsevišķu modeli. Tagad GPT-4O rīkojas ar visu dabiski. Tas nozīmē labāku precizitāti, ātrāku izvadi un attēlus, kas precīzāk atbilst uzvednei. Vai vēlaties īpašu malu attiecību, noteiktu krāsu sešstūrā vai caurspīdīgu fonu? Vienkārši sakiet tā, un tas ģenerēs to, kas jums nepieciešams mazāk minūtē.

Viena liela uzvara šeit ir konsekvence. Modelis var saglabāt rakstzīmes vienādus izskatus vairākos attēlos, atveidot tekstu, kas faktiski ir lasāms, un ar lielāku precizitāti sekot detalizētiem uzvedumiem.

Openai nav vienīgais, kas ar to eksperimentē. Google nesen pārbaudīja vietējā attēla izvadi savā Gemini 2.0 zibspuldzes modelī. Bet Openai, iespējams, ir tikko lēcies uz priekšu, to izraujot visiem vienlaikus.

Lietotāji jau ir pārsteigti

Ziņas ātri skāra X (agrāk Twitter). @Danshipper to sauca par “satriecošu”. @stevenhedel ievietoja piemērus, kas izskatījās pārsteidzoši detalizēti. @RisphereEditor norādīja, kā GPT-4O tagad var saglabāt rakstzīmes konsekventus, neaicinot ārējos modeļus. Un @Marionawfal citēja Openai izpilddirektoru Samu Altmanu, kurš izvēršanu raksturoja kā “jaunu augsta ūdens zīmi” uzņēmumam.

Viena no populārākajām reakcijām nāca no @adonis_singh, kurš apstiprināja, ka vietējā attēla ģenerēšana jau ir pieejama un darbojas lietotnē. Šis piekļuves līmenis ir radījis spēcīgu iespaidu – ir reti redzēt šāda veida funkcijas, kas pieejamas gan bezmaksas, gan apmaksātiem lietotājiem jau no pirmās dienas.

Kā tas darbojas

Atjauninājums liek lietām justies dabiskākām. Tā vietā, lai rakstītu jaunas uzvednes katram mazam kniebienam, varat vienkārši pateikt Chatgpt mainīt kaut ko vidējo konversiju, piemēram, pielāgojot krāsas vai pievienojot jaunu elementu. Tā ir neliela maiņa, taču tā padara procesu daudz draudzīgāku.

Arī šeit ir īsta lietderība. Verge atzīmētie piemēri, piemēram, marķētu diagrammu ģenerēšana Ņūtona prizmas eksperimentam vai daudzpaneļu komiksi ar konsekventiem rakstzīmēm. Openai to arī integrēja Sora, tā video ģenerēšanas rīkā, tāpēc viena un tā pati tehnoloģija var darbināt gan nekustīgus attēlus, gan animācijas.

Iebūvētas robežas un aizsardzības pasākumi

Openai ir pievienojuši pasākumus nepareizas izmantošanas samazināšanai. Attēli nāk ar C2PA metadatiem, tāpēc to AI izcelsmi var pārbaudīt. Modelis bloķē arī tādu saturu kā kailums un grafiskā vardarbība – vērtības, kas apgūtas no iepriekšējiem jautājumiem, piemēram, Teilore Svifta DeepFake, kas kādu laiku atgriezās.

Verge norādīja, ka Openai pieeja ir pretstatā citiem, piemēram, Google Dvīņiem, kas nonāca ugunsgrēkā ūdenszīmju noņemšanai. Openai komanda saka, ka viņi šajā frontē izmanto stingrāku pieeju.

Kur tas liek Openai

Ar šo palaišanu Openai virzās uz priekšu AI Tools sacīkstēs, it īpaši, padarot uzlabotas funkcijas plaši pieejamas. Tā kā citi spēlētāji, piemēram, Google un Xai (Elona Muska AI projekts), virza savus modeļus, spiediens ir acīmredzami ieslēgts.

Investing.com atzīmēja, ka gan attēla, gan teksta apstrāde ar vienu un to pašu modeli dod GPT-4O malu-tas jūtas gudrāks, saliedētāks. Bet Openai saka, ka tas joprojām ir nepabeigts darbs, ar vēl vairāk atjauninājumu.

Ko tas nozīmē jums

Neatkarīgi no tā, vai veidojat logotipus, zinātniskas diagrammas vai vienkārši sajaucaties ar vizuālām idejām, iespējas tagad ir daudz atvērtākas. Šādi rīki agrāk bija rezervēti profesionāļiem vai apmaksātiem līmeņiem. Tas ir mainīts.

Meklēšana Alpha minēja, kā šī attēlu ģenerēšana uzlabo un tā integrācija gan Chatgpt, gan Sora – Signals Openai centās apvienot savus rīkus. Tas mēģina izveidot platformu, kurā viss darbojas kopā, nevis kā atvienotu funkciju kolekcija.

Raugoties uz priekšu

Openai šo funkciju nometa pareizi, jo konkurenti izlaida savus jauninājumus, kas padara laiku diezgan interesantu. Google parādīja savu Gemini 2.0 Flash šī mēneša sākumā, kas koncentrējās uz ātruma un stila pielāgošanu. Bet vai Openai to piedāvā visiem lietotājiem no vārtiem? Tā ir liela spēle.

Drīzumā gaidāmas uzņēmuma un izglītības versijas, norāda Bloomberg. Tātad ap stūri, iespējams, ir vairāk atjauninājumu.

Galīgās domas

Openai kustība šeit ir drosmīga. Viņi ir izvēlējušies sarežģītu funkciju un padarījuši to pietiekami vienkāršu, lai ikviens varētu izmantot. Tāda ir maiņa, kas maina to, kā cilvēki ikdienā izmanto AI – neatkarīgi no tā, vai tā ir darbam, blakusprojektiem vai tikai zinātkārei. Ja esat parasts Chatgpt lietotājs, ir vērts pārbaudīt. Tagad jūs varat sarunāties ar savu AI palīgu un jums to ieskicēt jums – nav nepieciešami papildu rīki.