GPT-4o: viss, kas jums jāzina

OpenAI ir viens no lielākajiem mākslīgā intelekta uzņēmumiem pasaulē, un tas ir veidojis dažus no mūsdienu modernākajiem mākslīgajiem intelektiem. Daži no tā modeļiem, piemēram, GPT 3.5, GPT-4 un GPT-4 Turbo, ir no jauna definējuši AI spējas un nostiprinājuši to kā vienu no lielākajiem konkurentiem tādiem uzņēmumiem kā Google. Jaunākais un izcilākais OpenAI AI modelis tiek saukts par GPT-4o, un tas ir līdz šim jaudīgākais modelis. Kas ir GPT-4o, un kā tas var jums palīdzēt jūsu AI ceļojumā?

Tas ir tas, ko mēs esam šeit, lai atbildētu. Mēs apskatīsim, kas ir šis AI modelis, ko tas spēj, ko tas nevar darīt, kā arī citu informāciju, kas jums varētu interesēt. Mēs atbildēsim uz svarīgiem jautājumiem un informēsim, vai jums vajadzētu to izmantot salīdzinājumā ar citiem modeļiem, piemēram, Gemini, Claude, Meta AI utt.

Mēs iedziļināsimies svarīgākajos jautājumos, kas jums varētu rasties. Tomēr, tā kā runa ir par mākslīgo intelektu, ir daži aspekti, kuros mēs nevaram pārāk ienirt, jo tas padarīs šo rakstu pārāk garu. Tas ietver niršanu dažās zinātnēs un sarežģītās detaļās par modeli.

Visbeidzot, šis raksts tiks atjaunināts katru reizi, kad GPT-4o iegūs jaunu papildinājumu. Tāpēc ik pa laikam pārbaudiet, kas jauns ar GPT-4o. Bez turpmākas niršanas ienirt.

Kas ir GPT-4o?

Ja esat sekojis līdzi OpenAI modeļu attīstībai, iespējams, esat sapratis tā diezgan netradicionālo nosaukumu piešķiršanas shēmu. GPT-4o neizklausās daudz, taču tas ir līdz šim jaudīgākais OpenAI AI modelis. Tas ir GPT-4 Turbo pēctecis. Tātad, ja izmantojat OpenAI vismodernākos AI rīkus, visticamāk, jūs izmantojat GPT-4o.

Kā piekļūt jaunajam modelim?

Ir daži veidi. Pirmkārt, jūs varēsit piekļūt GPT-4o tāpat kā regulāri piekļūstat ChatGPT. Varat doties tieši uz ChatGPT vietni vai izmantot speciālo mobilo lietotni.

Kad OpenAI paziņoja par GPT-4o, uzņēmums paziņoja arī par citu veidu, kā jūs varat piekļūt modelim. Tā paziņoja par jaunu Mac OS darbvirsmas lietojumprogrammu. Tas būtībā pārvērš ChatGPT par tērzēšanas palīgu jūsu datorā. Varat to izsaukt, izmantojot vienkāršu īsinājumtaustiņu, un mijiedarboties ar parādīto peldošo teksta joslu. Līdztekus tam varat ievadīt attēlus, pievienot ekrānuzņēmumus un uzņemt attēlus ar ierīces sākotnējo kameru ievadei. Rakstīšanas laikā mēs joprojām gaidām, kad lietojumprogrammai iznāks balss funkcija. Mēs neesam pārliecināti, kad tas notiks.

Kas attiecas uz Windows lietotājiem, rakstīšanas laikā nebija nevienas Windows lietojumprogrammas. Tomēr OpenAI pašlaik strādā pie Windows lietojumprogrammas ieviešanas, kas darīs to pašu. Uzņēmums plāno to palaist kaut kad vēlāk 2024. gadā, tāpēc Windows lietotājiem būs jāseko līdzi.

Vēl viens veids, kā piekļūt GPT-4o, ir Microsoft Copilot. Kā jūs, iespējams, zināt, Microsoft ieguldīja lielus ieguldījumus OpenAI, un uzņēmums izmanto savu AI tehnoloģiju, lai darbinātu Copilot. Tādējādi dažas no Copilot vismodernākajām funkcijām, visticamāk, nodrošina GPT-4o. Uzņēmums nesen paziņoja par jaunajiem datoriem ar Copilot, un mēs esam pārliecināti, ka dažas no ļoti integrētajām AI tehnoloģijām nodrošina GPT-4o. Tātad, ja jūs esat par Microsoft Copilot un to, kā tas var uzlabot Windows pieredzi, visticamāk, jūs izmantojat GPT-4o.

Vai man ir jāpierakstās?

Nē. Ja jums jau ir OpenAI konts, jums vienkārši ir jādodas uz ChatGPT vietni, noklikšķiniet uz nolaižamās izvēlnes ekrāna augšdaļā un atlasiet modeli, kuru vēlaties izmantot. Ja GPT-4o ir pieejams jūsu reģionā, tad to varēs izvēlēties.

Tomēr, ja jums nav OpenAI konta, jūs vēlēsities tam reģistrēties, lai izmantotu jauno modeli. Turklāt, reģistrējoties OpenAI kontam, jūs varēsit piekļūt citām funkcijām, kuras kontu īpašnieki var izmantot, lai iegūtu personalizētāku pieredzi. Jums būs arī tērzēšanas vēsture, lai skatītu savu sarunu uzkrājumu.

Vai “O” GPT-4o nozīmē kaut ko?

Jā, “O” apzīmē “Omni”. Mēs esam pārliecināti, ka OpenAI uzskata to par universālu modeli, kas var apmierināt lielāko daļu jūsu vajadzību.

Vai GPT-4o ir multimodāls?

Jā, tā ir. Izmantojot GPT-4o, varat ievadīt klasiskās teksta uzvednes. Tas darbosies ChatGPT tāpat kā citi modeļi. Turklāt GPT-4o var arī saprast runu. Izmantojot balss funkciju, jūs varat runāt ar modeli tāpat kā ar jebkuru digitālo palīgu.

Ne tikai tas, bet arī GPT-4o var saprast vizuālo ievadi. Tam ir redzes funkcija, kas ļaus tam izmantot kameras skatu meklētāju, lai noskaidrotu pasauli līdzīgi kā Google objektīvs vai AI tapa. Tam būs arī iespēja redzēt, kas ir jūsu datora ekrānā, un sniegt informāciju, pamatojoties uz to, ko tas redz.

Jūs varēsiet uzdot GPT-4 jautājumus par ekrānā redzamo saturu, piemēram, tekstu, attēliem, tīmekļa lapām utt. No 2024. gada maija beigām šī funkcija nebija pieejama. Šis raksts tiks atjaunināts, kad tas būs pieejams.

Kā piekļūt redzes funkcijai?

Viena no aizraujošākajām funkcijām, ko OpenAI paziņoja kopā ar GPT-4o, bija redzes funkcijas uzlabojumi. Tas ļauj modelim redzēt, kas pašlaik ir jūsu ekrānā, un atbildēt uz jautājumiem par to, ko tas redz. Ne tikai tas, bet arī ChatGPT mobilajā versijā ir pieejama redzes funkcija.

Uzņēmums demonstrēja ChatGPT iespēju redzēt pasaules tiešo priekšskatījumu, izmantojot jūsu kameras skatu meklētāju. Tā varēs atbildēt uz jautājumiem par to, ko tā novēro.

Sludinājuma laikā tā varēja identificēt uz papīra uzrakstītas matemātikas problēmas un palīdzēt cilvēkam ar tām tikt galā. Līdz ar to tas pat varēja paskatīties uz cilvēka seju un pateikt, kādas emocijas viņš izjūt. Tas ir līdzīgs Google projektam Astra, par kuru uzņēmums paziņoja tikai vienu dienu pēc OpenAI Vision funkcijas. Tātad, noteikti būs daži salīdzinājumi starp abām šīm funkcijām.

Vai ir jauninājums uz balss funkciju?

Balss funkcija ieguva diezgan ievērojamu jauninājumu. GPT-4o bija paredzēts daudz efektīvākam un ātrākam modelim nekā GPT-4 turbo. Tas ir jūtams galvenokārt balss funkcijā. Kad OpenAI demonstrēja jauno balss funkciju, mēs redzējām, ka lietotāji saņem atbildes daudz ātrāk. Jūs varat gandrīz līdzināties reāllaika sarunai ar personu, kas jums nekavējoties atbild.

Atbilde joprojām prasīja sekundi vai divas, taču tas joprojām bija uzlabojums. Arī balss, ko dzirdat atbildē, ir daudz uzlabota. Tomēr no 2024. gada maija beigām reāllaika balss darbība ir apturēta. Pašlaik starp OpenAI un Skārletu Johansoni pastāv spriedze. Jaunā balss, kas tika atklāta, ir šokējoši līdzīga Skārletas Johansones balsij, un viņa pauda pret to savu riebumu. Tādējādi uzņēmums šobrīd maina virzienu.

Kāds ir GPT-4o konteksta logs?

Runājot par konteksta logu, GPT-4o joprojām diezgan tālu atpaliek no pārējās pakotnes. Pašlaik tai ir 128 000 marķieru konteksta logs. Tas ir tas pats, kas GPT-4 Turbo. Lai gan tas ir būtisks uzlabojums salīdzinājumā ar GPT-4 8192 marķieru limitu, tas joprojām atpaliek no Gemini 1.5 Pro, kas var sasniegt līdz pat 1 miljonam marķieru ierobežojumu. Google pat testē eksperimentālu 2 miljonu marķieru ierobežojumu Gemini 1.5 Pro. Tātad OpenAI vēl ir daudz darāmā.

Cik maksā GPT-4o API par miljonu marķieru?

Lai gan GPT-4o koplieto GPT-4 Turbo konteksta logu, tā nedala savu cenu par miljonu marķieru. GPT-4o ievades izmaksas ir USD 5 par miljonu marķieru un izvades izmaksas ir USD 15 par miljonu marķieru. Tā ir puse no tā, ko jūs maksājat, izmantojot GPT-4 Turbo, kura ievades izmaksas ir 10 USD par miljonu marķieru un izvades izmaksas ir 30 USD par miljonu marķieru.

Vai GPT-4o izvada attēlus?

Nē. OpenAI galvenā attēlu ģenerēšanas platforma joprojām ir DALL-E. Tomēr tas atbalsta attēla ievadi.

Cik valodas atbalsta GPT-4o

GPT-4o ir pieejams vairāk nekā 50 valodās.

Kāds ir GPT-4o zināšanu pārtraukšanas datums?

Šī ir viena no jomām, kur GPT-4 Turbo pārspēj savu pēcteci. GPT-4 Turbo beigu datums ir 2023. gada decembris. Tas nozīmē, ka tam nav nekādu zināšanu par pasauli, kas izveidota pēc šī datuma. No otras puses, GPT-4o darbība tiek pārtraukta 2023. gada oktobrī. Tātad tie ir 2 mēnešu dati, kuriem uzņēmumam nav piekļuves salīdzinājumā ar tā priekšgājēju. Turklāt, ja uzdodat GPT-4o kādus jautājumus, tas neko nezinās pēc 2023. gada oktobra. Tātad tam nav nekādu zināšanu par kaut ko, kas notiek 2024. gadā. Tas ir jāpatur prātā.

Vai GPT-4o var būt tulks?

Jā. Viena no galvenajām iezīmēm, kas tika demonstrēta, kad tika prezentēts GPT-4o, bija tulkošanas funkcija. Tas spēj reāllaikā tulkot daudzas valodas. Tas ne tikai spēj tulkot dažādas valodas, bet arī reaģē ļoti cilvēciski. Tā vietā, lai tulkotu runu vārdu pa vārdam, tas sniegs ļoti cilvēcisku kopsavilkumu par to, ko teica otra persona.

Ja kāds itālis jautā: “Kur ir tuvākais Starbucks?”, GPT-4o netulkos šo vārdu pa vārdam. Tomēr tas sniegs ļoti cilvēcisku tulkojumu, piemēram, “Viņš vēlas zināt, kur atrodas tuvākā Starbucks”. Tas tiek sniegts līdzīgi tam, ko cilvēks teiktu, nevis tulkotu vārdu pa vārdam.

Vai GPT-4o ir pieejams bezmaksas lietotājiem?

Jā, bet ir viens būtisks brīdinājums. Bezmaksas lietotāji var izmantot GPT-4o iespējas, piemēram, pārlūkot tīmekli, analizēt un iegūt ieskatus no datiem, augšupielādēt attēlus uzvednēs, nodrošināt atbalsta failus un uzvednes, kā arī izmantot GPT. Kāds ir brīdinājums? Jūs varat tos izmantot tikai ierobežotu skaitu reižu trīs stundu laikā. Pēc tam jūs atgriezīsities pie GPT 3.5.

OpenAI jums paziņos, tiklīdz būsit sasniedzis limitu, un paziņos, cikos ierobežojums tiks atiestatīts.

Vai arī ChatGPT Plus lietotāji ir ierobežoti?

Diemžēl jā. Ja maksājat 20 ASV dolāru mēnesī, lai piekļūtu GPT-4o, varēsiet nosūtīt līdz 80 ziņojumiem ik pēc trim stundām. Kad sasniegsiet šo robežu, jūs atgriezīsities pie mazāk jaudīga modeļa. Kad būs pagājušas trīs stundas, jūsu ierobežojums tiks atiestatīts.

Kā, izmantojot modeli, piekļūt augstākam ierobežojumam?

Šobrīd šķiet, ka nav iespējas palielināt limitu. Tomēr, ja atrodaties ChatGPT Team darbvietā, jums vajadzētu piekļūt aptuveni divreiz vairāk ziņojumu.

Vai mani neizmantotie ziņojumi tiek pārvietoti?

Nē, viņi to nedara. Ja izmantojat tikai 60 ziņojumus un ir pagājušas 3 stundas, atlikušie 20 ziņojumi netiks pievienoti jūsu atsvaidzinātajam ierobežojumam. Jūs sāksit no 80 ziņojumiem.

Vai GPT-4o ir labāks par Gemini 1.5 Pro?

Uz šo jautājumu ir diezgan grūti atbildēt, taču GPT-4o tam ir daudz iespēju. Lai gan Gemini1.5 pro ir daudz plašāks konteksta logs, šķiet, ka GPT-4o ir daudz labāk izprotams un pamatots. Uzņēmums veica abu modeļu salīdzinājumu, uzdodot abiem modeļiem noteiktus loģikas jautājumus, kā arī lūdzot tos noskaidrot attēlus. Kopumā tika uzdoti astoņi jautājumi. Gemini 1.5 Pro nepārspēja GPT-4o nevienā no jautājumiem.

Tomēr GPT-4o pārspēja Gemini ar sešiem no astoņiem jautājumiem. Attiecībā uz diviem jautājumiem, kurus GPT-4o nepārspēja Gemini, abiem modeļiem bija viens no tiem pareizais un abiem modeļiem bija viens no tiem nepareizi. Tātad, runājot par argumentāciju un problēmu risināšanu, šķiet, ka GPT-4o ir diezgan tālu priekšā Gemini.

GPT-4o turpmāk

Šobrīd mēs joprojām gaidām dažas funkcijas, kas tiks izmantotas jaunajā modelī. Tie ietver dažas balss un redzes funkcijas, tādēļ, ja jūs tās gaidāt, jums būs jābūt pacietīgam.

Izņemot to, mēs sagaidām, ka nākamajos mēnešos tiks ieviesti tipiski uzlabojumi, piemēram, labāks pamatojums, ātrāka apstrāde utt. Mēs neesam pārliecināti, vai tas būs nākamais solis pirms GPT-5. Tomēr tas vēl jāredz.