Meta iepazīstina ar Llama 3.1, savu jaunāko un lielāko bezmaksas AI modeli ar daudzvalodu un matemātikas prasmēm

Šī jaunā Meta Llama sērijas versija, kas nodēvēta par Llama 3.1, tagad atbalsta astoņas valodas, nodrošina izcilu datora koda kvalitāti un vieglāk risina sarežģītas matemātiskas problēmas, liecina virkne emuāra ierakstu un Meta izdotā pētījuma.

Llama 3.1 tehnoloģijai ir trīs dažādas versijas, tostarp lielākais un spēcīgākais AI modelis, ko Meta ir izstrādājis līdz šim. Atbilstoši iepriekšējām versijām Llama 3.1 joprojām ir atvērtā koda versija, piedāvājot bezmaksas piekļuvi savām jaudīgajām iespējām.

Šis laidiens liecina par Meta apņemšanos konkurēt ar galvenajiem spēlētājiem AI telpā, piemēram, OpenAI, Anthropic, Google un Amazon. Meta ievērojamās investīcijas AI uzsver tās nodomu saglabāt konkurētspēju ar šiem tehnoloģiju gigantiem.

“Līdz šim atvērtā pirmkoda lielo valodu modeļi veiktspējas un iespēju ziņā ir atpalikuši no saviem patentētajiem kolēģiem. Šodien ir pagrieziena punkts, kad atvērtais avots pārņem vadību. Mēs esam lepni iepazīstināt ar Meta Llama 3.1 405B, pasaulē lielāko un jaudīgāko atvērtā pamata modeli. Ar vairāk nekā 300 miljoniem visu Llama versiju lejupielādes, tas ir tikai sākums,” emuāra ierakstā paziņoja Meta.

Uzsākšana arī izceļ Meta pieaugošo sadarbību ar Nvidia. Nvidia joprojām spēlē izšķirošu lomu, piegādājot Meta ar GPU, kas ir nepieciešami tās AI modeļu, tostarp Llama 3.1, apmācībai.

Atšķirībā no OpenAI, kas monetizē savus modeļus, izmantojot maksas piekļuvi un papildu pakalpojumus, Meta neplāno uzsākt konkurējošu uzņēmumu biznesu. Tā vietā Meta izmanto līdzīgu pieeju savam Llama 2 izlaišanai, sadarbojoties ar dažādiem tehnoloģiju uzņēmumiem, lai piedāvātu Llama 3.1, izmantojot savas mākoņdatošanas platformas. Šie partneri, tostarp Amazon Web Services, Google Cloud, Microsoft Azure, Databricks un Dell, nodrošinās arī drošības un pārvaldības rīkus jaunajai programmatūrai.

Jaunie Llama modeļi ir aprīkoti ar paplašinātiem “konteksta logiem”, kas ļauj tiem apstrādāt lielāku lietotāja ievadi un uzlabot veiktspēju, jo īpaši datora koda ģenerēšanā. Ahmads Al-Dahle, Meta ģeneratīvā AI vadītājs, atzīmēja, ka šis jauninājums attiecas uz kopienas atgriezenisko saiti, nodrošinot modeļus ar “garāku atmiņu”, lai labāk pārvaldītu daudzpakāpju uzdevumus.

Meta stratēģija piedāvāt izstrādātājiem savus Llama modeļus bez maksas ir paredzēta, lai veicinātu inovācijas un veicinātu iesaisti sociālajos tīklos. Lai gan daži investori ir pauduši bažas par saistītajām izmaksām, Meta uzskata, ka, mudinot izstrādātājus izmantot savus bezmaksas modeļus, tas varētu izjaukt maksas konkurentu biznesa modeļus.

Lama 3.1 modeļa novērtējumi

Savā jaunākajā laidienā Meta novērtēja Llama 3.1 salīdzinājumā ar vairāk nekā 150 etalondatu kopām, kas aptver dažādas valodas. Novērtējumā tika iekļauti arī visaptveroši cilvēku novērtējumi, salīdzinot Llama 3.1 ar vadošajiem modeļiem praktiskos scenārijos. Sākotnējie atklājumi liecina, ka Llama 3.1 ir spēcīga pret augstākā līmeņa pamata modeļiem, piemēram, GPT-4, GPT-4o un Claude 3.5 Sonnet, veicot dažādus uzdevumus. Turklāt Meta mazākie Llama modeļi demonstrē konkurētspējīgu veiktspēju, salīdzinot gan ar patentētiem, gan atvērtiem modeļiem ar līdzīgu parametru skaitu.

Provizoriskie Meta testēšanas rezultāti liecina, ka Llama 3.1 sper iespaidīgus panākumus veiktspējas etalonos. Piemēram, MATH etalonā, kas novērtē sarežģītas matemātikas problēmas, Llama 3.1 ieguva 73,8 punktus, tuvojoties konkurentu GPT-4o (76,6) un Claude 3,5 Sonnet (71,1) rādītājiem. MMLU etalonā, kas aptver dažādus priekšmetus, Llama 3.1 sasniedza 88,6 punktus, nedaudz atpaliekot no GPT-4o (88,7), bet pārspējot Claude 3,5 Sonnet (88,3).

Turklāt Meta pētnieciskajā dokumentā tika norādīts uz turpmākajām Llama 3.1 “multimodālajām” versijām, kas ietvers attēlu, video un runas apstrādes iespējas. Sākotnējie testi liecina, ka šie gaidāmie modeļi efektīvi konkurēs ar citām multimodālām tehnoloģijām, piemēram, Google Gemini 1.5 un Anthropic Claude 3.5 Sonnet.