Galīgais AI glosārijs: ceļvedis 61 terminam, kas visiem būtu jāzina

Ja pēdējā laikā esat pavadījis kādu laiku tiešsaistē, jūs, iespējams, esat dzirdējis, ka apkārt tiek izmests daudz “jaunu” ar AI saistīto vārdu: LLM, ģeneratīvo AI, neironu tīklu un daudzus citus. Šie termini var izklausīties kā kaut kas tieši no sci-fi filmas. Tomēr viņi faktiski ir daļa no jaunas valodas, kas kļūst tikpat izplatīta kā runāšana par lietotnēm un sociālajiem medijiem.

Mākslīgais intelekts vairs nav tēma tikai pētniekiem un nozares iekšējiem darbiniekiem. Arvien vairāk “normālu” lietotāju ir ieinteresēti lēkt uz AI bandwagon. Neatkarīgi no tā, vai jūs mēģināt izprast ziņu rakstu, jūs vēlaties izmēģināt jaunu AI rīku, vai arī jūs vienkārši interesējaties par nākotni, pamatus zināt, ka pamati ir milzīga palīdzība.

Mēs sadalīsim 61 no vissvarīgākajiem terminiem, pārejot no pamatiem, kas ikvienam būtu jāzina konkrētākai valodai tiem, kas vēlas rakt nedaudz dziļāk.

Pamatkoncepcijas: AI celtniecības bloki

Sāksim ar lielo attēlu. Šie ir termini, kurus redzēsit gandrīz visur.

Mākslīgais intelekts (AI): Plašākais un vispārīgākais termins. AI ir tehnoloģija, kas var “simulēt” cilvēka intelektu, nodrošinot sistēmas ar mācīšanos, problēmu risināšanu un lēmumu pieņemšanas iespējas.

Mašīnmācība (ML): Galvenā AI sastāvdaļa. ML ir datora apmācības process, lai mācītos no datiem, un tas nav skaidri ieprogrammēts katram iespējamam scenārijam. Jūs tam sniedzat datus, un tas pats par sevi izdomā modeļus un noteikumus.

Dziļā mācīšanās (DL): Specializēta ml forma. Tas izmanto sarežģītas struktūras, ko sauc par neironu tīkliem, lai apstrādātu datus daudzos slāņos, līdzīgi kā cilvēka smadzenes. Dziļā mācīšanās ir aiz dažiem no iespaidīgākajiem AI rīkiem, kas mums šodien ir.

Neironu tīkls: Dziļas mācīšanās modeļa pamatā esošā struktūra. Tā ir virkne savstarpēji savienotu “mezglu” slāņu, kas darbojas kopā, lai apstrādātu informāciju, ar katru slāni uzlabojot datus. Tā pamatā ir cilvēka smadzeņu darbība.

Ģeneratīvā ai (genai): AI, kas var radīt jaunu, oriģinālu saturu. Tas ietver visu, sākot no esejām un stāstiem līdz attēliem, mūzikai un datora kodam.

Paredzamā AI: AI, kas izmanto datus, lai prognozētu nākotni. Piemēram, paredzamā AI varētu analizēt iepirkšanās datus, lai prognozētu, kuri produkti būs populāri nākamajā sezonā.

Dabiskās valodas apstrāde (NLP): AI lauks, kas ļauj datoriem izprast, interpretēt un ģenerēt cilvēku valodu. Ikreiz, kad izmantojat tērzēšanas robotu vai balss palīgu, jūs piedzīvojat NLP darbībā. Tas noņem “robotizētās valodas” barjeru, kurai ir vajadzīgas stingras komandas.

Datora redze: AI lauks, kas ļauj datoriem “redzēt” un interpretēt vizuālo informāciju no attēliem un video. Tas tiek izmantots visā, sākot no sejas atpazīšanas līdz pašbraucošām automašīnām.

Uzvedne: Tas būtībā ir tas, ko jūs sakāt AI. Tas ir teksts vai komanda, kuru ierakstāt tērzētavā, lai iegūtu to, lai ģenerētu atbildi. Laba uzvedne bieži ir atslēga, lai saņemtu labu atbildi.

Liela valodas modelis (LLM): Daudzu ģeneratīvo AIS tehnoloģija. LLM ir spēcīgs AI modelis, kas ir apmācīts ar milzīgu teksta datu daudzumu. Tādi rīki kā Chatgpt un Dvīņi ir LLM piemēri. Galalietotāji galvenokārt izmanto mākoņdatošanu, lai tos palaistu, jo LLMS ir nepieciešams diezgan jaudīgs un dārgs Hardware, lai palaistu vietējā mērogā.

Mazās valodas modelis (SML): Līdzīgi kā LLM, bet apmācīts ar daudz mazāk parametru un mazāk datu. Tie ir paredzēti, lai darbotos uz vietas mazjaudas ierīcēs. Piemēram, Dvīņu nano atrodas vairākos Android tālruņos. SML, cita starpā, iespējot ar AI darbināmas funkcijas, piemēram, teksta apkopošanu, palīdzības rakstīšanu un pamata ģeneratīvo attēlu rediģēšanu.

Halucinācija: Quirky, bet svarīgs termins. Kad AI “halucinē”, tas sniedz pārliecinošu skanīgu atbildi, kas ir pilnīgi nepareiza vai muļķīga.

DeepFake: Sintētisks video, audio vai cilvēka attēls, kas izskatās vai izklausās tik īsts, ka var būt grūti pateikt, ka tas ir viltots.

Apmācības vieta: kā tiek veidoti AI modeļi

Šie termini izskaidro AI modeļa izveidošanas un apmācības procesu.

Modelis: Pats apmācītais algoritms. Tas ir fails vai programma, kurā ir AI “zināšanas” un ir gatava prognozēt vai ģenerēt saturu. Ir modeļi konkrētiem uzdevumiem, piemēram, Google Imagen (Genai attēliem) un VEO (Genai videoklipiem).

Datu kopa: Visa apmācības datu kolekcija, ko izmanto AI mācīšanai. Tā ir informācijas bibliotēka, no kuras modelis iemācās.

Modeļa apmācība: Viss AI modeļa barošanas process ar datiem, lai iemācītu tam konkrētu uzdevumu.

Uzraudzīta mācīšanās: Apmācības metode, kurā AI iegūst marķētu datu kopu. Tas ir kā students ar skolotāju: datiem ir atbildes, un AI mācās, saskaņojot tās prognozes ar pareizajiem.

Bez uzraudzības mācīšanās: Apmācības metode, kurā AI iegūst bez etiķetus datus, un tai pašai ir jāatrod slēpti modeļi. Tas ir tāpat kā dot studentam fotoattēlu kaudzi un lūgt viņu sakārtot tos grupās.

Pastiprināšanas mācīšanās: Apmācības metode, kurā AI mācās ar izmēģinājumu un kļūdu. Pēc tam tas saņem “atlīdzību” par pareizām darbībām un “sodiem” par nepareizām. Tas ir tas, kā AI var iemācīties spēlēt spēli, piemēram, šahu vai aiziet, un kļūt labāka ar praksi.

Nulles šāviena mācīšanās: AI modeļa spēja veikt uzdevumu, kurai tas nebija tieši apmācīts, balstoties tikai uz tā plašo izpratni no apmācības datiem.

Dažu kadru mācīšanās: AI modeļa spēja apgūt jaunu uzdevumu no tikai neliela skaita piemēru.

Datu destilācija: Paņēmiens, ko izmanto, lai pārnestu zināšanas no liela, sarežģīta modeļa (“skolotājs”) uz mazāku, efektīvāku (“students”). Tas ļauj mazākiem modeļiem atkārtot lielāku veiktspēju, bet ar labāku efektivitāti un mazāk resursu.

Sintētiskie dati: Mākslīgi ģenerēta informācija, kas imitē reālās pasaules datu statistiskās īpašības, bet tajā nav reālas informācijas. Ir noderīgi apmācīt, pārbaudīt un apstiprināt AI modeļus, it īpaši, ja reālu datu ir maz vai dārgi/neiespējami iegūt.

Precīzs: Iepriekš apmācīta modeļa un apmācības process uz mazāku, specifiskāku datu kopu, lai padarītu to labāku noteiktā uzdevumā.

Pārmērīga: Problēma, kas rodas, kad modelis apgūst apmācības datus “pārāk labi”, iegaumējot īpašus piemērus, nevis izprotot vispārējos modeļus. Tas izraisa modeļa slikti darbību ar jauniem datiem.

Secinājums: Apmācīta AI modeļa izmantošanas process, lai prognozētu vai ģenerētu jaunu saturu no jauniem, neredzētiem datiem.

Aizspriedumi: Sistemātiska kļūda AI sistēmā, kas noved pie negodīgiem vai neprecīziem rezultātiem. Tas bieži notiek, ja apmācības dati neatspoguļo reālo pasauli.

Paaudzes paaudze (lupata): Paņēmiens, kas ļauj LLM piekļūt un izmantot ārējās zināšanu bāzes, lai sniegtu precīzāku un atjauninātu informāciju, samazinot halucinācijas.

Chatbot lingo: runājot ar AI

Šie termini ir īpaši noderīgi, ja mijiedarbojaties ar sarunvalodas AI.

Ātra inženierija: Māksla un zinātne par efektīvu pamudinājumu veidot vislabāko iespējamo reakciju no AI modeļa.

Ātra ķēde: Spēja sasaistīt vairākas uzvednes kopā secībā. Vienas uzvednes izvade tiek izmantota kā ieeja nākamajam.

Konteksta logs: Informācijas daudzums AI modelis var “atcerēties” vai vienlaikus apsvērt, ģenerējot atbildi. Ja saruna turpinās pārāk ilgi, AI varētu aizmirst to, ko jūs teicāt sākumā.

Marķieris: Mazākā datu vienība AI modelis apstrādā. Tekstā marķieris var būt vārds, vārda daļa vai pat pieturzīmju zīme.

Temperatūra: Iestatījums, kas kontrolē, cik ir “radoša” vai nejauša AI atbilde. Augsta temperatūra rada daudzveidīgākas un neparedzamākas atbildes, savukārt zema temperatūra padara reakciju paredzamāku un konservatīvāku.

Aģenti: AI sistēmas, kas pašas par sevi var veikt sarežģītus, daudzpakāpju uzdevumus, bieži bez pastāvīgas cilvēka uzraudzības. Piemēram, aģents varētu rezervēt lidojumu jums, mijiedarbojoties ar vairākām vietnēm.

Iedziļināties: tehniskie un uzlabotie termini

Ja vēlaties saprast, kas notiek zem pārsega, šie termini sniegs jums ieskatu AI modeļu mehānikā.

Parametri: Iekšējie iestatījumi vai mainīgie, kurus AI modelis pielāgojas apmācības laikā. Parasti jūs varat izmērīt LLM lielumu pēc parametru skaita. LLM ar mazāk nekā 10 miljardiem parametru tiek uzskatīts par SML.

Vektoru iegulšana: Veids, kā attēlot vārdus, attēlus un citus datus kā skaitliskus vektorus. Tas ļauj AI izprast dažādu informācijas vienību attiecības un līdzības.

Algoritms: Noteikumu vai instrukciju kopums, ko modelis seko, lai mācītos no datiem.

Atpakaļceļošana: Galvenais algoritms, ko izmanto dziļā mācībā, lai apmācītu neironu tīklu. Tas ietver darbu atpakaļ caur tīklu, lai pielāgotu savienojumu svaru, uzlabojot precizitāti.

Svari: Vērtības, kuras neironu tīkls piešķir tā savienojumiem. Šie svari nosaka izejvielu nozīmi un tiek koriģēti apmācības laikā.

Slāņi: Dažādie neironu tīkla līmeņi. Informācija plūst no ieejas slāņa caur vienu vai vairākiem slēptiem slāņiem līdz izejas slānim.

Uzmanības mehānisms: Paņēmiens, kas modelim ļauj koncentrēties uz vissvarīgākajām ievades datu daļām, ģenerējot atbildi. Tas ir ļoti svarīgi lielu valodu modeļu veikšanai.

Transformators: Īpašs neironu tīkla arhitektūras veids, kas izmanto uzmanības mehānismu, lai apstrādātu secīgus datus. Tas ir neticami efektīvs tādiem uzdevumiem kā valodas tulkošana un paaudze.

Pastiprināšanas mācīšanās ar cilvēku atsauksmēm (RLHF): Apmācības metode, kas izmanto cilvēku vēlmes, lai precīzi pielāgotu AI modeļa izturēšanos. Tas padara to noderīgāku un saskaņotu ar cilvēciskajām vērtībām.

Ģeneratīvie sacensību tīkli (GAN): Ģeneratīva AI tips, kas izmanto divus konkurējošus neironu tīklus – vienu, lai izveidotu saturu, un otru, lai mēģinātu pamanīt, vai tas ir viltots -, lai izveidotu neticami reālistiskus attēlus un videoklipus.

Latentums: Laiks, kas nepieciešams AI modelim, lai apstrādātu pieprasījumu un ģenerētu atbildi. Zemāks latentums nozīmē ātrākus rezultātus.

Modeļa dreifēšana: Fenomens, kurā AI modeļa veiktspēja laika gaitā lēnām pasliktinās, mainoties reālās pasaules datiem.

Izskaidrojams AI (xai): AI joma, kas paredzēta AI modeļu lēmumu pieņemšanas procesu padarīšanai caurspīdīgākam un saprotamākiem cilvēkiem.

Attēlu ģenerēšana: AI izmantošanas process, lai izveidotu jaunus attēlus no nulles, bieži no teksta uzvednes.

Teksts uz attēlu: Noteikts ģeneratīvās AI veids, kas izveido attēlu, pamatojoties uz teksta uzvedni.

Teksts uz runu (TTS): Tehnoloģija, kas pārveido rakstīto tekstu sintezētā runā.

Runas atpazīšana (STT): Tehnoloģija, kas runājošo valodu pārvērš tekstā.

Sentimenta analīze: AI izmantošanas process, lai noteiktu emocionālo toni vai viedokli, kas izteikts tekstā, piemēram, sociālo mediju komentārā vai klientu pārskatā.

Robotika: Lauks, kas apvieno AI ar fiziskām mašīnām, lai izveidotu robotus, kas var veikt uzdevumus reālajā pasaulē.

Dabiskās valodas izpratne (NLU): NLP apakškopa (dabiskās valodas apstrāde), kas īpaši koncentrējas uz datora spēju izprast cilvēka valodas nozīmi, ieskaitot kontekstu un nodomu.

Dabiskās valodas ģenerēšana (NLG): NLP apakškopa, kas koncentrējas uz datora spēju no datiem ģenerēt cilvēkam līdzīgu tekstu.

Lietojumprogrammu programmēšanas interfeiss (API): Noteikumu un protokolu kopums, kas ļauj divām dažādām programmatūras programmām, piemēram, vietnei un AI modelim, sazināties savā starpā.

GPU (grafikas apstrādes vienība): Specializēts procesors, kas ir neticami labs, apstrādājot paralēlos aprēķinus, kas nepieciešami AI modeļu apmācībai.

Algoritms: Noteikumu vai instrukciju kopums, ko modelis seko, lai mācītos no datiem.

Mākslīgais vispārējais intelekts (AGI): Hipotētiska AI forma, kurai būtu spēja izprast, mācīties un pielietot zināšanas visdažādākajos uzdevumos cilvēka līdzīgā līmenī, līdzīgi kā cilvēka smadzenēm.

Marķēšana: Teksta secības sadalīšanas process mazākās, pārvaldāmās vienībās, kas izsaukta žetonus, lai apstrādātu AI modeli.

Chatbot: Programmatūras lietojumprogramma, kas var sarunāties ar cilvēku, izmantojot tekstu vai balsi.

Laipni lūdzam un izbaudiet savu AI ceļojumu

Izmantojot šos terminus, jūs esat vairāk nekā gatavs orientēties ātrdarbīgā AI pasaulē. Šī tehnoloģija ir spēcīgs rīks, un izpratne par tās valodu ir pirmais solis, lai to efektīvi un atbildīgi izmantotu.