Ātra inženierija: galīgais ceļvedis ChatGPT un citu valodu modeļu jaudas atraisīšanai

ChatGPT ir izraisījis radošu revolūciju mākslīgajā intelektā (AI), kas ir patiesi revolucionārs. Tikai gada laikā šis valodas modelis ir pārsteidzis ekspertus ar savām rakstīšanas spējām, prasmīgu sarežģītu uzdevumu apstrādi un pārsteidzoši lietotājam draudzīgu saskarni. Tomēr zem virsmas ir vairāk. ChatGPT ir izraisījis radošuma uzplaukumu, ļaujot cilvēkiem izveidot saturu, kas kādreiz tika uzskatīts par neiedomājamu.

Iespējas ar ChatGPT un līdzīgiem valodu modeļiem (LM) ir praktiski neierobežotas. Galvenais ir viens būtisks faktors: ideāla ievades instrukciju kopuma izveide, ko sauc par uzvednēm, kas atraisa to patieso potenciālu plašā uzdevumu spektrā. Uztveriet to kā slepeno valodu, kas pieskaras AI iekšējam spožumam, virzot to darīt brīnumus ar vārdiem. Šī izstrādes ideja mudina iegūt optimālus rezultātus, noveda pie jaunas jomas, kas pazīstama kā Prompt Engineering.

Kas ir tūlītēja inženierija?

Ātrā inženierija ir prasmīga ievades (pazīstamas kā uzvednes) izstrāde vai izstrāde tādiem ģeneratīviem AI valodu modeļiem kā GPT-3, GPT-4 un līdzīgiem lieliem valodu modeļiem, lai iegūtu optimālus rezultātus.

Varat to uzskatīt par ideālu MI veiksmes recepti. Jūs sniedzat sastāvdaļas (uzvedne), un AI pagatavo ēdienu (ģenerē izvadi). Mērķis ir rūpīgi veidot uzvednes, lai sasniegtu labākos iespējamos rezultātus, izmantojot šos sarežģītos valodu modeļus.

Līdzīgi kā mēs pilnveidojamies praksē, tūlītēja izstrāde ir eksperimentēšana ar uzvedņu formulējumu, struktūru un formātu. Šī pielāgošana ietekmē modeļa uzvedību un palīdz radīt konkrētas un kontekstuāli atbilstošas ​​atbildes.

Lai gan mākslīgais intelekts pastāv kopš 1950. gadu beigām un 1960. gadu sākuma, operatīvā inženierija ir salīdzinoši nesena un attīstās. Lai izprastu lielo valodu modeļu (LLM) stiprās puses un ierobežojumus, ir ļoti svarīgi apgūt tūlītējas inženierijas prasmes.

Ātra inženierija izrādās īpaši vērtīga lietojumprogrammās, kurās nepieciešama modeļa uzvedības precizēšana vai pielāgošana. Lietotāji var eksperimentēt un uzlabot uzvednes, pamatojoties uz modeļa atbildēm, lai sasniegtu vēlamos rezultātus. Uzvedņu efektivitāte atšķiras atkarībā no konkrētā izmantotā modeļa. Pētnieki un praktiķi bieži iesaistās izmēģinājumos un kļūdās un eksperimentos, lai noteiktu optimālos norādījumus dažādiem uzdevumiem vai lietojumprogrammām.

Izpratne par tūlītēju inženieriju:

Iedomājieties ChatGPT kā spēcīgu dzinēju, kas gaida pareizo degvielas un virziena kombināciju, lai darbotos ar maksimālo efektivitāti. Šajā analoģijā uzvedne darbojas gan kā degviela, gan kā kompass, nodrošinot ChatGPT nepieciešamos norādījumus uzdevuma izpildei. Neatkarīgi no tā, vai tas ir vienkāršs jautājums, radoši ierāmēts uzvedne vai daudzpusīgs vadlīniju kopums, uzvedne nosaka pamatu AI veiktspējai.

Piemēram, pētnieki izmanto tūlītēju inženieriju, lai uzlabotu LLM iespējas dažādos izplatītos un sarežģītos uzdevumos, piemēram, atbildēs uz jautājumiem un aritmētiskā spriešana. Izstrādātāji izmanto tūlītēju inženieriju, lai izveidotu stabilas un efektīvas metodes mijiedarbībai ar LLM un citiem rīkiem.

Tomēr tūlītēja inženierija neaprobežojas tikai ar uzvedņu izveidi. Tas ietver daudzveidīgu prasmju un paņēmienu kopumu, kas noder mijiedarbībai ar LLM un to attīstīšanai. Tā ir būtiska prasme, lai izveidotu saskarni, veidotu un izprastu LLM iespējas. Savlaicīga inženierija var palīdzēt uzlabot LLM drošību un ieviest jaunas iespējas, piemēram, paplašināt LLM ar domēna zināšanām un ārējiem rīkiem.

Kā atvieglot tūlītēju inženieriju:

  1. Specifiskums: Jūsu uzvednes precizitāte tieši korelē ar AI reakcijas specifiku. Frāzējuma pielāgošana, konteksta iekļaušana un piemēru piedāvāšana kalpo kā navigācijas rīki, kas virza ChatGPT uz mērķtiecīgāku un pielāgotāku rezultātu.
  2. Kontrole: Uzvednes izveide ļauj ietekmēt AI ģenerētā satura stilu, toni un formātu. Neatkarīgi no tā, vai meklējat poētisku gabalu vai faktu kopsavilkumu, uzvedne kalpo kā norādījums, veidojot rezultātu atbilstoši jūsu vēlmēm.
  3. Radošums: Ātra inženierija atbloķē ChatGPT spēju ģenerēt dažādus radošus formātus, kas aptver dzejoļus, kodu, skriptus, mūzikas skaņdarbus, e-pastus un vēstules. Jo niansētāka un detalizētāka uzvedne, jo radošāka un daudzveidīgāka ir AI izvade.
  4. Efektivitāte: Ieguldot laiku savas uzvednes pilnveidošanā, jūs varat ietaupīt ievērojamas pūles un laiku, salīdzinot ar dažādu metožu atkārtotu eksperimentēšanu. Labi izstrādāta uzvedne racionalizē AI izpratni, tādējādi nodrošinot efektīvākas un precīzākas atbildes.

Ilustratīvi piemēri:

  • Vienkārša uzvedne: “Uzrakstiet dzejoli par robotu, kurš iemīlas cilvēkā.”
  • Īpaša uzvedne: “Saceriet sonetu jambiskā pentametrā, izpētot vientulības un izolācijas tēmas futūristiskā kiberpanka vidē.”
  • Pamācību uzvedne: “Ģenerējiet skriptu īsai komēdijai starp diviem biroja darbiniekiem, koncentrējoties uz korporatīvā žargona absurdumu.”

Ātras inženierijas priekšrocības:

  • Atbloķēt pilnu potenciālu: Novirziet ChatGPT, lai sasniegtu jūsu konkrētos mērķus, nevis paļauties uz tā interpretāciju.
  • Palieliniet produktivitāti: Ietaupiet laiku un pūles, jau no paša sākuma formulējot precīzi definētu uzvedni.
  • Uzlabojiet radošumu: Ātra inženierija atvieglo oriģināla un unikāla satura izveidi dažādos formātos.
  • Uzlabojiet komunikāciju: Lai sasniegtu vēlamos rezultātus, efektīvāk mijiedarbojieties ar ChatGPT.

Darba sākšana ar tūlītēju inženieriju:

  • Izpētiet piemērus un apmācības: Iepazīstieties ar veiksmīgām tūlītējām stratēģijām tiešsaistē.
  • Eksperiments: Izmēģiniet dažādas uzvednes, lai uzzinātu, kas dod vislabākos rezultātus.
  • Apgūstiet radošumu: Nevairieties savos pamudinājumos iepludināt radošumu.

Būtībā tūlītējas inženierijas mākslas apgūšana dod lietotājiem iespēju atraisīt ChatGPT potenciālu, pārveidojot to par vērtīgu rīku dažādu uzdevumu veikšanai — no radošas rakstīšanas un informācijas vākšanas līdz vienkārši aizraujošas mijiedarbības ar AI baudīšanai.

Lai ienirt tūlītējas inženierijas pasaulē, OpenAI ir izlaidusi ceļvežu kopu, kas piedāvā stratēģijas un taktikas, lai uzlabotu lielu valodu modeļu, tostarp GPT-4, veiktspēju. OpenAI Prompt Engineering Guide piedāvā metodes, kuras dažreiz var apvienot, lai iegūtu vēl iedarbīgāku rezultātu, un OpenAI mudina lietotājus eksperimentēt un atklāt viņiem vispiemērotākās pieejas.

Ir vērts atzīmēt, ka daži no OpenAI Prompt Engineering Guide piemēriem pašlaik darbojas tikai ar tā vismodernāko modeli GPT-4. Parasti, ja rodas situācija, kad modelis nepilda uzdevumu, OpenAI iesaka izmēģināt sarežģītāku modeli.

Ātras inženieru stratēģijas un taktikas

Tālāk ir norādītas sešas OpenAI ieteiktās stratēģijas, lai ar uzvednēm iegūtu labākus rezultātus.

Sešas stratēģijas labāku rezultātu iegūšanai

Uzrakstiet skaidrus norādījumus

Šie modeļi nevar lasīt jūsu domas. Ja izvadi ir pārāk gari, lūdziet īsas atbildes. Ja rezultāti ir pārāk vienkārši, lūdziet eksperta līmeņa rakstīšanu. Ja jums nepatīk formāts, parādiet formātu, kuru vēlaties redzēt. Jo mazāk modelim ir jāuzmin, ko vēlaties, jo lielāka iespēja, ka jūs to iegūsit.

Taktika:

Sniedziet atsauces tekstu

Valodu modeļi var droši izdomāt viltotas atbildes, it īpaši, ja tiek jautāts par ezotēriskām tēmām vai citātiem un URL. Tāpat kā piezīmju lapa var palīdzēt skolēnam labāk veikt testu, atsauces teksts šiem modeļiem var palīdzēt atbildēt ar mazāku izdomājumu skaitu.

Taktika:

Sadaliet sarežģītus uzdevumus vienkāršākos apakšuzdevumos

Tāpat kā programmatūras inženierijā ir laba prakse sarežģītas sistēmas sadalīšana moduļu komponentu komplektā, tas pats attiecas uz uzdevumiem, kas iesniegti valodas modelim. Sarežģītiem uzdevumiem parasti ir augstāks kļūdu līmenis nekā vienkāršākiem uzdevumiem. Turklāt sarežģītus uzdevumus bieži var no jauna definēt kā vienkāršāku uzdevumu darbplūsmu, kurā iepriekšējo uzdevumu izvadi tiek izmantoti, lai izveidotu ievadi vēlākiem uzdevumiem.

Taktika:

Dodiet modelim laiku “padomāt”

Ja jums tiek prasīts reizināt 17 ar 28, jūs, iespējams, to neuzzināsit uzreiz, bet tomēr ar laiku varat to noskaidrot. Tāpat modeļi pieļauj vairāk argumentācijas kļūdu, mēģinot atbildēt uzreiz, nevis veltot laiku atbildes izstrādei. Ja pirms atbildes sniegšanas tiek jautāts par “domu ķēdi”, modelis var uzticamāk pamatot savu ceļu uz pareizām atbildēm.

Taktika:

Izmantojiet ārējos rīkus

Kompensējiet modeļa vājās vietas, ievadot to ar citu rīku izvadi. Piemēram, teksta izguves sistēma (dažkārt saukta par RAG vai izguves paplašināto paaudzi) var informēt modeli par attiecīgajiem dokumentiem. Koda izpildes programma, piemēram, OpenAI Code Interpreter, var palīdzēt modelim veikt matemātiku un palaist kodu. Ja uzdevumu var veikt uzticamāk vai efektīvāk, izmantojot rīku, nevis valodas modeli, izlādējiet to, lai iegūtu labāko no abiem.

Taktika:

Sistemātiski pārbaudiet izmaiņas

Veiktspējas uzlabošana ir vienkāršāka, ja varat to izmērīt. Dažos gadījumos uzvednes modificēšana sasniegs labāku veiktspēju dažos izolētos piemēros, bet pasliktinās vispārējo veiktspēju reprezentatīvākai piemēru kopai. Tāpēc, lai pārliecinātos, ka veiktspējas izmaiņas ir pozitīvas, var būt nepieciešams definēt visaptverošu testu komplektu (pazīstams arī kā “eval”).

Taktika:

Taktika

Katru no iepriekš uzskaitītajām stratēģijām var realizēt ar noteiktu taktiku. Šīs taktikas ir paredzētas, lai sniegtu idejas, ko izmēģināt. Tie nekādā gadījumā nav pilnībā visaptveroši, un jums vajadzētu justies brīvi izmēģināt radošas idejas, kas šeit nav pārstāvētas.

Stratēģija: uzrakstiet skaidrus norādījumus

Taktika: iekļaujiet vaicājumā detalizētu informāciju, lai iegūtu atbilstošākas atbildes

Lai saņemtu ļoti atbilstošu atbildi, pārliecinieties, vai pieprasījumos ir norādīta svarīga informācija vai konteksts. Pretējā gadījumā jūs atstājat modeli, lai uzminētu, ko jūs domājat.

Sliktāk Labāk
Kā programmā Excel pievienot skaitļus? Kā programmā Excel saskaitīt dolāru summu rindu? Es vēlos to izdarīt automātiski visai rindu lapai, un visas kopsummas nonāk labajā pusē kolonnā ar nosaukumu “Kopā”.
Kurš ir prezidents? Kas bija Meksikas prezidents 2021. gadā, un cik bieži tiek rīkotas vēlēšanas?
Uzrakstiet kodu, lai aprēķinātu Fibonači secību. Uzrakstiet TypeScript funkciju, lai efektīvi aprēķinātu Fibonači secību. Brīvi komentējiet kodu, lai paskaidrotu, ko katrs gabals dara un kāpēc tas ir rakstīts šādā veidā.
Apkopojiet sanāksmes piezīmes. Apkopojiet sanāksmes piezīmes vienā rindkopā. Pēc tam uzrakstiet runātāju sarakstu un katru viņu galveno punktu. Visbeidzot, uzskaitiet runātāju ieteiktās nākamās darbības vai darbības vienumus, ja tādi ir.

Ātrie inženierijas piemēri:

Taktika: palūdziet modelim pieņemt personību

TSistēmas ziņojumu var izmantot, lai norādītu personu, kuru modelis izmanto savās atbildēs.

SISTĒMA: Kad es lūgšu palīdzību kaut ko uzrakstīt, jūs atbildēsit ar dokumentu, kurā katrā rindkopā ir vismaz viens joks vai draisks komentārs.

LIETOTĀJS: Uzrakstiet pateicības vēstuli manam tērauda skrūvju pārdevējam par piegādes piegādi laikā un īsā laikā. Tas ļāva mums piegādāt svarīgu pasūtījumu.

Atvērts rotaļu laukumā

Taktika: izmantojiet norobežotājus, lai skaidri norādītu atsevišķas ievades daļas

Atdalītāji, piemēram, trīskāršās pēdiņas, XML atzīmes, sadaļu nosaukumi utt., var palīdzēt norobežot teksta sadaļas, kas jāapstrādā atšķirīgi.

LIETOTĀJS: Apkopojiet tekstu, ko norobežo trīskārši pēdiņas, ar haiku. “””ievietot tekstu šeit”””

Atvērts rotaļu laukumā

Pārējos tūlītējos inženierijas piemērus varat izlasīt vietnē OpenAI.com

Tālāk ir sniegta tūlītēja Anu Kubo inženierijas apmācība par to, kā iegūt ChatGPT un lielo valodu modeļus (LLM), lai sniegtu jums perfektas atbildes.