Vad är prompting?
Innan vi tittar specifikt på hur de olika tjänsterna fungerar, ska vi titta kort på hur prompter fungerar och se om man kan lägga upp dem på olika sätt. Oavsett vilken AI-tjänst du använder, så utgår de alla från gränssnittet Chat-fönster, där du skriver in dina instruktioner till AI:n (Input) och sedan får du tillbaka ett svar av den (Output). Den instruktion som du skriver kallas för en ”prompt”. Att prompta handlar alltså om att formulera instruktioner på ett sätt som får modellen att svara så bra som möjligt.
Till skillnad från ett traditionellt gränssnitt, där du väljer från färdiga alternativ, kräver prompting att du själv formulerar vad du vill ha utfört. Och hur du formulerar dig spelar stor roll.
Här har du två exempel:
Input | Output | |
Exempel 1: | ”Berätta om björnar.” | ”Björnar är stora däggdjur som tillhör familjen Ursidae. De lever i många delar av världen och äter en blandad kost…” |
Exempel 2: | ”Skriv ett nyhetsinslag i radiostil om att en björn har setts i centrala Borlänge.” | ”En björn har under måndagsmorgonen observerats i centrala Borlänge, enligt uppgifter till P4 Dalarna. Polisen uppmanar boende att hålla sig inomhus och inte försöka närma sig djuret …” |
Varför blir resultaten så pass olika? Tänk tillbaka på lektion ett där vi pratade om hur generativ AI fungerar. Det är här de neurala nätverken och transformerteknologin kommer in.
När du skriver in en prompt i en språkmodell aktiveras ett transformerbaserat neuralt nätverk, som behandlar hela din text som en sekvens av tokens. Varje ord du skriver påverkar hur modellen viktar och tolkar helheten, alltså allt du har skrivit hittills i chatten. Prompten fungerar som en form av kontextuell signal som styr vilka delar av det tränade nätverkets ”kunskap” som ska aktiveras. Du kan tänka på det som att du riktar en ficklampa mot en liten del av ett mycket stort rum: prompten avgör vilken del av rummets innehåll som faktiskt blir synligt och därmed används i svaret.
Ett litet tillägg eller en omformulering kan skifta sannolikhetsfördelningen på ett sätt som drastiskt ändrar tonen, innehållet eller stilen på svaret. Det är därför två snarlika instruktioner kan ge mycket olika resultat. Modellen jobbar inte med stabila ”fakta” utan med ett enormt landskap av möjligheter, där din prompt är det som avgör vilket spår den följer.
Om vi ska bryta ner våra tidigare exempel, så skulle det kunna se ut i stil med det här:
Exempel 1: ”Berätta om björnar.”
Detta är en mycket öppen prompt. Den triggar modellen att välja bland en stor mängd möjliga mönster: naturvetenskaplig information, sagor, jaktberättelser, Wikipediaartiklar, barnböcker. Allt beroende på vad som statistiskt sett oftast följer på en sådan formulering i träningsdata. Resultatet blir troligen en generisk faktatext.
Exempel 2: ”Skriv ett nyhetsinslag i radiostil om att en björn har setts i centrala Borlänge.”
Nu har du styrt både format (nyhetsinslag), stil (radiostil), innehåll (en observation av en björn) och geografi (Borlänge). Modellen kommer därför att aktivera mönster som påminner om lokaljournalistik snarare än faktatext.
Vad som har hänt under huven är att du, genom prompten, påverkar vilket semantiskt landskap modellen ”tror” att den befinner sig i. En transformermodell behandlar alltså din inmatning inte som en fråga att besvara utan som början på en sekvens där den ska förutspå vad som rimligen kommer härnäst.
Det är därför du ibland kan få märkliga eller oönskade svar. Om prompten inte ger tillräckligt tydliga signaler om vilket sammanhang som avses så kommer modellen att gissa. Eftersom den är statistisk snarare än logisk gissar den utifrån vad som är mest sannolikt, inte vad som är ”mest rätt”.

Detalj ur Digital Nomads Beyond the Cubicle av Yutong Liu & Digit tagen från Better Images of AI Licens: Creative Commons Erkännande 4.0 Internationell (CC BY 4.0) //Beskuren
Strategier för effektiv prompting
Så hur ska du prompta för att få ut det resultat du vill ha? När allmänheten fick tillgång till generativ AI i slutet av 2022, så fanns det många som talade om så kallad prompt engineering som det väldigt speciella sättet att skriva instruktioner, och att det här var en stor del av hur vår kunskap skulle fungera i framtiden. Låt oss gå igenom lite olika strategier för hur man kan tänka, i grund och botten så finns det två olika metoder som förespråkas.
Strategi 1: Naturlig språkstrategi – “Tänk inte så mycket på det”
Den här strategin går helt enkelt ut på att när du skriver en prompt, så skriver du på samma vis som du skulle pratat med en annan människa. Uttryck dig klart, tydligt men kortfattat.
Principen bakom är att generativ AI, trots allt, är en språkteknologi (Natural Language Processor). Den är byggd för att kunna förstå, plocka isär och tolka språk. Den kommer att förstå dig med största sannolikhet, oavsett hur ospecifikt eller grammatiskt felaktigt du uttrycker dig.
Om du inte får det resultat du vill ha, så fortsätter du helt enkelt med en ny prompt i samma chatt där du förtydligar vilket resultat du vill ha. Du förväntar dig inte ett bra resultat på första försöket. Du prövar dig stegvis fram till ett resultat du är nöjd med. Exempel: ”Gör svaret kortare”, ”Förklara med ett exempel”, ”Använd enklare språk”.
Det här är en ganska bra strategi för dig som är nybörjare, eftersom du egentligen inte behöver tänka speciellt mycket mer än att när du kommunicerar med AI så ska du ungefär göra det som med ett barn på ungefär 10 år. Du måste alltså vara övertydlig med vad du har för förväntningar, för annars så kommer du inte få det som du vill ha gjort.
En varningsgrej här som du måste hålla utkik efter är att om du upptäcker att du har itererat 5–6 gånger och fortfarande inte får det resultat du vill ha, så är det en bra idé att börja en helt ny chatt. Detta eftersom språkmodellen, på grund av transformerteknologin, hela tiden kommer att ta hänsyn till det som du har skrivit fram till den här punkten. Då är alltså risken att de här felaktiga svaren som du fått hittills kommer att “läcka igenom” och påverka alla framtida svar, oavsett hur du ändrar din prompt.
- Fördelar: snabbt, lågt motstånd, lätt för nybörjare
- Nackdelar: svårt att styra resultatet om AI:n tolkar dig fel, tålamodskrävande
Strategi 2: Strukturerad strategi – “Prompt Engineering Pro”
Den här strategin går ut på att du kombinerar olika element i din prompt som försöker aktivera specifika delar i språkmodellens träningsdata. Du kan exempelvis alltid utgå från att du vill ge AI:n en roll i hur den ska agera, vad det är för kontexter, syftet och så vidare.
Här är några exempel på olika element du kan använda för att bygga upp din prompt:
- Roll: ”Du är en expert på klimatfrågor”, “Du är överlevnadsexperten Bear Grylls”
- Kontext: “Jag ska hålla en föreläsning om klimatfrågor för en skolklass”, “Jag sitter fast på en öde ö och svälter, men jag har en bra wifi-täckning”
- Uppgift: ”Förklara skillnaden mellan väder och klimat”, ”Hjälp mig att komma på en strategi hur jag ska överleva på den här öde ön”
- Syfte: ”Det ska förstås av en 12-åring”, ”Förklara det här för någon som inte har varit utanför ett kontorslandskap på tio år”
- Outputformat: ”Skriv svaret som en punktlista med tre fördelar och tre nackdelar”, ”Skriv i punktform med emojis – Jag behöver uppmuntran”
Kombinerar du alla dessa olika element skulle det kunna se ut så här: ”Agera som en erfaren trädgårdsmästare (Roll). Jag är en nybörjare som vill plantera tomater på min balkong i Sverige (Kontext). Skriv en steg-för-steg-guide som är lätt att följa (Uppgift) för någon som aldrig har odlat något förut (Syfte). Skriv guiden i punktform (Outputformat).
- Fördelar: mer kontroll, bättre resultat i komplexa uppgifter, du kan återanvända prompter som du är nöjd med
- Nackdelar: tar längre tid att skriva, inte nybörjarvänligt
Övriga tips och tricks vid prompter
Ge exempel!
Om du är ute efter ett väldigt specifikt resultat så är det en väldigt bra idé att tillhandahålla ett litet exempel. Om du till exempel vill skapa text med en viss stil så kan du klistra in ett stycke text som innehåller den stilen och sedan be språkmodellen att skriva en ny text som ska handla om ett nytt ämne, men behålla stilen från den ursprungliga texten. Eller så kan du ge exempel på i vilket format eller stil du vill ha svaret. Det här fungerar i princip jättebra i alla situationer.
Ge negativa instruktioner!
En instruktion kan ju också innehålla vad du inte är intresserad av. Du kan till exempel be den att undvika vissa ord eller att försöka hålla sig till en viss textmängd. Du kan också be den att undvika vissa ämnen eller inte ge en viss typ av förslag. Det viktiga att tänka på här är ju bara att AI inte kan följa regler. Så även om du ger ett antal negativa instruktioner, så kommer den inte att följa dem till punkt och pricka. Se det snarare som att du skapar en viss ram som styr vilken output du får.
Be om följdfrågor!
En bra idé kan också vara att avsluta din prompt med att instruera språkmodellen att ställa följdfrågor om den är osäker på vad du menar. Då bör du få ett antal förtydligande frågor innan modellen faktiskt genererar den output du efterfrågat.
Be AI skapa prompten åt dig!
Varför sitter du och skriver dina egna prompter när du kan få AI att formulera prompten åt dig? Förklara helt enkelt i chatten vilken typ av uppgift du jobbar med och ungefär vad du har tänkt dig och be sedan AI att formulera en prompt åt dig. Sedan testar du prompten, gärna i flera olika språkmodeller så att du får resultat du kan jämföra.
Ett effektivt användande av det här är ju om du till exempel har sysslat med den första strategin, naturlig språkstrategi, och jobbat dig igenom en riktigt lång chatt. När du till sist kommer fram till det resultat du vill ha kan en sista bra prompt vara att be AI att sammanfatta innehållet i den här chatten och formulera en prompt som skulle ha gett dig det resultat du fick på slutet, men som du kunde ha använt redan i början. Det är att spara tid för nästa gång.
Kort om att generera bilder
I både ChatGPT, Gemini och Copilot kan du generera bilder. ChatGPT och Copilot använder sig av AI-tjänsten DALL-E 2, medan Gemini använder sig av Imagen 4. Att generera bilder och videor och förklara tekniken bakom dem är ett stort ämne som kan förtjäna en helt egen kurs. Men låt oss bara kort gå igenom hur du kan lägga in en effektiv prompt för att skapa en bild som du vill ha.
Oftast går det väldigt bra att bara beskriva bilden så som du vill ha den, med ett naturligt språk. Prova att använda dig av en valfri kombination av nedanstående faktorer:
- Typ av bild (t.ex. porträtt, landskap, abstrakt)
- Färgpalett (t.ex. varma färger, pastellfärger)
- Stämning eller känsla (t.ex. lugn, dramatisk)
- Specifika objekt eller karaktärer (t.ex. en katt, en gammal byggnad)
- Bakgrund (t.ex. stadsmiljö, natur)
- Stil (t.ex. realistisk, cartoon, impressionistisk)
- Perspektiv (t.ex. fågelperspektiv, ögonhöjd)
- Detaljnivå (t.ex. hög detaljrikedom, minimalistisk)
En sammanhängande prompt skulle kunna se ut så här:
”Skapa en landskapsbild med en dramatisk himmel i varma färger, där en gammal byggnad står i förgrunden, omgiven av frodig natur. Stilen ska vara impressionistisk, med hög detaljrikedom och ett perspektiv från ögonhöjd.”
Här kan du se exempel på två bilder som har skapats med denna prompt. Den till vänster är skapad med Imagen 4, och den till höger är skapad med DALL-E 2.
Genom att byta ut några få ord får du ett väldigt annorlunda resultat. I följande exempel har vi justerat prompten till ”Skapa en landskapsbild med en melankolisk himmel i varma färger, där en gammal byggnad står i förgrunden, omgiven av frodig natur. Stilen ska vara gotisk, med hög detaljrikedom och ett perspektiv från ögonhöjd.”