SprayPassagen

Skapa bilder med AI: Midjourney och DALL·E för nybörjare

Så fungerar AI-bildgenerering. Vi förklarar skillnaden mellan Midjourney och DALL·E och hur du skriver prompts som ger snygga resultat.

Elin Haglund
Elin Haglund
Generativt färgmoln som tar form till en bild, gradient från violett till cyan

För några år sedan krävde en proffsig illustration en designer och flera timmar. I dag räcker en mening. AI-bildgenerering har gått från experiment till verktyg som vem som helst kan använda — men det finns knep för att gå från “kul” till “riktigt bra”.

Hur fungerar det egentligen?

Du beskriver en bild i text — en prompt — och AI:n skapar en helt ny bild utifrån beskrivningen. Modellen har tränats på enorma mängder bilder och lärt sig sambandet mellan ord och visuellt innehåll. Den kopierar alltså inte en befintlig bild, utan genererar något nytt varje gång.

Midjourney eller DALL·E?

De två mest kända verktygen passar lite olika behov.

Midjourney ger ofta de mest visuellt slående resultaten — konstnärligt, atmosfäriskt och detaljrikt. Det är förstavalet för den som vill ha snygga, stiliserade bilder och är beredd att lära sig verktygets egna kommandon.

DALL·E är inbyggt i ChatGPT, vilket gör det extremt lätt att komma igång: du beskriver bilden i samma chatt som du annars skriver i. Den är också bra på att följa specifika instruktioner, som “lägg till en blå skylt längst till höger”.

För nybörjare är DALL·E oftast den mjukaste starten. Vill du ta bilderna till nästa nivå är Midjourney värt att lära sig.

Skriv en prompt som ger resultat

En bra bildprompt har fyra delar:

  1. Motiv — vad ska föreställas? “En räv som sover.”
  2. Stil — “akvarell”, “fotorealistisk”, “minimalistisk illustration”.
  3. Stämning och ljus — “mjukt morgonljus”, “dramatisk skugga”.
  4. Detaljer — färgpalett, kameravinkel, bakgrund.

Exempel:

“En sovande räv hopkrupen i höstlöv, mjuk akvarellstil, varmt morgonljus, ljust beige bakgrund, mycket detalj.”

Ju mer specifik du är, desto mer kontroll får du. Men experimentera också — ibland blir de oväntade resultaten bäst.

Vanliga fallgropar

  • För vaga prompts. “En fin bild” ger AI:n inget att jobba med.
  • För många motstridiga önskemål. Tio adjektiv i en mening drar åt olika håll.
  • Att glömma granska detaljer. Händer, text och symmetri är fortfarande AI:ns svaga punkter.

AI-bilder ersätter inte en skicklig illustratör för allt, men för idéskisser, sociala medier och snabba visualiseringar är de en passage rakt in i något som tidigare var stängt för de flesta.