Simovits

Den nya generationen av autonoma bedragare

Den kreativa revolutionen: Hur AI transformerar innehållsskapande

Världen av innehållsskapande har genomgått en transformerande förändring i de senaste året, tack vare den ökande användningen av artificiell intelligens (AI). Genom den teknologiska utvecklingen har maskiner fått möjlighet att inta en mer central roll i den kreativa processen. Vi är mitt i en transformation i hur vi skapar och konsumerar konst och litteratur.

Bildgenerering

Bildgenerering har revolutionerats av AI, särskilt inom text-till-bild-generering. Denna avancerade teknologi gör det möjligt för maskiner att skapa bilder baserat på en beskrivning eller textinput, vilket gör det möjligt för olika applikationer som att skapa visuella hjälpmedel för nyhetsartiklar eller anpassade illustrationer för marknadsföringskampanjer. DalleE-2 [1], Stablediffusion [2] och MidJourney [3] är några av de mest kända tjänsterna eller modellerna i detta område. Men det mest betydelsefulla utvecklingen för detta har varit diffusionskmodeller, som använder en stokastisk diffusionprocess för att generera högkvalitativa och komplexa bilder. Unikt för dessa modeller är att de kan generera bilder som matchar en textinput, vilket tidigare modeller som GAN (Generative Adversarial Networks) inte klarar, vilket är varför dessa nu anses oseleta. Diffusionskmodellerna används för att generera bilder från textinput, en process kallad ”txt2img”. Stable diffusion har dessutom till den unika fördelen att den är open source, vilket gör att den kan laddas ner och köras på en ens egna hårdvara. Detta har gett upphov till ett stort community som bidrar till att förbättra modellen och skapa tillägg. Ett av dessa tillägg är DreamBooth [4], en metod för att modifiera stable diffusion-modellen genom att manipulera parametrar i neural nätverket för att återskapa ett specifikt tema eller subjekt. Andra variationer, som LoRA, LyCORIS, Textual Inversion och Hyper Network, bygger ¨vidare på detta koncept. Dessa verktyg har en stor betydelse för inneåhllet i denna bloggartikel. 

Textgenerering

AI har även gjort betydande framsteg inom området för textgenerering. Maskiner kan idag producera sammanhängande text som efterliknar text skapad av människor. Denna teknologi har potentialen att skapa böcker, artiklar och till och med poesi, även om vissa hävdar att AI-genererad text saknar djup och komplexitet jämfört med mänskligt skrivet innehåll. Trots detta har AI-textgenerering fördelen av att kunna producera mycket innehåll snabbt och effektivt.

En annan område där AI-genererad innehåll gör vågor är chatbots. Dessa datorprogram är designade för att simulera samtal med människor och kan användas för olika ändamål som kundservice, utbildning och underhållning. En av de mest kända chatbottarna är chatGPT [5], men det finns även många andra, och till och med open source modeller [6] som kan användas och anpassas för specifika ändamål, som chatbots för att rollspela samtal med en användardefinerad karaktär.

Ljudgenerering

AI är också på frammarsch inom området för ljudgenerering. Ett exempel är text-to-speech-teknologin, som gör det möjligt för maskiner att omvandla skriven text till tal. det finns till och med AI system som kan generera musik från text. Denna metod använder typiskt liknande principer som bildgenerering, där en textinput omvandlas till en musikaliskt output. 

Autonoma bedragare drivna av AI teknologi

Bedrägerier har utvecklats från personliga kontakter till online-bedrägerier, som involverar elektronisk kommunikation för att lura människor att t.ex. uppge uppgifter av känslig karaktär. Genom användning av den nya generationen av skapande AI-verktyg kommer bedrägerier med stor sannolikhet att ta nästa kliv inom de kommande åren eller månaderna. 

Föreställ er följande: 

  1. Genom att använda Dreambooth-metoden genererar en bedragare fotorealistiska bilder av en verklig person.
  2. En rollspel-chatbot sätts upp för att utge sig att vara personen som bilder genererats av, samt ges en bedrägeri-relaterad uppgift.
  3. Chatbotten, med bilderna skapade, sätts i kontakt medmänniskor som skulle kunna känna personen (t.ex. familj eller kollegor, vilket inte är svårt att hitta).

Även om endast en liten andel av offren faller för detta, kan det göra stor skada. Detta eftersom detta kan sättas upp som en automatiserad process, med autonoma bottar. Därmed kan ett stort antal potentiella offer nås.

Demonstration

Det första steget är bildgenerering processen. Nedan demonstrera jag hur en enda bild av mig kan användas för att skapa trovärdiga falska fotografier av mig, i en helt ny miljö som jag aldrig befunnit mig i. För detta kommer jag att att träna en så kallad “LoRA” [7].

Steg 1: Skapa kopior av bilden med små justeringar (ljusstyrka, färg, crop). Har man tillgång till fler bilder är det bättre, och resultaten kommer att bli ännu mer lika personen som LoRA:n tränas på. 

Steg 2: Använd LoRA DreamBooth-metoden för att träna en LoRA på mitt ansikte.

Steg 3: Hitta lämpligt prompt och fotorealistisk stable diffusion modell för att skapa bilder med denna LoRA. Här använder jag följande prompt:

<Lora:ErikLora2:1>, Award winning photography, selfie, Fujifilm XT3, man, baseball cap, unhappy, outside, sitting at at a cafe, london, coffee shop, short beard, unshaved, looking at viewer, button up shirt, short hair, solo, half shot, upper body, white shirt, (wrinkles:0.5), (blemishes:0.5), (folds:0.5), (moles:0.5), (viens:0.5), (skin pores:0.5), specular lighting, dslr, sharp focus, film grain –n b&w, sepia, cross-eyed, obese, cloned face, out of frame, disfigured, bad anatomy, bad proportions, missing arms, missing legs, extra arms, extra legs, long neck, extra fingers, video game, signature, watermark, username, cropped, blurry, lowres   –w 640   –h 640   –l 7   –s 30

Andra steget är skapandet av en chatbot. Grunden för detta är en LLM (Large Language Model). Nedan ser ni ett exempel på hur enkelt det är att definiera en karaktär, som tillsammans med en LLM ger upphov till ett levande samtal. I detta exempel kommer jag att använda en open source modell som kallas “Alpaca” [7]. Tyvärr är den mindre versionen av denna (7 miljarder parametrar) det bästa som min dator klarar av, och modellen behärskar inte svenska så bra, därför är exemplet på engelska. Att få trovärdigt svenska är dock bara en tids- och/eller hårdvaru-fråga.

Sätt ihop detta och du kan få konversationer som exemplen nedan. Här är “Erik Phisherman” en bot och är helt autonom. “You” spelas av en människa här. Som ni kan se är botten kapabel att anpassa sig till en rad olika omständigheter, och improviserar fram svar som passar till vad människan skriver.

Offret är medgörligt

Offret är skeptisk

Offret är pratglatt

Hur skyddar man sig?

Då AI-teknologin fortsätter att utvecklas är det viktigt att vara vaksam och skydda sig från potentiella bedrägerier- Det allra viktigaste är kunskap om vad en chatbot klarar av idag, och att denna kunskap sprids till alla tänkbara mål. Här är några tips att ha i åtanke:

  1. Var försiktig när du tar emot oombedda meddelanden eller vänförfrågningar från personer du inte känner.
  2. Verifiera identiteten på alla du kommunicerar med online, särskilt om de ber om känslig information eller tjänster. Detta kan göras via alternativa kommunikationsvägar, eller genom extremt specifika frågor som en chatbot omöjligen kan svara korrekt på. på

Referenser