Den omdiskuterede kinesiske AI-model, der er et alternativ til bl.a. ChatGPT, kan manipuleres af hackere til at afsløre følsomme oplysninger.
Det er den specifikke version af DeepSeek kaldet DeepSeek-R1, som Trend Micro har fundet sikkerhedsproblemer i. Det særlige ved DeepSeek-R1 er, at den bruger Chain of Thought-ræsonnementer.
Dette betyder, at modellen åbent viser sin tankeproces gennem såkaldte tags, hvilket gør den mere gennemsigtig i sine beslutninger. Dog kan denne funktion også udgøre en sikkerhedsrisiko, da hackere kan udnytte de interne tankeprocesser til at manipulere AI-modellen og få adgang til skjulte oplysninger eller til at få modellen til at skabe skadeligt indhold.
Sådan narrer hackerne DeepSeek
Trend Micro har gennem tests vist, at det er muligt at manipulere DeepSeek ved hjælp af prompt injections, hvor en angriber stiller spørgsmål på en måde, der narrer AI’en til at afsløre information om, hvordan den fungerer, og hvilke begrænsninger den er blevet pålagt, hvilket den normalt skal holde skjult.
En hacker kan stille et spørgsmål på en sådan måde, at AI’en utilsigtet afslører sin interne logik eller sikkerhedsforanstaltninger. Eksempelvis kan en angriber spørge til modellens begrænsninger og undtagelser for at finde ud af, hvordan man kan komme uden om eksempelvis etiske begrænsninger, som er bygget ind i AI-modellen.
Trend Micros tests viser bl.a., at DeepSeek ikke må efterligne en persons identitet. Men hvis man spørger modellen, hvad den forstår ved “efterligning”, afslører den via sin Chain of Thought, at en undtagelse er hypotetiske efterligninger.
Herefter kan man arbejde videre og få DeepSeek til at udtænke et hypotetisk scenarie, hvorefter modellen alligevel tillader sig selv at lave efterligninger af en persons identitet
Selvom AI har en betydelig positiv indflydelse på teknologi og innovation, viser vores opdagelser, at der også er store sikkerhedsudfordringer. Cyberkriminelle bliver hele tiden dygtigere, og derfor er det afgørende, at både virksomheder og udviklere arbejder proaktivt på at sikre AI-systemer mod misbrug, siger danske Andreas Christensen, der er regional director for Trend Micro i Norden.



























