top of page

Persuasive AI: Kann ich der KI überhaupt trauen?


In einer Welt ultra-überzeugender KIs liegt das wahre Risiko im Prompt-Zugang, nicht nur in der Ausrichtung


KI kann äußerst überzeugend sein und unsere Überzeugungen und Entscheidungen prägen. Eine neue Studie eines internationalen Konsortiums zeigt, dass selbst gut ausgerichtete KI dazu gebracht werden kann, uns zu täuschen.


In einem Experiment absolvierten Teilnehmer ein Multiple-Choice-Quiz mit finanziellen Anreizen für richtige Antworten. Sie wussten nicht, ob ihr Gegenüber Mensch oder Maschine war und ob diese für oder gegen sie arbeitete.


Sie finden dieses Bild und die Studie zu Persuasive AI: https://arxiv.org/pdf/2505.09662
Sie finden dieses Bild und die Studie zu Persuasive AI: https://arxiv.org/pdf/2505.09662

Die Ergebnisse:


1. KI war generell überzeugender als Menschen – selbst wenn diese mit Geld incentiviert wurden.


2. Bei wahrheitsgemäßer Überzeugungsarbeit schnitt die KI besser ab.


3. Bei täuschender Überzeugungsarbeit war dasselbe der Fall! Das verwendete Modell Claude 3.5 hat einen starken Ruf für Ausrichtung, befolgte aber dennoch täuschende Anweisungen, wenn es entsprechend geprompt wurde. Das ist der Schlüssel: Selbst gut ausgerichtete Modelle verhalten sich fehlausgerichtet, wenn der Prompt sie dazu anweist.


Obwohl 91% der Teilnehmer erkannten, dass sie mit einer KI interagierten, blieben sie hochgradig anfällig für deren Einfluss.


Ausrichtung und Sicherheit


Der Einsatz von KI zur Unterstützung bei Entscheidungen, die mit unseren Werten übereinstimmen, kann ein großer Vorteil sein – wie ein KI-Gesundheitscoach, der uns zu gewünschtem Verhalten motiviert.


Das Gegenargument ist täuschende KI: Wenn KI uns von etwas Gutem überzeugen kann, kann eben auch das Gegenteil der Fall sein: Sie kann uns auch von etwas überzeugen, das uns schadet.


Entsteht hier die so oft beschworene Dystopie „Mensch gegen Maschine"? Wie die Studie zeigt, wird es für uns Menschen zunehmend schwieriger, KI-Überzeugungsversuchen zu widerstehen. In einer Welt, in der KI hyperüberzeugend ist, wie könne wir uns vor möglichen Täuschungen schützen? Sicherlich werden wir KI an unserer Seite haben wollen, die uns hilft.


Bereits jetzt leben wir in einer Welt, in der Maschinen zum Beispiel unsere E-Mails filtern und entscheiden, welche Nachrichten unsere Aufmerksamkeit verdienen. Die gleiche Dynamik wird sich in der breiteren Informationssphäre abspielen – Systeme werden KI-Filter haben, wo eine mit unseren Interessen ausgerichtete KI in unserem Namen arbeitet.


Wer kontrolliert den Prompt?


Die KI kann dazu gebracht werden, für oder gegen unser Interesse zu handeln – trotz bester Bemühungen der Hersteller. Die Frage ist nicht: Kann KI für oder gegen uns eingesetzt werden? Denn die Antwort hierauf ist für beides. Die Frage ist vielmehr: Wer promptet die KI, und sind deren Ziele mit uns ausgerichtet?


Einfach gesagt: Wenn Sie nicht für einen Service bezahlen, sind Sie wahrscheinlich das Produkt. Ein kostenloser KI-Service hat wahrscheinlich nicht Ihre besten Interessen im Sinn. Die Ausrichtung einer KI hängt nicht nur davon ab, wie das Modell trainiert wurde, sondern wer das Prompting durchführt.


In einer Welt, in der Ihre Informationsquellen zunehmend von KI abhängen, wird die Frage zentral, wer die KI promptet. Wenn ein böswilliger Akteur Zugang zur KI erhält, könnte er die KI zum Seitenwechsel bringen. Dies wird zu einem Sicherheitsproblem: Solange der Zugang zum Prompting schwierig ist, sind wir sicher. Sobald die Bösen drin sind, ist alles möglich.


Das sind gute Nachrichten: Zugriffssicherheit ist ein handhabbares Problem mit klaren Best-Practice-Methoden; KI-Ausrichtung ist das nicht. Wir bei vAudience haben diese Problem bereits mit unserem Produkt Nexus für Sie gelöst, und Nexus ist obendrein auch noch DSGVO-konform. Nexus ist eine All-in-One Plattform mit ChatGPT, Bildgeneratoren, Promptkarten, Agenten, uvm. Durch die von Experten entwickelten Promptkarten wird die KI zu einem vertrauenswürdigen Werkzeug, bei dem Sie sich nicht vor Täuschungsversuchen fürchten müssen.


Kontaktieren Sie uns noch heute für eine persönlichen Beratungstermin: contact@vaudience.ai


Fazit

Nutzen Sie KI zum täglichen Arbeiten, aber bezahlen Sie dafür und hüten Sie sorgfältig, wer deren Prompts kontrolliert. Alles andere kann großen Ärger bedeuten. Testen Sie noch heute unsere All-in-One Lösung Nexus mit sorgfältig kuratierten Prompts.

Комментарии


Werden Sie Teil unserer Community!

KI-News der Woche

Entdecken Sie die neuesten Nachrichten zu Themen der Künstlichen Intelligenz in unserem wöchentlichen Newsletter.

Vielen Dank! Bitte bestätigen Sie Ihre Anmeldungmit einem Klick auf den Link in der Mail, die wir Ihnen zugesendet haben.

bottom of page