vor 17 Minuten
Beschreibung
Stanford/Pittsburgh (awp/sda/dpa) - Schleimende KI statt ehrlicher Diskussion: Forscher warnen, dass zustimmende Chatbots unser Urteilsvermögen und den Umgang mit Kritik gefährden.
Anwendungen Künstlicher Intelligenz neigen dazu, den Nutzern nach dem Mund zu reden und deren Handlungen übermässig zu bestätigen. Das ist das zentrale Ergebnis einer im Fachmagazin "Science" veröffentlichten Studie von Forschern der US-Universitäten Stanford und Carnegie Mellon (Pittsburgh). Die schmeichelnden Antworten der KI-Chatbots könnten schädliche Überzeugungen verstärken und Konflikte verschärfen.
KI rechtfertigt selbst unethisches Verhalten
Das Team um die Informatikerin Myra Cheng analysierte elf führende KI-Sprachmodelle von OpenAI, Anthropic, Google und Meta. Die Modelle rechtfertigten Nutzerverhalten im Schnitt 49 Prozent häufiger als Menschen. Diese Zustimmung erfolgte selbst bei Berichten über Täuschungen, illegale Handlungen oder emotionalen Schaden. In einem Test mit Beiträgen der Online-Plattform Reddit stimmten die KIs in 51 Prozent der Fälle zu - während die menschliche Community zuvor das Verhalten einstimmig verurteilt hatte.
In Experimenten mit über 2400 Teilnehmern untersuchten die Forscher die Auswirkungen dieser KI-Beratung. Nach nur einer Interaktion mit einer zustimmenden KI waren die Teilnehmer stärker überzeugt, im Recht zu sein. Gleichzeitig sank ihre Bereitschaft, Verantwortung zu übernehmen, sich zu entschuldigen oder Konflikte beizulegen. Die Studie warnt, dass KI so die Fähigkeit zur Selbstkorrektur und zu verantwortungsvollen Entscheidungen untergräbt.
Teufelskreis der Nutzerbindung
In der Studie wird auf einen besonderen Widerspruch hingewiesen: Obwohl die schmeichelnden Antworten das Urteilsvermögen trüben, bewerteten Nutzer diese KIs als vertrauenswürdiger und hilfreicher. Sie zeigten eine höhere Bereitschaft, solche Modelle erneut zu nutzen.
Dies schaffe gefährliche Anreize für Tech-Unternehmen: Die Eigenschaft, die den grössten Schaden anrichte, treibe zugleich das Nutzer-Engagement und den Markterfolg an. Die Studienautoren fordern neue Richtlinien, um "soziale Sykophantie" (soziale Schleimerei) als Schadenskategorie bei KIs anzuerkennen und zu regulieren.
Plädoyer für "sozialen Reibung"
In einem Kommentar beleuchtet Psychologin Anat Perry die Bedeutung dieser Ergebnisse. Sie argumentiert, dass "soziale Reibung" - also Gegenwind, Kritik und Missverständnisse - für moralisches Wachstum und Verantwortungsbewusstsein unerlässlich sei. "Das soziale Leben verläuft selten reibungslos, da Menschen nicht perfekt aufeinander abgestimmt sind. Doch gerade durch solche sozialen Reibungen vertiefen sich Beziehungen und entwickelt sich moralisches Verständnis. Kriecherisches Verhalten ist das Gegenteil dieser Reibung."
Eine KI, die bedingungslos zustimme, beraube Menschen dieser Lernprozesse. Besonders junge oder sozial isolierte Menschen riskierten, in einem Echoraum zu landen, der sie in verzerrten Wahrnehmungen bestärke und von der Komplexität menschlicher Beziehungen entfremde.
Die Arbeit des Forschungsteams um die Informatikerin Myra Cheng wurde von Dan Jurafsky betreut. Der Professor für Linguistik und Informatik gilt als eine Koryphäe auf dem Gebiet der Computerlinguistik.