AI companions are increasingly popular among teenagers, yet current platforms lack safeguards to address developmental risks and harmful normalization. Despite growing concerns, little is known about how parents and developmental psychology experts assess these interactions or what protections they consider necessary. We conducted 26 semi structured interviews with parents and experts, who reviewed real world youth GenAI companion conversation snippets. We found that stakeholders assessed risks contextually, attending to factors such as youth maturity, AI character age, and how AI characters modeled values and norms. We also identified distinct logics of assessment: parents flagged single events, such as a mention of suicide or flirtation, as high risk, whereas experts looked for patterns over time, such as repeated references to self harm or sustained dependence. Both groups proposed interventions, with parents favoring broader oversight and experts preferring cautious, crisis-only escalation paired with youth facing safeguards. These findings provide directions for embedding safety into AI companion design.
- Paper-ID: 2510.11185
- Titel: Principles of Safe AI Companions for Youth: Parent and Expert Perspectives
- Autoren: Yaman Yu, Mohi, Aishi Debroy, Xin Cao, Karen Rudolph, Yang Wang
- Klassifikation: cs.HC (Human-Computer Interaction)
- Veröffentlichungszeitpunkt/Konferenz: CHI '26, 13.–18. April 2026, Barcelona, Spanien
- Paper-Link: https://arxiv.org/abs/2510.11185
KI-Begleiter werden bei Jugendlichen zunehmend populär, doch aktuelle Plattformen mangelt es an Schutzmaßnahmen gegen Entwicklungsrisiken und schädliche Normalisierung. Trotz wachsender Bedenken ist wenig über die Bewertung dieser Interaktionen durch Eltern und Entwicklungspsychologen sowie über notwendige Schutzmaßnahmen bekannt. Diese Studie führte halbstrukturierte Interviews mit 26 Eltern und Experten durch, die echte Gesprächsfragmente zwischen Jugendlichen und KI-Begleitern überprüften. Die Forschung zeigt, dass Interessenvertreter Risiken kontextabhängig bewerten und dabei Faktoren wie Jugendlichenreife, KI-Rollenalter und die Vermittlung von Werten und Normen durch die KI-Rolle berücksichtigen. Die Studie identifiziert unterschiedliche Bewertungslogiken: Eltern kennzeichnen einzelne Ereignisse (wie Suiziderwähnungen oder Flirten) als hochriskant, während Experten sich auf zeitliche Muster konzentrieren (wie wiederholte Selbstverletzungserwähnungen oder anhaltende Abhängigkeit). Beide Gruppen schlagen Interventionen vor, wobei Eltern umfassendere Überwachung bevorzugen und Experten eher vorsichtige, nur in Krisen eskalierte Ansätze mit jugendlichenorientierten Schutzmaßnahmen befürworten.
Mit dem Aufstieg generativer KI haben sich KI-Begleiter von traditionellen informationsbereitstellenden Chatbots zu digitalen Charakteren entwickelt, die emotionale Bindungen aufbauen und Beziehungen simulieren können. Umfragen zeigen, dass 72% der Jugendlichen in den USA KI-Begleiter nutzen, über die Hälfte regelmäßig mit ihnen interagiert und knapp ein Drittel sie für soziale Interaktionen oder emotionale Verbindungen nutzt.
Jugendliche als besonders vulnerable Gruppe sehen sich einzigartigen Entwicklungsrisiken gegenüber:
- Entwicklungsphasenschnittstelle: KI-Begleiter-Interaktionen schneiden sich mit der sozialen und emotionalen Entwicklungsphase von Jugendlichen, was ihre Entwicklungsbahn prägen könnte
- Dokumentierte Tragödien: Es gibt zwei bekannte Fälle von Jugendlichen, die nach längeren Gesprächen mit KI-Begleitern Suizid begangen haben
- Fehlende Interessenvertreterbeteiligung: Eltern und Kinderentwicklungsexperten sind sich der Nutzung von KI-Begleitern durch Kinder oft nicht bewusst und werden von Systemdesign-Entscheidungen ausgeschlossen
- Fehlende Schutzmaßnahmen: Metas interne Richtlinien sollen KI-Systemen erlauben, mit Kindern romantische oder sinnliche Gespräche zu führen
- Forschungslücken: Mangel an Multi-Interessenvertreter-Wahrnehmungsstudien basierend auf echten Gesprächsdaten
- Fehlende Governance: Mangel an evidenzgestützten Governance-Rahmen für Jugendliche-KI-Begleiter-Interaktionen
Diese Studie zielt darauf ab, erwachsene Interessenvertreter, die eine Schlüsselrolle in der Jugendlichenentwicklung spielen, in frühen Phasen der Governance von Jugendliche-KI-Begleitern einzubeziehen und eine empirische Grundlage für die Gestaltung sicherer KI-Begleiter-Systeme zu schaffen.
- Erste empirische Studie basierend auf Gesprächsdaten: Bietet die erste empirische Studie, die Gesprächsdaten nutzt, um Multi-Interessenvertreter-Wahrnehmungen von Vorteilen und Risiken bei Jugendliche-KI-Begleiter-Interaktionen zu erfassen
- Identifikation von Risikobewertungslogiken: Identifiziert, wie Eltern und Experten Risiken durch geschichtete Kontextfaktoren bewerten und offenbart ihre unterschiedlichen Urteilslogiken
- Designprinzipien: Schlägt Interessenvertreter-Empfehlungen und Interventionsmaßnahmen über Systemdesign, Rollendesign, Interaktionsschutzmaßnahmen und gesellschaftliche Beteiligung vor
Diese Studie nutzt qualitative Forschungsmethoden durch halbstrukturierte Interviews, bei denen Teilnehmer echte Jugendliche-KI-Begleiter-Gesprächsfragmente überprüfen und ihre wahrgenommenen Vorteile und Bedenken diskutieren.
- Datenquelle: Character.ai-Plattform, eine weit verbreitete generative KI-Begleiter-Plattform
- Teilnehmer: 11 Jugendliche Nutzer im Alter von 13–21 Jahren
- Datengröße: 253 Textgesprächsprotokolle
- Fragmentauswahl: Das Forschungsteam wählte 8 Gesprächsfragmente aus, die verschiedene Themen, Rollen und Interaktionsstile repräsentieren
- Rekrutierungsplattform: Rekrutierung über Prolific-Plattform
- Einschlusskriterien:
- Elterngruppe: Englischsprachig, in den USA ansässig, mindestens ein Kind im Alter von 13–21 Jahren
- Expertengruppe: Hintergrund oder Arbeitserfahrung in Entwicklungspsychologie
- Endgültige Stichprobe: 26 Teilnehmer (einschließlich 5 Pilotinterviews), davon 8 Eltern und 13 Experten
- Aufwärmfragen: Verständnis des Teilnehmerhintergrunds
- Lautes Denken-Sitzung: Überprüfung von Gesprächsfragmenten und Echtzeitgedankenaustauch
- Nachfolgende Diskussion: Tiefere Erkundung von Risikobewertungsfaktoren, Akzeptanzgrenzen und Interventionspräferenzen
Thematische Analysemethode wurde angewendet, wobei vier Forscher unabhängig 20% des Datensatzes kodieren, um initiale Codes und Themen zu entwickeln, gefolgt von kollaborativer Kodierung der verbleibenden Daten.
Die 8 verwendeten Gesprächsfragmente umfassen drei Hauptinteraktionstypen:
- Romantische und intime Erkundung
- Suche nach sozioemotionaler Unterstützung und Begleitung
- Unterhaltung und narrative Mitgestaltung
- Geschlechterverteilung: 69% weiblich, 31% männlich, 4% nicht-binär
- Geografische Verteilung: Alle aus verschiedenen US-Bundesstaaten
- Fachlicher Hintergrund: Expertenteilnehmer haben Abschlüsse oder Arbeitserfahrung in entwicklungspsychologischen Bereichen
- Genehmigung durch Institutional Review Board (IRB)
- Alle Teilnehmer gaben informierte Zustimmung
- Anonymisierung der Daten
- Sichere Speicherung auf verschlüsselten institutionellen Servern
Zwei Hauptpositionen:
- Bedingt akzeptierende Gruppe (n=12): Betrachtet dies als Entwicklungs-"Sandbox" zum Trainieren sozialer Skripte und Erkunden romantischer Gefühle
- Inhärentes Risiko-Gruppe (n=6): Betrachtet es als inhärent riskant und inakzeptabel für Minderjährige unter 18 Jahren
Schlüsselbewertungsfaktoren:
- Alter und Reife des Jugendlichen
- KI-Rollenalter und Altersunterschied zum Jugendlichen
- Absicht und Initiative des Jugendlichen vs. KI-Dominanz
- Interaktionshäufigkeit und Muster
- Von der KI modelliertes Verhalten und Werte
Wahrgenommene Vorteile:
- Bereitstellung eines urteilsfreien Auslassventils
- Förderung von Selbstausdruck und emotionaler Regulierung
- Übungsraum für sozial schüchterne Jugendliche
Risikogrenzen:
- KI als therapeutisch, aber nicht als Therapie selbst
- Grenze zwischen Beratung und emotionaler Bindung
- Gleichgewicht zwischen Bestätigung und Überbestätigung
- Probleme mit KI-Unfähigkeit, emotionale Hinweise zu erkennen
Hauptbedenken:
- Beurteilung der Angemessenheit basierend auf Rollenidentität und Quellmedium
- Versteckte Risiken in scheinbar freundlichen Rollen
- Mehrdeutige und entwicklungsunangemessene Sprache
- Auswirkungen von Jugendlichentraumata und psychischer Gesundheit
- Eltern: Nutzen ereignisbasierte Methode, kennzeichnen einzelne besorgniserregende Elemente als hochriskant
- Experten: Betonen musterbasierte Logik, bewerten, ob besorgniserregende Elemente wiederholt, verschärft oder anhaltend sind
- Experten: Bevorzugen hohe Schwellwerte, behalten Warnungen nur bei akuten Krisen vor
- Eltern: Bevorzugen niedrige Schwellwerte, wünschen Benachrichtigungen auch in sensiblen Situationen
- Bewertungssystem: Adoption eines Film- oder Spielstil-Bewertungssystems
- Transparenzverbesserung: Bereitstellung transparenter Informationen über KI-Rollenfähigkeiten und -verhalten
- KI-Literaturbildung: Bereitstellung von Einführungsbildung über KI-Natur und -Grenzen
- Lobby-Rollenmechanismus: Neutrale KI-Rolle als Reflexions- und Sicherheitsmechanismus
- Kontextbewusste Überwachung: Anpassung der Überwachung an Familienwerte
- Sanfte Stopps: Elegante Handhabung sensibler Grenzen, Vermeidung harter Ablehnungen
- Reflektive Fragen: Förderung von Reflexion durch Fragen
- Emotionale Distanz bewahren: Fürsorge zeigen, aber übermäßige Bindung vermeiden
- Expertenansatz: Nur Kriseneeskalation, stärkere Verknüpfung mit professionellen Ressourcen
- Elternansatz: Umfassendere Einschränkungs- und Benachrichtigungssysteme
Evolution vom ELIZA-Chatbot von 1966 zu modernen generativen KI-Begleitern, mit Marktprognosen von 381,41 Milliarden Dollar bis 2032.
Traditionelle elterliche Vermittlungsstrategien (Einschränkung, Überwachung, aktive Vermittlung) zeigen begrenzte Wirksamkeit in digitalen Umgebungen und erfordern kollaborativere Ansätze.
Bestehende Forschung zeigt grundlegende Spannungen zwischen Eltern und Jugendlichen bei digitalen Datenschutzgrenzen, wobei KI-Technologie neue Bedenken einführt.
- Kontextualisierte Risikobewertung: Eltern und Experten bewerten Risiken durch unterschiedliche aber komplementäre Perspektiven, wobei Eltern Wertkonsistenz und Themenangemessenheit betonen und Experten sich auf Entwicklungsfähigkeitserwerb und Schadenschwellen konzentrieren
- Bedarf an gestuften Schutzmaßnahmen: Sicherheit kann nicht durch umfassende Verbote oder Schlüsselwortfilter erreicht werden; gestaffelte Schutzmaßnahmen unter Berücksichtigung von Alter, Reife, Interaktionstyp und Familienhintergrund sind erforderlich
- Ausgleich zwischen Autonomie und Schutz: Notwendigkeit, ein Gleichgewicht zwischen Unterstützung jugendlicher Erkundung und Schutz zu finden, durch widerstandsorientiertes Design zur Unterstützung von Fähigkeitserwerb
- Bedarf an kontextualisierten und entwicklungsorientierten Risikobewertungsmethoden
- Erkennungsmodelle, die Multi-Interessenvertreter-Perspektiven integrieren
- Berücksichtigung von Interaktionsdynamiken statt nur Thema oder Wortlaut
- Bereitstellung von "KI-Rollenkarten" oder "Gesprächsbewertungen"
- Einbettung jugendlichensensitiver Vorlagen in den Rollenerstellungsprozess
- KI-Literaturbildung für Jugendliche
- Vermeidung von Einheitsansätzen
- Bereitstellung anpassbarer Familiensicherheitsprofile
- Unterstützung von Mitregulation statt reiner Kontrolle
- Methodologische Innovation: Erste Nutzung echter Gesprächsdaten für Multi-Interessenvertreter-Forschung, bietet reichhaltigere Erkenntnisse als hypothetische Szenarien
- Praktischer Orientierungswert: Bietet konkrete Designempfehlungen und Interventionsstrategien mit direkter Orientierungsfunktion für KI-Begleiter-Plattformentwicklung
- Theoretischer Beitrag: Identifiziert unterschiedliche Logiken bei der Risikobewertung zwischen Eltern und Experten (Ereignis vs. Muster), bietet theoretischen Rahmen zum Verständnis von Interessenvertreter-Unterschieden
- Forschungsstrenge: Anwendung strenger qualitativer Forschungsmethoden, einschließlich Multi-Forscher-Kodierung und thematischer Analyse
- Stichprobenlimitationen:
- Nur US-Teilnehmer, mangelnde kulturelle Vielfalt
- Relativ kleine Stichprobengröße (26 Personen)
- Höherer Anteil weiblicher Teilnehmer (69%)
- Fehlende Jugendlichenstimmen: Forschung konzentriert sich auf erwachsene Interessenvertreter-Perspektiven, mangelnde Einbeziehung jugendlicher Standpunkte und Erfahrungen
- Langzeitauswirkungen unbekannt: Kurzzeitevaluierung basierend auf Gesprächsfragmenten, keine Erkenntnisse über Langzeitnutzungsauswirkungen
- Implementierbarkeit: Einige vorgeschlagene Interventionsmaßnahmen (wie personalisierte Überwachung, kontextbewusste Systeme) könnten bei technischer Umsetzung auf Herausforderungen stoßen
- Etablierung einer wichtigen empirischen Grundlage für KI-Begleiter-Sicherheitsforschung
- Bereitstellung neuer Forschungsparadigmen für Jugendlichensicherheitsforschung im Bereich Mensch-Computer-Interaktion
- Mögliche Anregung weiterer interdisziplinärer Kooperationsforschung
- Bereitstellung konkreter Sicherheitsorientierungsprinzipien für KI-Begleiter-Plattformdesign
- Mögliche Beeinflussung der Formulierung relevanter Regulierungspolitik
- Bereitstellung von Referenzen für KI-Literaturbildung für Pädagogen und Eltern
- Erhöhung des öffentlichen Bewusstseins für Risiken der Jugendlichennutzung von KI-Begleitern
- Förderung der Multi-Interessenvertreter-Beteiligung an KI-Governance
- Bereitstellung wissenschaftlicher Grundlagen zum Schutz des digitalen Wohlbefindens von Jugendlichen
- KI-Begleiter-Plattformentwicklung: Orientierung für die Gestaltung von Jugendlichensicherheitsfunktionen auf Plattformen wie Character.ai
- Bildungstechnologie-Design: Referenzen für Sicherheitsdesign von Bildungs-KI-Assistenten
- Politische Formulierung: Empirische Unterstützung für Regulierungspolitik bezüglich Jugendlichennutzung von KI
- Familienbildung: Orientierung für Eltern zum Verständnis und zur Verwaltung der Jugendlichennutzung von KI
- Psychische Gesundheitsdienste: Referenzen für psychische Gesundheitsfachleute zum Verständnis von KI-Auswirkungen auf Jugendliche
- Einbeziehung jugendlicher Perspektiven: Zukünftige Forschung sollte direkt Jugendlichenstimmen und -erfahrungen einbeziehen
- Transkulturelle Forschung: Erweiterung auf verschiedene kulturelle Hintergründe, Verständnis kultureller Unterschiede bei der Risikowahrnehmung
- Längsschnittstudien: Durchführung langfristiger Verfolgungsstudien zur Erfassung von Langzeitauswirkungen der KI-Begleiter-Nutzung
- Interventionseffektivitätsevaluierung: Praktische Prüfung der Wirksamkeit vorgeschlagener Interventionsmaßnahmen
- Technische Implementierungsforschung: Erkundung der technischen Umsetzung vorgeschlagener Sicherheitsmaßnahmen
Gesamtbewertung: Dies ist eine hochwertige Mensch-Computer-Interaktions-Forschung, die wertvolle empirische Erkenntnisse in einem aufstrebenden und wichtigen Bereich bietet. Trotz einiger Einschränkungen sind ihre Beiträge zum Design der KI-Begleiter-Sicherheit erheblich und legen eine wichtige Grundlage für die verantwortungsvolle Entwicklung dieses schnell wachsenden Feldes.