AI companions are increasingly popular among teenagers, yet current platforms lack safeguards to address developmental risks and harmful normalization. Despite growing concerns, little is known about how parents and developmental psychology experts assess these interactions or what protections they consider necessary. We conducted 26 semi structured interviews with parents and experts, who reviewed real world youth GenAI companion conversation snippets. We found that stakeholders assessed risks contextually, attending to factors such as youth maturity, AI character age, and how AI characters modeled values and norms. We also identified distinct logics of assessment: parents flagged single events, such as a mention of suicide or flirtation, as high risk, whereas experts looked for patterns over time, such as repeated references to self harm or sustained dependence. Both groups proposed interventions, with parents favoring broader oversight and experts preferring cautious, crisis-only escalation paired with youth facing safeguards. These findings provide directions for embedding safety into AI companion design.
- ID de l'article : 2510.11185
- Titre : Principles of Safe AI Companions for Youth: Parent and Expert Perspectives
- Auteurs : Yaman Yu, Mohi, Aishi Debroy, Xin Cao, Karen Rudolph, Yang Wang
- Classification : cs.HC (Interaction Homme-Ordinateur)
- Date de publication/Conférence : CHI '26, 13-18 avril 2026, Barcelone, Espagne
- Lien de l'article : https://arxiv.org/abs/2510.11185
Les compagnons IA deviennent de plus en plus populaires chez les jeunes, mais les plateformes actuelles manquent de mesures de protection contre les risques développementaux et la normalisation des comportements nuisibles. Malgré les préoccupations croissantes, on sait peu de choses sur la manière dont les parents et les experts en psychologie du développement évaluent ces interactions et les mesures de protection qu'ils jugent nécessaires. Cette étude a mené des entretiens semi-structurés avec 26 parents et experts qui ont examiné des extraits authentiques de conversations entre jeunes et compagnons IA. L'étude révèle que les parties prenantes évaluent les risques en fonction du contexte, en tenant compte de facteurs tels que la maturité des jeunes, l'âge du rôle IA et la manière dont le rôle IA modélise les valeurs et les normes. L'étude identifie également des logiques d'évaluation différentes : les parents signalent les événements isolés (comme les mentions de suicide ou les avances) comme à haut risque, tandis que les experts se concentrent sur les modèles temporels (comme les mentions répétées d'automutilation ou la dépendance persistante). Les deux groupes proposent des interventions, les parents penchant pour une surveillance plus large, tandis que les experts préfèrent une approche prudente, avec escalade uniquement en cas de crise, accompagnée de mesures de protection orientées vers les jeunes.
Avec l'émergence de l'IA générative, les compagnons IA ont évolué des chatbots traditionnels fournisseurs d'informations vers des personnages numériques capables de former des attachements émotionnels et de simuler des relations. Les enquêtes montrent que 72 % des jeunes aux États-Unis ont utilisé des compagnons IA, plus de la moitié interagissent régulièrement avec eux, et près d'un tiers les utilisent pour l'interaction sociale ou la connexion émotionnelle.
Les jeunes constituent un groupe particulièrement vulnérable, confrontés à des risques développementaux uniques :
- Intersection des étapes développementales : Les interactions avec les compagnons IA coïncident avec les étapes du développement social et émotionnel des jeunes, pouvant façonner leur trajectoire développementale
- Cas tragiques documentés : Deux jeunes se sont suicidés après des conversations prolongées avec des compagnons IA
- Manque de participation des parties prenantes : Les parents et les experts en développement de l'enfant ne sont généralement pas informés de l'utilisation des compagnons IA par les enfants et sont exclus des décisions de conception des systèmes
- Absence de mesures de protection : Les directives internes de Meta permettraient apparemment aux systèmes IA d'avoir des conversations romantiques ou sensuelles avec les enfants
- Lacunes de recherche : Absence d'études multi-parties prenantes basées sur des données de conversations authentiques
- Absence de gouvernance : Manque de cadre de gouvernance fondé sur des données probantes pour les interactions des jeunes avec les compagnons IA
Cette étude vise à impliquer les parties prenantes adultes jouant un rôle clé dans le développement des jeunes dans les premières étapes de la gouvernance des compagnons IA pour les jeunes, fournissant une base empirique pour la conception de systèmes de compagnons IA plus sûrs.
- Première étude empirique basée sur des données de conversation : Fournit la première étude empirique utilisant des données de conversation pour évaluer les perceptions multi-parties prenantes des avantages et des risques des interactions jeunes-compagnons IA
- Identification des logiques d'évaluation des risques : Identifie comment les parents et les experts évaluent les risques en fonction de facteurs contextuels hiérarchisés, révélant leurs logiques de jugement différentes
- Principes directeurs de conception : Propose des principes et des mesures d'intervention recommandés par les parties prenantes couvrant la conception des systèmes et des rôles, les mesures de protection des interactions et l'engagement social
Cette étude emploie une approche de recherche qualitative, collectant des données par le biais d'entretiens semi-structurés où les participants examinent des extraits authentiques de conversations jeunes-compagnons IA et discutent des avantages et des préoccupations perçus.
- Source de données : Plateforme Character.ai, une plateforme de compagnons IA générative largement utilisée
- Participants : 11 utilisateurs jeunes âgés de 13 à 21 ans
- Échelle de données : 253 journaux de dialogue texte
- Sélection d'extraits : L'équipe de recherche a sélectionné 8 extraits de conversation représentant différents sujets, rôles et styles d'interaction
- Plateforme de recrutement : Recrutement via la plateforme Prolific
- Critères d'inclusion :
- Groupe de parents : Locuteurs anglophones, résidant aux États-Unis, ayant au moins un enfant âgé de 13 à 21 ans
- Groupe d'experts : Ayant une formation ou une expérience professionnelle en psychologie du développement
- Échantillon final : 26 participants (incluant 5 entretiens pilotes), dont 8 parents et 13 experts
- Questions d'échauffement : Comprendre le contexte des participants
- Session de réflexion à voix haute : Examiner les extraits de conversation et partager les pensées en temps réel
- Discussion de suivi : Explorer en profondeur les facteurs d'évaluation des risques, les limites d'acceptabilité et les préférences d'intervention
Utilisation de l'analyse thématique, avec quatre chercheurs codant indépendamment 20 % de l'ensemble de données pour développer les codes et thèmes initiaux, puis collaborant pour compléter le codage des données restantes.
Les 8 extraits de conversation utilisés dans l'étude couvrent trois principaux types d'interactions :
- Exploration romantique et intime
- Recherche de soutien socio-émotionnel et de compagnie
- Divertissement et co-création narrative
- Distribution par genre : 69 % femmes, 31 % hommes, 4 % non-binaires
- Distribution géographique : Tous issus de différents États américains
- Contexte professionnel : Les participants experts possèdent des diplômes ou une expérience professionnelle en psychologie du développement
- Approbation du comité d'examen institutionnel (IRB)
- Consentement éclairé de tous les participants
- Traitement anonymisé des données
- Stockage sécurisé sur des serveurs institutionnels chiffrés
Deux positions principales :
- Groupe d'acceptation conditionnelle (n=12) : Les considère comme un « bac à sable » développemental pour répéter les scripts sociaux et explorer les sentiments romantiques
- Groupe de risque inhérent (n=6) : Les considère comme intrinsèquement risquées et inacceptables pour les mineurs de moins de 18 ans
Facteurs d'évaluation clés :
- Âge et maturité des jeunes
- Âge du rôle IA et écart d'âge avec le jeune
- Intention et initiative du jeune par rapport au caractère directif de l'IA
- Fréquence et modèles d'interaction
- Comportements et valeurs modélisés par l'IA
Avantages perçus :
- Fournir une sortie d'écoute sans jugement
- Promouvoir l'auto-expression et la régulation émotionnelle
- Fournir un espace de pratique pour les jeunes timides socialement
Limites des risques :
- L'IA comme thérapeutique mais non thérapie elle-même
- Limite entre les conseils et l'attachement émotionnel
- Équilibre entre l'affirmation et l'affirmation excessive
- Problèmes liés à l'incapacité de l'IA à reconnaître les signaux émotionnels
Préoccupations principales :
- Jugement de l'adéquation en fonction de l'identité du rôle et des médias sources
- Risques cachés dans les rôles apparemment amicaux
- Langage ambigu et développementalement inapproprié
- Impact des expériences traumatiques et de l'état de santé mentale des jeunes
- Parents : Adoptent une approche basée sur les événements, signalant comme à haut risque l'apparition d'un seul élément préoccupant
- Experts : Mettent l'accent sur une logique basée sur les modèles, évaluant si les éléments préoccupants se répètent, s'aggravent ou persistent
- Experts : Tendent vers un seuil élevé, réservant les alertes uniquement aux crises aiguës
- Parents : Tendent vers un seuil bas, souhaitant être notifiés même dans les situations sensibles
- Système de classification : Adopter un système de classification de style film ou jeu vidéo
- Amélioration de la transparence : Fournir des informations transparentes sur les capacités et les comportements des rôles IA
- Éducation à la littératie IA : Fournir une éducation d'introduction sur la nature et les limites de l'IA
- Mécanisme de rôle neutre : Rôles IA neutres comme mécanisme de réflexion et de sécurité
- Surveillance contextuelle : Surveillance personnalisée selon les valeurs familiales
- Arrêt progressif : Traitement élégant des limites sensibles, évitant les refus durs
- Questions réflexives : Encourager la réflexion par le biais de questions
- Maintien de la distance émotionnelle : Montrer de la bienveillance tout en évitant l'attachement excessif
- Approche d'expert : Escalade uniquement en cas de crise, avec liens plus forts vers les ressources professionnelles
- Approche parentale : Système de restrictions et de notifications plus large
Évolution du chatbot ELIZA de 1966 aux compagnons IA génératifs modernes, le marché devant atteindre 381,41 milliards de dollars d'ici 2032.
Les stratégies traditionnelles de médiation parentale (restriction, surveillance, médiation active) ont une efficacité limitée dans l'environnement numérique, nécessitant des approches plus collaboratives.
Les recherches existantes montrent que les parents et les jeunes ont des tensions fondamentales concernant les limites de la vie privée numérique, la technologie IA introduisant de nouvelles préoccupations.
- Évaluation contextualisée des risques : Les parents et les experts évaluent les risques selon des perspectives différentes mais complémentaires, les parents mettant l'accent sur la cohérence des valeurs et l'adéquation des sujets, tandis que les experts se concentrent sur l'acquisition de compétences développementales et les seuils de préjudice contextuel
- Besoin de mesures de protection hiérarchisées : La sécurité ne peut pas être réalisée par des interdictions générales ou des filtres de mots-clés, nécessitant des mesures de protection hiérarchisées tenant compte de l'âge, de la maturité, du type d'interaction et du contexte familial
- Équilibre entre autonomie et protection : Nécessité de trouver un équilibre entre le soutien à l'exploration des jeunes et leur protection, en soutenant l'apprentissage des compétences par une conception orientée vers la résilience
- Nécessité d'approches d'évaluation des risques contextualisées et orientées vers le développement
- Modèles de détection intégrant les perspectives multi-parties prenantes
- Considération de la dynamique d'interaction plutôt que seulement des sujets ou des formulations
- Fournir des « fiches de rôle IA » ou des « évaluations de conversation »
- Intégrer des modèles sensibles aux jeunes dans le processus de création de rôles
- Fournir une éducation à la littératie IA aux jeunes
- Éviter les approches uniformes
- Fournir des profils de sécurité familiale ajustables
- Soutenir la régulation collaborative plutôt que le simple contrôle
- Innovation méthodologique : Première utilisation de données de conversation authentiques pour une étude multi-parties prenantes, fournissant des perspectives plus riches que les scénarios hypothétiques
- Valeur de Guidance Pratique : Fournit des recommandations de conception spécifiques et des stratégies d'intervention, offrant une orientation directe pour le développement de plateformes de compagnons IA
- Contribution Théorique : Identifie les logiques différentes des parents et des experts dans l'évaluation des risques (événement vs modèle), fournissant un cadre théorique pour comprendre les différences entre les parties prenantes
- Rigueur de la Recherche : Emploie des méthodes de recherche qualitative rigoureuses, incluant le codage multi-chercheurs et l'analyse thématique
- Limitations de l'Échantillon :
- Inclut uniquement des participants américains, manquant de diversité culturelle
- Taille d'échantillon relativement petite (26 personnes)
- Proportion élevée de participantes femmes (69 %)
- Absence de Voix des Jeunes : L'étude se concentre sur les perspectives des parties prenantes adultes, manquant des points de vue et des expériences des jeunes eux-mêmes
- Impacts à Long Terme Inconnus : Évaluation à court terme basée sur des extraits de conversation, incapacité à comprendre les impacts de l'utilisation à long terme
- Faisabilité de Mise en Œuvre : Certaines mesures d'intervention proposées (comme la surveillance personnalisée, les systèmes contextuels) pourraient faire face à des défis dans la mise en œuvre technique
- Établit une base empirique importante pour la recherche sur la sécurité des compagnons IA
- Fournit un nouveau paradigme de recherche pour les études de sécurité des jeunes dans le domaine de l'interaction homme-ordinateur
- Pourrait inspirer davantage de recherches collaboratives interdisciplinaires
- Fournit des principes directeurs de sécurité spécifiques pour la conception de plateformes de compagnons IA
- Pourrait influencer l'élaboration des politiques réglementaires connexes
- Fournit une référence pour l'éducation à la littératie IA pour les éducateurs et les parents
- Sensibilise le public aux risques de l'utilisation des compagnons IA par les jeunes
- Promeut la participation multi-parties prenantes dans la gouvernance de l'IA
- Fournit une base scientifique pour la protection du bien-être numérique des jeunes
- Développement de Plateformes de Compagnons IA : Fournit une orientation pour la conception de fonctionnalités de sécurité pour les jeunes sur des plateformes comme Character.ai
- Conception de Technologie Éducative : Fournit une référence pour la conception sûre des assistants IA éducatifs
- Élaboration des Politiques : Fournit un soutien empirique pour les politiques réglementaires concernant l'utilisation de l'IA par les jeunes
- Éducation Familiale : Fournit une orientation pour aider les parents à comprendre et gérer l'utilisation des compagnons IA par les jeunes
- Services de Santé Mentale : Fournit une référence pour les professionnels de la santé mentale pour comprendre l'impact de l'IA sur les jeunes
- Inclusion des Perspectives des Jeunes : Les recherches futures devraient intégrer directement la voix et les expériences des jeunes
- Recherche Transculturelle : Élargir à différents contextes culturels pour comprendre comment les différences culturelles influencent la perception des risques
- Recherche Longitudinale : Mener des études de suivi à long terme pour comprendre les impacts à long terme de l'utilisation des compagnons IA
- Évaluation de l'Efficacité des Interventions : Tester réellement l'efficacité des mesures d'intervention proposées
- Recherche sur la Mise en Œuvre Technique : Explorer comment mettre en œuvre techniquement les mesures de sécurité proposées
Évaluation Globale : Il s'agit d'une recherche de haute qualité en interaction homme-ordinateur qui fournit des perspectives empiriques précieuses dans un domaine émergent et important. Malgré certaines limitations, sa contribution à la conception sûre des compagnons IA est significative, jetant une base importante pour le développement responsable de ce domaine en rapide évolution.