2025-11-22T21:07:16.151293

Creation, Critique, and Consumption: Exploring Generative AI Descriptions for Supporting Blind and Low Vision Professionals with Visual Tasks

Jiang, Zhang, Findlater
Many blind and low vision (BLV) people are excluded from professional roles that may involve visual tasks due to access barriers and persisting stigmas. Advancing generative AI systems can support BLV people through providing contextual and personalized visual descriptions for creation, critique, and consumption. In this workshop paper, we provide design suggestions for how visual descriptions can be better contextualized for multiple professional tasks. We conclude by discussing how these designs can improve autonomy, inclusion, and skill development over time.
academic

Création, Critique et Consommation : Explorer les Descriptions Générées par l'IA pour Soutenir les Professionnels Aveugles et Malvoyants dans les Tâches Visuelles

Informations Fondamentales

  • ID de l'article : 2510.08991
  • Titre : Creation, Critique, and Consumption: Exploring Generative AI Descriptions for Supporting Blind and Low Vision Professionals with Visual Tasks
  • Auteurs : Lucy Jiang, Lotus Zhang, Leah Findlater (Université de Washington)
  • Classification : cs.HC (Interaction Homme-Machine)
  • Date de publication/Conférence : Atelier ASSETS '25 : AT @ Work, Virtuel 2025
  • Lien de l'article : https://arxiv.org/abs/2510.08991

Résumé

De nombreuses personnes aveugles et malvoyantes (AMV) sont exclues des rôles professionnels pouvant impliquer des tâches visuelles en raison des obstacles d'accessibilité et des préjugés persistants. Les systèmes avancés d'IA générative peuvent soutenir les personnes AMV en fournissant des descriptions visuelles contextualisées et personnalisées pour la création, la critique et la consommation. Dans cet article d'atelier, les auteurs fournissent des recommandations de conception sur la manière de mieux fournir des descriptions visuelles contextualisées pour diverses tâches professionnelles, et discutent de la façon dont ces conceptions peuvent améliorer au fil du temps l'autonomie, l'inclusion et le développement des compétences.

Contexte et Motivation de la Recherche

Contexte du Problème

  1. Écart d'emploi significatif : Le taux d'emploi des personnes handicapées est environ un tiers de celui des personnes non handicapées, les obstacles à l'emploi pour les personnes AMV étant particulièrement aigus
  2. Les tâches visuelles comme obstacle professionnel : De nombreuses tâches impliquant la communication visuelle dans les environnements de travail modernes (création de diapositives, formatage de documents, prise de photos, visionnage de vidéos de formation, etc.) constituent des obstacles majeurs pour les professionnels AMV
  3. Limitations des technologies d'assistance traditionnelles : Les solutions d'accessibilité existantes se limitent principalement à fournir l'accès aux informations visuelles de base, plutôt que de permettre une participation complète au travail

Motivation de la Recherche

  • Le développement rapide de la technologie d'IA générative crée de nouvelles opportunités pour fournir des descriptions visuelles contextualisées et personnalisées
  • Nécessité de dépasser l'accès aux informations de base pour soutenir la participation complète des professionnels AMV aux tâches de communication visuelle
  • Utiliser l'innovation technologique pour briser les barrières à l'emploi et améliorer l'inclusion professionnelle des personnes AMV

Contributions Principales

  1. Proposition d'un cadre de conception pour les systèmes de description visuelle spécialisés : Fournir des services de description IA contextualisés et personnalisés pour différents scénarios professionnels
  2. Construction de deux scénarios d'application concrets : Production vidéo pour créateurs de contenu indépendants et création de matériel marketing pour grandes agences publicitaires
  3. Fourniture de recommandations de conception systématiques : Couvrant le soutien aux tâches visuelles selon trois dimensions : création, critique et consommation
  4. Articulation des mécanismes d'impact à long terme : Analyse de la manière dont ces conceptions peuvent améliorer l'autonomie, l'inclusion et le développement des compétences des professionnels AMV

Détails Méthodologiques

Définition des Tâches

Cette recherche se concentre sur la conception de systèmes de description visuelle par IA générative pour soutenir les professionnels AMV, couvrant trois dimensions de tâches fondamentales :

  • Création (Creation) : Aider les personnes AMV à créer du contenu visuel
  • Critique (Critique) : Soutenir l'évaluation et la rétroaction sur les œuvres visuelles
  • Consommation (Consumption) : Aider à la compréhension et au traitement des informations visuelles

Cadre de Conception

Scénario Un : Production Vidéo pour Créateurs de Contenu Indépendants

Analyse des besoins fondamentaux :

  • Difficulté à identifier les tendances visuelles
  • Défis de composition et de positionnement du sujet
  • Besoin de vérification des effets visuels en post-production

Conception du système de description IA :

  1. Soutien à l'identification des tendances : Description des éléments visuels courants accompagnant les pistes audio populaires (gestes, texte à l'écran, etc.)
  2. Assistance au processus de tournage :
    • Assurer le positionnement idéal du sujet de tournage dans le cadre
    • Fournir des descriptions détaillées du contenu pour faciliter la composition artistique
  3. Amélioration du processus d'édition :
    • Description de la température de couleur de la vidéo
    • Évaluation de la précision des filtres et effets spéciaux
    • Fourniture d'informations artistiques au-delà de l'édition de contenu

Scénario Deux : Création de Matériel Marketing pour Grande Agence Publicitaire

Défis fondamentaux :

  • Complexité des flux de travail collaboratifs
  • Besoins de production de contenu multi-formats
  • Exigences d'itération rapide et de collaboration en temps réel
  • Respect strict des directives de marque

Conception du système de description IA :

  1. Soutien à la cohérence de marque :
    • Description précise des directives de marque
    • Description de couleur exacte pour assurer la représentation de marque
  2. Amélioration de la collaboration d'équipe :
    • Description de la vue d'ensemble (apparence visuelle globale)
    • Description au niveau des objets (par exemple, groupes de notes adhésives)
    • Suivi de la position du curseur des collaborateurs (en tant qu'agent de focus visuel)

Points d'Innovation Technologique

  1. Description sensible au contexte : Adapter le contenu et le niveau de détail des descriptions aux besoins spécifiques des tâches professionnelles
  2. Architecture informationnelle multi-niveaux : Fournir des informations visuelles hiérarchisées du macro au micro
  3. Soutien à la collaboration en temps réel : Intégrer les retours visuels dynamiques des flux de travail d'équipe
  4. Adaptation personnalisée : Ajuster les stratégies de description en fonction du rôle de l'utilisateur et du type de tâche

Configuration Expérimentale

Note : Cet article est un article d'atelier qui fournit principalement des recommandations de conception et un cadre conceptuel, sans configuration expérimentale ni résultats au sens traditionnel.

Fondements Théoriques

  • Analyse basée sur la littérature existante des défis auxquels font face les créateurs de contenu AMV
  • Référence aux recherches sur les systèmes d'assistance à l'édition visuelle (par exemple, le système d'édition vidéo textuelle d'Huh et al.)
  • Intégration des travaux connexes sur l'accessibilité de la création graphique numérique

Méthodes de Validation de Conception

  • Vérification de l'universalité du problème par examen de la littérature
  • Analyse des besoins de conception basée sur les limitations des systèmes existants
  • Inspiration de conception basée sur les cas de succès dans les domaines connexes

Travaux Connexes

Technologies d'Assistance à la Création de Contenu Visuel

  1. EditScribe de Chang et al. : Utilise des boucles de vérification en langage naturel pour soutenir l'édition d'images non-visuelles pour les personnes AMV
  2. AVScript d'Huh et al. : Système d'édition vidéo textuelle intégrant descriptions visuelles et parole
  3. A11yboard de Zhang et al. : Recherche sur l'accessibilité des tableaux de dessin numériques

Participation au Contenu Numérique des Personnes AMV

  1. Participation aux réseaux sociaux : Partage de la vie quotidienne et participation à l'économie créative des créateurs AMV sur les plateformes vidéo
  2. Recherche sur les obstacles d'accessibilité : Difficultés de création de contenu visuellement attrayant, problèmes de vérification des fonctionnalités de filtrage, défis du suivi des tendances

Collaboration Mixte-Capacité

  1. Outils de collaboration en temps réel : Améliorations de la collaboration mixte-capacité dans les éditeurs de texte et les logiciels de présentation
  2. Accessibilité des environnements collaboratifs : Accessibilité des activités collaboratives orientées visuellement (wireframing, discussions au tableau blanc)

Conclusions et Discussion

Conclusions Principales

  1. Redéfinition de la littératie visuelle : Les personnes AMV possèdent une compréhension visuelle profonde ; la technologie devrait soutenir et améliorer plutôt que supposer son absence
  2. Amélioration systématique de l'inclusion professionnelle : L'innovation technologique peut progressivement réduire les préjugés et améliorer l'autonomie, l'inclusion et le développement des compétences des personnes AMV
  3. Importance de la description personnalisée : Différents scénarios professionnels nécessitent des stratégies de description visuelle sur mesure

Mécanismes d'Impact à Long Terme

Citant la perspective de Georgina Kleege : « En moyenne, une personne complètement aveugle de naissance comprend bien mieux ce que signifie la vision qu'une personne ayant une vision normale ne comprend ce que signifie être aveugle. »

Effets attendus :

  • Amélioration de l'autonomie : Réduction de la dépendance à l'assistance d'autrui
  • Amélioration de l'inclusion : Promotion de pratiques de conception plus inclusives et d'une culture de travail
  • Développement des compétences : Soutien permettant aux professionnels AMV de démontrer leurs capacités créatives

Évaluation Approfondie

Points Forts

  1. Orientation problématique forte : Aborde directement les obstacles fondamentaux à la participation professionnelle des personnes AMV
  2. Approche de conception innovante : Propose le concept de systèmes de description IA contextualisés et personnalisés
  3. Valeur pratique élevée : Fournit des recommandations de conception concrètes et exploitables
  4. Fondements théoriques solides : Références complètes à la littérature pertinente avec argumentation substantielle
  5. Signification sociale majeure : Porte attention aux droits d'égalité professionnelle des groupes vulnérables

Limitations

  1. Manque de validation empirique : En tant que document conceptuel, il manque de recherche utilisateur et d'évaluation systématique
  2. Détails insuffisants sur l'implémentation technique : Description limitée de l'architecture technique spécifique du système IA
  3. Analyse d'extensibilité insuffisante : Discussion insuffisante de l'applicabilité des recommandations de conception à d'autres scénarios professionnels
  4. Absence d'analyse coûts-avantages : Ne considère pas les coûts réels de développement et de déploiement du système

Impact

  1. Contribution académique : Fournit de nouvelles perspectives de conception pour la recherche en technologie d'accessibilité
  2. Orientation pratique : Fournit des directives de conception spécifiques aux développeurs de technologies connexes
  3. Inspiration politique : Peut influencer l'élaboration des politiques d'accessibilité professionnelle
  4. Valeur sociale : Promeut la réflexion sociale sur les capacités professionnelles des personnes AMV

Scénarios d'Application

  1. Industrie de la création de contenu : Production vidéo, conception graphique, créativité marketing et domaines connexes
  2. Environnements de travail collaboratif : Scénarios de travail d'équipe nécessitant une collaboration visuelle en temps réel
  3. Éducation et formation : Formation aux compétences visuelles et soutien au développement professionnel
  4. Développement technologique : Développement d'outils assistés par IA et produits de technologie d'accessibilité

Directions de Recherche Futures

  1. Recherche utilisateur : Compréhension approfondie des besoins spécifiques des professionnels AMV dans diverses professions
  2. Implémentation technologique : Développement de systèmes prototypes et vérification de la faisabilité technique
  3. Évaluation d'efficacité : Conception d'un système d'indicateurs d'évaluation pour vérifier l'impact du système sur l'efficacité du travail et la satisfaction des utilisateurs
  4. Expansion interdisciplinaire : Exploration de l'applicabilité des principes de conception à d'autres domaines professionnels
  5. Considérations éthiques : Étude des biais potentiels et des problèmes de confidentialité que les systèmes de description IA pourraient introduire

Résumé : Cet article propose une direction de recherche importante et prospective, utilisant la technologie d'IA générative pour fournir un meilleur soutien professionnel aux professionnels AMV. Bien qu'en tant que recherche conceptuelle il manque de validation empirique, ses perspectives de conception et sa valeur sociale méritent une recherche plus approfondie et une exploration d'application pratique.