2025-11-22T21:07:16.151293

Creation, Critique, and Consumption: Exploring Generative AI Descriptions for Supporting Blind and Low Vision Professionals with Visual Tasks

Jiang, Zhang, Findlater
Many blind and low vision (BLV) people are excluded from professional roles that may involve visual tasks due to access barriers and persisting stigmas. Advancing generative AI systems can support BLV people through providing contextual and personalized visual descriptions for creation, critique, and consumption. In this workshop paper, we provide design suggestions for how visual descriptions can be better contextualized for multiple professional tasks. We conclude by discussing how these designs can improve autonomy, inclusion, and skill development over time.
academic

Creación, Crítica y Consumo: Explorando Descripciones de IA Generativa para Apoyar a Profesionales Ciegos y con Baja Visión en Tareas Visuales

Información Básica

  • ID del Artículo: 2510.08991
  • Título: Creation, Critique, and Consumption: Exploring Generative AI Descriptions for Supporting Blind and Low Vision Professionals with Visual Tasks
  • Autores: Lucy Jiang, Lotus Zhang, Leah Findlater (Universidad de Washington)
  • Clasificación: cs.HC (Interacción Humano-Computadora)
  • Fecha de Publicación/Conferencia: ASSETS '25 Workshop: AT @ Work, Virtual 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.08991

Resumen

Muchas personas ciegas y con baja visión (BLV) están excluidas de roles profesionales que pueden implicar tareas visuales debido a barreras de acceso y prejuicios persistentes. Los sistemas avanzados de IA generativa pueden apoyar a la población BLV proporcionando descripciones visuales contextualizadas y personalizadas para la creación, crítica y consumo. En este artículo de taller, los autores proporcionan recomendaciones de diseño sobre cómo proporcionar mejor descripciones visuales contextualizadas para múltiples tareas profesionales, y discuten cómo estos diseños pueden mejorar la autonomía, inclusión y desarrollo de habilidades a lo largo del tiempo.

Antecedentes de Investigación y Motivación

Contexto del Problema

  1. Brecha de Empleo Significativa: La tasa de empleo de personas con discapacidad es aproximadamente un tercio de la de personas sin discapacidad, siendo las barreras de empleo para la población BLV particularmente prominentes
  2. Tareas Visuales como Barrera Laboral: En el lugar de trabajo moderno, una gran cantidad de tareas que implican comunicación visual (como crear presentaciones, formatear documentos, tomar fotografías, ver videos de capacitación, etc.) se convierten en barreras principales para profesionales BLV
  3. Limitaciones de la Tecnología de Asistencia Tradicional: Las soluciones de accesibilidad existentes se limitan principalmente a proporcionar acceso a información visual básica, en lugar de permitir la participación laboral completa

Motivación de la Investigación

  • El rápido desarrollo de la tecnología de IA generativa crea nuevas oportunidades para proporcionar descripciones visuales contextualizadas y personalizadas
  • Existe la necesidad de ir más allá del acceso a información básica para apoyar la participación completa de profesionales BLV en tareas de comunicación visual
  • A través de la innovación tecnológica, se pueden romper las barreras de empleo y mejorar la inclusión laboral de la población BLV

Contribuciones Principales

  1. Propone un Marco de Diseño para Sistemas de Descripciones Visuales Especializadas: Proporciona servicios de descripción de IA contextualizados y personalizados para diferentes escenarios profesionales
  2. Construye Dos Escenarios de Aplicación Específicos: Producción de video para creadores de contenido independientes y creación de materiales de marketing para grandes agencias publicitarias
  3. Proporciona Recomendaciones de Diseño Sistemáticas: Abarca el apoyo de tareas visuales en tres dimensiones: creación, crítica y consumo
  4. Articula Mecanismos de Impacto a Largo Plazo: Analiza cómo estos diseños pueden mejorar la autonomía, inclusión y desarrollo de habilidades de profesionales BLV

Explicación Detallada de la Metodología

Definición de Tareas

Esta investigación se enfoca en el diseño de sistemas de descripciones visuales de IA generativa para apoyar a profesionales BLV, abarcando tres dimensiones de tareas principales:

  • Creación (Creation): Asistir a personas BLV en la creación de contenido visual
  • Crítica (Critique): Apoyar la evaluación y retroalimentación de obras visuales
  • Consumo (Consumption): Ayudar a comprender y procesar información visual

Marco de Diseño

Escenario Uno: Producción de Video para Creadores de Contenido Independientes

Análisis de Necesidades Principales:

  • Dificultad en la identificación de tendencias visuales
  • Desafíos en la composición de tomas y posicionamiento de sujetos
  • Necesidad de verificación de efectos visuales en la edición posterior

Diseño del Sistema de Descripciones de IA:

  1. Apoyo en la Identificación de Tendencias: Describir elementos visuales comunes asociados con pistas de audio populares (gestos, texto en pantalla, etc.)
  2. Asistencia en el Proceso de Grabación:
    • Asegurar que el sujeto de grabación esté en una posición ideal en el encuadre
    • Proporcionar descripciones detalladas del contenido para asistir en la composición artística
  3. Mejora del Proceso de Edición:
    • Describir la temperatura de color del video
    • Evaluar la precisión de filtros y efectos especiales
    • Proporcionar información artística más allá de la edición de contenido

Escenario Dos: Creación de Materiales de Marketing en Grandes Agencias Publicitarias

Desafíos Principales:

  • Complejidad de los flujos de trabajo colaborativos
  • Necesidades de producción de contenido en múltiples formatos
  • Requisitos de iteración rápida y colaboración en tiempo real
  • Cumplimiento estricto de directrices de marca

Diseño del Sistema de Descripciones de IA:

  1. Apoyo en la Consistencia de Marca:
    • Descripción precisa de directrices de marca
    • Descripción de color precisa para asegurar la representación de marca
  2. Mejora de la Colaboración en Equipo:
    • Descripciones de panorama general (apariencia visual general)
    • Descripciones a nivel de objeto (como grupos de notas adhesivas)
    • Seguimiento de la posición del cursor de colaboradores (como agente de enfoque visual)

Puntos de Innovación Tecnológica

  1. Descripciones Conscientes del Contexto: Personalizar el contenido y nivel de detalle de las descripciones según las necesidades específicas de tareas profesionales
  2. Arquitectura de Información Multinivel: Proporcionar información visual jerárquica de lo macro a lo micro
  3. Apoyo a la Colaboración en Tiempo Real: Integrar retroalimentación visual dinámica en los flujos de trabajo de equipo
  4. Adaptación Personalizada: Ajustar estrategias de descripción basadas en el rol del usuario y tipo de tarea

Configuración Experimental

Nota: Este artículo es un artículo de taller que proporciona principalmente recomendaciones de diseño y un marco conceptual, sin incluir configuración experimental y resultados en el sentido tradicional.

Fundamentos Teóricos

  • Basado en análisis de literatura existente sobre desafíos enfrentados por creadores de contenido BLV
  • Referencia a investigación sobre sistemas de asistencia de edición visual (como el sistema de edición de video de texto de Huh et al.)
  • Integración de trabajo relacionado con la accesibilidad en la creación de gráficos digitales

Métodos de Validación de Diseño

  • Validar la universalidad del problema a través de revisión de literatura
  • Analizar requisitos de diseño basados en limitaciones de sistemas existentes
  • Hacer referencia a casos de éxito en campos relacionados para inspiración de diseño

Trabajo Relacionado

Tecnología de Asistencia para Creación de Contenido Visual

  1. EditScribe de Chang et al.: Utiliza ciclos de verificación de lenguaje natural para apoyar la edición de imágenes no visual para población BLV
  2. AVScript de Huh et al.: Sistema de edición de video de texto que integra descripciones visuales y voz
  3. A11yboard de Zhang et al.: Investigación sobre accesibilidad en pizarras digitales

Participación de Contenido Digital de Población BLV

  1. Participación en Redes Sociales: Creadores BLV compartiendo vida cotidiana y participando en economía creativa en plataformas de video
  2. Investigación sobre Barreras de Acceso: Dificultades en la creación de contenido visualmente atractivo, problemas de verificación de funciones de filtro, desafíos en el seguimiento de tendencias

Colaboración de Habilidades Mixtas

  1. Herramientas de Colaboración en Tiempo Real: Mejoras en colaboración de habilidades mixtas en editores de texto y software de presentación
  2. Accesibilidad en Entornos Colaborativos: Accesibilidad en actividades colaborativas orientadas visualmente (diagramas de flujo, discusiones en pizarra)

Conclusiones y Discusión

Conclusiones Principales

  1. Redefinición de la Alfabetización Visual: La población BLV posee una comprensión visual profunda; la tecnología debe apoyar y mejorar en lugar de asumir su ausencia
  2. Mejora Sistemática de la Inclusión Laboral: A través de la innovación tecnológica, se pueden reducir gradualmente los prejuicios y mejorar la autonomía, inclusión y desarrollo de habilidades de la población BLV
  3. Importancia de Descripciones Personalizadas: Diferentes escenarios profesionales requieren estrategias de descripción visual personalizadas

Mecanismos de Impacto a Largo Plazo

Citando el punto de vista de Georgina Kleege: "En promedio, una persona completamente ciega de nacimiento entiende mucho más sobre lo que significa lo visual que lo que una persona con visión promedio entiende sobre lo que significa ser ciego."

Efectos Esperados:

  • Mejora de la Autonomía: Reducir la dependencia de asistencia de otros
  • Mejora de la Inclusión: Promover prácticas de diseño más inclusivas y cultura laboral
  • Desarrollo de Habilidades: Apoyar a profesionales BLV en demostrar capacidades creativas

Evaluación Profunda

Fortalezas

  1. Fuerte Orientación al Problema: Aborda directamente las barreras principales de participación laboral de la población BLV
  2. Pensamiento de Diseño Innovador: Propone el concepto de sistemas de descripciones de IA contextualizados y personalizados
  3. Alto Valor Práctico: Proporciona recomendaciones de diseño específicas y operacionales
  4. Fundamentos Teóricos Sólidos: Cita ampliamente literatura relevante con argumentación suficiente
  5. Significado Social Importante: Aborda los derechos de igualdad laboral de grupos vulnerables

Limitaciones

  1. Falta de Validación Empírica: Como artículo conceptual, carece de investigación con usuarios y evaluación de sistemas
  2. Detalles Insuficientes de Implementación Técnica: Descripción limitada de la arquitectura técnica específica del sistema de IA
  3. Análisis de Escalabilidad Incompleto: No profundiza en la aplicabilidad de recomendaciones de diseño en otros escenarios profesionales
  4. Falta de Análisis de Costo-Beneficio: No considera los costos reales de desarrollo e implementación del sistema

Impacto

  1. Contribución Académica: Proporciona nuevas perspectivas de diseño para investigación en tecnología de accesibilidad
  2. Orientación Práctica: Proporciona orientación de diseño específica para desarrolladores de tecnología relacionada
  3. Inspiración Política: Puede influir en la formulación de políticas de accesibilidad laboral
  4. Valor Social: Promueve el reconocimiento social de las capacidades profesionales de la población BLV

Escenarios Aplicables

  1. Industria de Creación de Contenido: Campos como producción de video, diseño gráfico, creatividad de marketing, etc.
  2. Entornos de Trabajo Colaborativo: Escenarios de trabajo en equipo que requieren colaboración visual en tiempo real
  3. Educación y Capacitación: Apoyo en capacitación de habilidades visuales y desarrollo profesional
  4. Desarrollo Tecnológico: Desarrollo de herramientas de asistencia de IA y productos de tecnología de accesibilidad

Direcciones de Investigación Futura

  1. Investigación con Usuarios: Comprender profundamente las necesidades específicas de profesionales BLV en diferentes ocupaciones
  2. Implementación Técnica: Desarrollar sistemas prototipo y validar viabilidad técnica
  3. Evaluación de Efectos: Diseñar sistema de métricas de evaluación y verificar el impacto del sistema en la eficiencia laboral y satisfacción del usuario
  4. Expansión Interdisciplinaria: Explorar la aplicabilidad de principios de diseño en otros campos profesionales
  5. Consideraciones Éticas: Investigar posibles sesgos e problemas de privacidad que puedan surgir de sistemas de descripciones de IA

Resumen: Este artículo propone una dirección de investigación importante y prospectiva, proporcionando mejor apoyo laboral a profesionales BLV a través de tecnología de IA generativa. Aunque como investigación conceptual carece de validación empírica, sus perspectivas de diseño y valor social merecen investigación más profunda y exploración de aplicación práctica.