Many blind and low vision (BLV) people are excluded from professional roles that may involve visual tasks due to access barriers and persisting stigmas. Advancing generative AI systems can support BLV people through providing contextual and personalized visual descriptions for creation, critique, and consumption. In this workshop paper, we provide design suggestions for how visual descriptions can be better contextualized for multiple professional tasks. We conclude by discussing how these designs can improve autonomy, inclusion, and skill development over time.
- ID Articolo: 2510.08991
- Titolo: Creation, Critique, and Consumption: Exploring Generative AI Descriptions for Supporting Blind and Low Vision Professionals with Visual Tasks
- Autori: Lucy Jiang, Lotus Zhang, Leah Findlater (University of Washington)
- Classificazione: cs.HC (Interazione Uomo-Computer)
- Data di Pubblicazione/Conferenza: ASSETS '25 Workshop: AT @ Work, Virtual 2025
- Link dell'Articolo: https://arxiv.org/abs/2510.08991
Molte persone cieche e ipovedenti (BLV) sono escluse da ruoli professionali che potrebbero comportare attività visive a causa di barriere di accesso e pregiudizi persistenti. I sistemi avanzati di IA generativa possono supportare le persone BLV fornendo descrizioni visive contestualizzate e personalizzate per la creazione, la critica e il consumo. In questo articolo di workshop, gli autori forniscono raccomandazioni di progettazione su come fornire meglio descrizioni visive contestualizzate per molteplici attività professionali e discutono come questi progetti possono migliorare nel tempo l'autonomia, l'inclusione e lo sviluppo delle competenze.
- Divario Occupazionale Significativo: Il tasso di occupazione delle persone con disabilità è circa un terzo di quello delle persone senza disabilità, con barriere occupazionali particolarmente evidenti per le persone BLV
- Attività Visive come Ostacolo Professionale: Nel moderno ambiente di lavoro, numerosi compiti che coinvolgono la comunicazione visiva (come la creazione di presentazioni, la formattazione di documenti, la fotografia, la visualizzazione di video di formazione) rappresentano ostacoli significativi per i professionisti BLV
- Limitazioni della Tecnologia Assistiva Tradizionale: Le soluzioni di accessibilità esistenti si limitano principalmente a fornire accesso alle informazioni visive di base, piuttosto che consentire la partecipazione completa al lavoro
- Lo sviluppo rapido della tecnologia di IA generativa crea nuove opportunità per fornire descrizioni visive contestualizzate e personalizzate
- È necessario andare oltre l'accesso alle informazioni di base per supportare la partecipazione completa dei professionisti BLV nei compiti di comunicazione visiva
- L'innovazione tecnologica può abbattere le barriere occupazionali e migliorare l'inclusione sul posto di lavoro per le persone BLV
- Propone un Framework di Progettazione per Sistemi di Descrizione Visiva Specializzati: Fornisce servizi di descrizione IA contestualizzati e personalizzati per diversi scenari professionali
- Costruisce Due Scenari Applicativi Concreti: Produzione video per creatori di contenuti indipendenti e creazione di materiali di marketing per grandi agenzie pubblicitarie
- Fornisce Raccomandazioni di Progettazione Sistematiche: Copre il supporto per attività visive attraverso tre dimensioni: creazione, critica e consumo
- Illustra i Meccanismi di Impatto a Lungo Termine: Analizza come questi progetti possono migliorare l'autonomia, l'inclusione e lo sviluppo delle competenze dei professionisti BLV
Questa ricerca si concentra sulla progettazione di sistemi di descrizione visiva generati da IA per supportare i professionisti BLV, coprendo tre dimensioni di compiti fondamentali:
- Creazione (Creation): Assistere le persone BLV nella creazione di contenuti visivi
- Critica (Critique): Supportare la valutazione e il feedback su opere visive
- Consumo (Consumption): Aiutare nella comprensione e nell'elaborazione di informazioni visive
Analisi delle Esigenze Fondamentali:
- Difficoltà nell'identificazione delle tendenze visive
- Sfide nella composizione e nel posizionamento del soggetto
- Necessità di verifica degli effetti visivi nella post-produzione
Progettazione del Sistema di Descrizione IA:
- Supporto per l'Identificazione delle Tendenze: Descrizione degli elementi visivi comuni associati alle tracce musicali popolari (gesti, testo sullo schermo, ecc.)
- Assistenza nel Processo di Ripresa:
- Garantire il posizionamento ideale del soggetto nel fotogramma
- Fornire descrizioni dettagliate dei contenuti per assistere la composizione artistica
- Miglioramento del Processo di Editing:
- Descrizione della temperatura del colore del video
- Valutazione dell'accuratezza di filtri ed effetti speciali
- Fornitura di informazioni artistiche oltre l'editing dei contenuti
Sfide Fondamentali:
- Complessità dei flussi di lavoro collaborativi
- Esigenze di produzione di contenuti in più formati
- Requisiti di iterazione rapida e collaborazione in tempo reale
- Rigoroso rispetto delle linee guida del marchio
Progettazione del Sistema di Descrizione IA:
- Supporto per la Coerenza del Marchio:
- Descrizione precisa delle linee guida del marchio
- Descrizione accurata dei colori per garantire la rappresentazione del marchio
- Miglioramento della Collaborazione di Team:
- Descrizione della visione d'insieme (aspetto visivo complessivo)
- Descrizione a livello di oggetto (come gruppi di note adesive)
- Tracciamento della posizione del cursore dei collaboratori (come proxy del fuoco visivo)
- Descrizione Consapevole del Contesto: Personalizzazione del contenuto e del livello di dettaglio della descrizione in base alle esigenze specifiche dei compiti professionali
- Architettura Informativa Multilivello: Fornitura di informazioni visive stratificate dal livello macro a quello micro
- Supporto per la Collaborazione in Tempo Reale: Integrazione del feedback visivo dinamico nei flussi di lavoro di team
- Adattamento Personalizzato: Regolazione della strategia di descrizione in base al ruolo dell'utente e al tipo di compito
Nota: Questo articolo è un articolo di workshop che fornisce principalmente raccomandazioni di progettazione e framework concettuali, senza includere configurazioni e risultati sperimentali nel senso tradizionale.
- Basato sull'analisi della letteratura esistente sulle sfide affrontate dai creatori di contenuti BLV
- Riferimento alla ricerca su sistemi di assistenza all'editing visivo (come il sistema di editing video testuale di Huh et al.)
- Integrazione di lavori correlati sull'accessibilità della creazione di grafica digitale
- Verifica dell'universalità del problema attraverso revisione della letteratura
- Analisi dei requisiti di progettazione basata sulle limitazioni dei sistemi esistenti
- Ispirazione dalla progettazione facendo riferimento a casi di successo in campi correlati
- EditScribe di Chang et al.: Utilizza cicli di verifica del linguaggio naturale per supportare l'editing di immagini non visive per persone BLV
- AVScript di Huh et al.: Sistema di editing video testuale che integra descrizioni visive e voce
- A11yboard di Zhang et al.: Ricerca sull'accessibilità delle lavagne digitali
- Partecipazione ai Social Media: Condivisione della vita quotidiana e partecipazione all'economia creativa dei creatori BLV su piattaforme video
- Ricerca sulle Barriere di Accesso: Difficoltà nella creazione di contenuti visivamente attraenti, problemi di verifica delle funzioni di filtro, sfide nel tracciamento delle tendenze
- Strumenti di Collaborazione in Tempo Reale: Miglioramenti della collaborazione con abilità miste negli editor di testo e software di presentazione
- Accessibilità dell'Ambiente Collaborativo: Accessibilità delle attività collaborative orientate visivamente (wireframing, discussioni su lavagna bianca)
- Ridefinizione dell'Alfabetizzazione Visiva: Le persone BLV possiedono una profonda capacità di comprensione visiva; la tecnologia dovrebbe supportare e migliorare piuttosto che presumere la sua assenza
- Miglioramento Sistematico dell'Inclusione sul Posto di Lavoro: L'innovazione tecnologica può ridurre gradualmente i pregiudizi e migliorare l'autonomia, l'inclusione e lo sviluppo delle competenze delle persone BLV
- Importanza della Descrizione Personalizzata: Diversi scenari professionali richiedono strategie di descrizione visiva personalizzate
Citando il punto di vista di Georgina Kleege: "In media, una persona completamente cieca dalla nascita comprende cosa significhi la vista molto più di quanto una persona con vista media comprenda cosa significhi essere cieco."
Effetti Previsti:
- Aumento dell'Autonomia: Riduzione della dipendenza dall'assistenza di altri
- Miglioramento dell'Inclusione: Promozione di pratiche di progettazione più inclusive e cultura del lavoro
- Sviluppo delle Competenze: Supporto per i professionisti BLV nel dimostrare le loro capacità creative
- Forte Orientamento al Problema: Affronta direttamente gli ostacoli fondamentali alla partecipazione sul posto di lavoro delle persone BLV
- Approccio di Progettazione Innovativo: Propone il concetto di sistemi di descrizione IA contestualizzati e personalizzati
- Alto Valore Pratico: Fornisce raccomandazioni di progettazione concrete e attuabili
- Fondamenti Teorici Solidi: Ampi riferimenti alla letteratura correlata con argomentazioni ben fondate
- Significato Sociale Rilevante: Affronta i diritti di uguaglianza sul posto di lavoro dei gruppi svantaggiati
- Mancanza di Verifica Empirica: Come articolo concettuale, manca di ricerca con utenti e valutazione del sistema
- Dettagli di Implementazione Tecnica Insufficienti: Descrizione limitata dell'architettura tecnica specifica del sistema IA
- Analisi di Scalabilità Carente: Discussione insufficiente sull'applicabilità delle raccomandazioni di progettazione in altri scenari professionali
- Analisi Costi-Benefici Mancante: Mancata considerazione dei costi effettivi di sviluppo e distribuzione del sistema
- Contributo Accademico: Fornisce nuovi approcci di progettazione per la ricerca sulla tecnologia di accessibilità
- Guida Pratica: Fornisce orientamenti di progettazione concreti per gli sviluppatori di tecnologie correlate
- Ispirazione Politica: Potrebbe influenzare la formulazione di politiche di accessibilità sul posto di lavoro
- Valore Sociale: Promuove la rivalutazione sociale delle capacità professionali del gruppo BLV
- Industria della Creazione di Contenuti: Produzione video, progettazione grafica, creatività di marketing e altri campi
- Ambienti di Lavoro Collaborativo: Scenari di lavoro di team che richiedono collaborazione visiva in tempo reale
- Educazione e Formazione: Supporto alla formazione di competenze visive e sviluppo professionale
- Sviluppo Tecnologico: Sviluppo di strumenti assistiti da IA e prodotti di tecnologia di accessibilità
- Ricerca con Utenti: Comprensione approfondita delle esigenze specifiche dei professionisti BLV in diversi settori
- Implementazione Tecnica: Sviluppo di sistemi prototipali e verifica della fattibilità tecnica
- Valutazione dell'Efficacia: Progettazione di un sistema di metriche di valutazione per verificare l'impatto del sistema sull'efficienza lavorativa e la soddisfazione dell'utente
- Espansione Interdisciplinare: Esplorazione dell'applicabilità dei principi di progettazione in altri settori professionali
- Considerazioni Etiche: Ricerca su possibili pregiudizi e problemi di privacy derivanti dai sistemi di descrizione IA
Sintesi: Questo articolo propone una direzione di ricerca importante e lungimirante, fornendo un migliore supporto sul posto di lavoro ai professionisti BLV attraverso la tecnologia di IA generativa. Sebbene come ricerca concettuale manchi di verifica empirica, il suo approccio di progettazione e il suo valore sociale meritano ulteriori ricerche approfondite ed esplorazioni di applicazioni pratiche.