Many blind and low vision (BLV) people are excluded from professional roles that may involve visual tasks due to access barriers and persisting stigmas. Advancing generative AI systems can support BLV people through providing contextual and personalized visual descriptions for creation, critique, and consumption. In this workshop paper, we provide design suggestions for how visual descriptions can be better contextualized for multiple professional tasks. We conclude by discussing how these designs can improve autonomy, inclusion, and skill development over time.
- पेपर आईडी: 2510.08991
- शीर्षक: Creation, Critique, and Consumption: Exploring Generative AI Descriptions for Supporting Blind and Low Vision Professionals with Visual Tasks
- लेखक: Lucy Jiang, Lotus Zhang, Leah Findlater (University of Washington)
- वर्गीकरण: cs.HC (मानव-कंप्यूटर इंटरैक्शन)
- प्रकाशन समय/सम्मेलन: ASSETS '25 Workshop: AT @ Work, Virtual 2025
- पेपर लिंक: https://arxiv.org/abs/2510.08991
कई दृष्टिहीन और निम्न दृष्टि वाले (BLV) व्यक्ति पहुंच बाधाओं और व्याप्त पूर्वाग्रहों के कारण ऐसी व्यावसायिक भूमिकाओं से बाहर रखे जाते हैं जिनमें दृश्य कार्य शामिल हो सकते हैं। उन्नत जनरेटिव एआई सिस्टम निर्माण, आलोचना और उपभोग के लिए संदर्भित और व्यक्तिगतकृत दृश्य विवरण प्रदान करके BLV व्यक्तियों का समर्थन कर सकते हैं। इस कार्यशाला पेपर में, लेखक विभिन्न व्यावसायिक कार्यों के लिए संदर्भित दृश्य विवरण बेहतर तरीके से प्रदान करने के बारे में डिजाइन सिफारिशें प्रदान करते हैं, और चर्चा करते हैं कि ये डिजाइन समय के साथ स्वायत्तता, समावेशिता और कौशल विकास को कैसे सुधार सकते हैं।
- गंभीर रोजगार अंतराल: विकलांग व्यक्तियों की रोजगार दर गैर-विकलांग व्यक्तियों की तुलना में लगभग एक तिहाई है, BLV व्यक्तियों को रोजगार बाधाओं का विशेष सामना करना पड़ता है
- दृश्य कार्य कार्यस्थल की बाधा बन गए हैं: आधुनिक कार्यस्थल में दृश्य संचार से जुड़े कई कार्य (जैसे स्लाइड बनाना, दस्तावेज़ों को प्रारूपित करना, फोटो लेना, प्रशिक्षण वीडियो देखना आदि) BLV पेशेवरों के लिए मुख्य बाधा बन गए हैं
- पारंपरिक सहायक प्रौद्योगिकी की सीमाएं: मौजूदा पहुंच समाधान मुख्य रूप से बुनियादी दृश्य जानकारी तक पहुंच प्रदान करने तक सीमित हैं, न कि पूर्ण कार्यस्थल भागीदारी को सक्षम करने के लिए
- जनरेटिव एआई प्रौद्योगिकी के तीव्र विकास ने संदर्भित, व्यक्तिगतकृत दृश्य विवरण प्रदान करने के लिए नई संभावनाएं बनाई हैं
- बुनियादी जानकारी पहुंच से परे जाने की आवश्यकता है, दृश्य संचार कार्यों में BLV पेशेवरों की व्यापक भागीदारी का समर्थन करना
- प्रौद्योगिकी नवाचार के माध्यम से रोजगार बाधाओं को तोड़ना, BLV व्यक्तियों की कार्यस्थल समावेशिता को बढ़ाना
- व्यावसायिक दृश्य विवरण प्रणाली के लिए डिजाइन ढांचा प्रस्तावित किया: विभिन्न व्यावसायिक परिदृश्यों के लिए संदर्भित और व्यक्तिगतकृत एआई विवरण सेवा प्रदान करना
- दो ठोस अनुप्रयोग परिदृश्य बनाए: स्वतंत्र सामग्री निर्माताओं के लिए वीडियो निर्माण और बड़ी विज्ञापन कंपनियों के लिए विपणन सामग्री निर्माण
- व्यवस्थित डिजाइन सिफारिशें प्रदान कीं: निर्माण, आलोचना, उपभोग तीन आयामों में दृश्य कार्य समर्थन को शामिल करते हुए
- दीर्घकालिक प्रभाव तंत्र को स्पष्ट किया: विश्लेषण किया कि ये डिजाइन BLV पेशेवरों की स्वायत्तता, समावेशिता और कौशल विकास को कैसे सुधार सकते हैं
यह अनुसंधान BLV पेशेवरों को समर्थन देने वाली जनरेटिव एआई दृश्य विवरण प्रणाली डिजाइन पर केंद्रित है, जिसमें तीन मुख्य कार्य आयाम शामिल हैं:
- निर्माण (Creation): BLV व्यक्तियों को दृश्य सामग्री बनाने में सहायता करना
- आलोचना (Critique): दृश्य कार्यों के मूल्यांकन और प्रतिक्रिया का समर्थन करना
- उपभोग (Consumption): दृश्य जानकारी को समझने और संसाधित करने में सहायता करना
मुख्य आवश्यकता विश्लेषण:
- दृश्य प्रवृत्तियों की पहचान करने में कठिनाई
- शूटिंग संरचना और विषय स्थिति की चुनौतियां
- पोस्ट-प्रोडक्शन दृश्य प्रभाव सत्यापन की आवश्यकता
एआई विवरण प्रणाली डिजाइन:
- प्रवृत्ति पहचान समर्थन: लोकप्रिय ऑडियो ट्रैक के सामान्य दृश्य साथी तत्वों का विवरण (हाथ के इशारे, स्क्रीन पाठ आदि)
- शूटिंग प्रक्रिया सहायता:
- शूटिंग विषय को फ्रेम में आदर्श स्थिति में सुनिश्चित करना
- कलात्मक संरचना में सहायता के लिए विस्तृत सामग्री विवरण प्रदान करना
- संपादन प्रक्रिया वृद्धि:
- वीडियो के रंग तापमान का विवरण
- फिल्टर और प्रभावों की सटीकता का मूल्यांकन
- सामग्री संपादन से परे कलात्मक जानकारी प्रदान करना
मुख्य चुनौतियां:
- सहयोगी कार्यप्रवाह की जटिलता
- बहु-प्रारूप सामग्री निर्माण की आवश्यकता
- तीव्र पुनरावृत्ति और वास्तविक समय सहयोग की आवश्यकता
- कठोर ब्रांड दिशानिर्देश अनुपालन
एआई विवरण प्रणाली डिजाइन:
- ब्रांड संगति समर्थन:
- सटीक ब्रांड दिशानिर्देश विवरण
- ब्रांड प्रतिनिधित्व सुनिश्चित करने के लिए सटीक रंग विवरण
- टीम सहयोग वृद्धि:
- बड़ी तस्वीर विवरण (समग्र दृश्य उपस्थिति)
- वस्तु-स्तर विवरण (जैसे स्टिकी नोट समूह)
- सहयोगी कर्सर स्थिति ट्रैकिंग (दृश्य फोकस एजेंट के रूप में)
- संदर्भ-जागरूक विवरण: विशिष्ट व्यावसायिक कार्य आवश्यकताओं के अनुसार विवरण सामग्री और विस्तार को अनुकूलित करना
- बहु-स्तरीय जानकारी आर्किटेक्चर: मैक्रो से माइक्रो तक स्तरीय दृश्य जानकारी प्रदान करना
- वास्तविक समय सहयोग समर्थन: टीम कार्यप्रवाह के गतिशील दृश्य प्रतिक्रिया को एकीकृत करना
- व्यक्तिगतकृत अनुकूलन: उपयोगकर्ता भूमिका और कार्य प्रकार के आधार पर विवरण रणनीति को समायोजित करना
नोट: यह पेपर एक कार्यशाला पेपर है, मुख्य रूप से डिजाइन सिफारिशें और वैचारिक ढांचा प्रदान करता है, पारंपरिक अर्थ में प्रायोगिक सेटअप और परिणाम शामिल नहीं हैं।
- BLV सामग्री निर्माताओं द्वारा सामना की जाने वाली चुनौतियों के विश्लेषण पर मौजूदा साहित्य के आधार पर
- पहले से मौजूद दृश्य संपादन सहायता प्रणाली अनुसंधान का संदर्भ (जैसे Huh आदि की पाठ वीडियो संपादन प्रणाली)
- डिजिटल ग्राफिक्स निर्माण पहुंच के संबंधित कार्य को संयोजित करना
- साहित्य समीक्षा के माध्यम से समस्या की सार्वभौमिकता को सत्यापित करना
- मौजूदा प्रणालियों की सीमाओं के विश्लेषण के आधार पर डिजाइन आवश्यकताएं
- संबंधित क्षेत्रों के सफल मामलों का संदर्भ लेकर डिजाइन प्रेरणा
- Chang आदि की EditScribe: BLV व्यक्तियों के गैर-दृश्य छवि संपादन का समर्थन करने के लिए प्राकृतिक भाषा सत्यापन चक्र का उपयोग
- Huh आदि की AVScript: पाठ वीडियो संपादन प्रणाली, दृश्य विवरण और भाषण को एकीकृत करना
- Zhang आदि की A11yboard: डिजिटल ड्राइंग बोर्ड पहुंच अनुसंधान
- सोशल मीडिया प्लेटफॉर्म भागीदारी: वीडियो प्लेटफॉर्म पर BLV निर्माताओं की दैनिक जीवन साझाकरण और निर्माण अर्थव्यवस्था भागीदारी
- पहुंच बाधा अनुसंधान: दृश्य आकर्षक सामग्री निर्माण कठिनाई, फिल्टर कार्य सत्यापन समस्याएं, प्रवृत्ति ट्रैकिंग चुनौतियां
- वास्तविक समय सहयोग उपकरण: पाठ संपादक और स्लाइड सॉफ्टवेयर की मिश्रित क्षमता सहयोग सुधार
- सहयोग वातावरण पहुंच: दृश्य-निर्देशित सहयोग गतिविधियों की पहुंच (वायरफ्रेम, व्हाइटबोर्ड चर्चा)
- दृश्य साक्षरता की पुनर्परिभाषा: BLV व्यक्तियों के पास गहन दृश्य समझ क्षमता है, प्रौद्योगिकी को समर्थन और वृद्धि करनी चाहिए न कि इसकी कमी मान लेनी चाहिए
- कार्यस्थल समावेशिता में व्यवस्थित सुधार: प्रौद्योगिकी नवाचार के माध्यम से पूर्वाग्रह को क्रमिक रूप से कम किया जा सकता है, BLV व्यक्तियों की स्वायत्तता, समावेशिता और कौशल विकास में सुधार
- व्यक्तिगतकृत विवरण की महत्ता: विभिन्न व्यावसायिक परिदृश्यों को अनुकूलित दृश्य विवरण रणनीति की आवश्यकता है
Georgina Kleege के विचार का उद्धरण: "औसतन, एक पूर्ण, जन्मजात अंधा व्यक्ति दृश्य का अर्थ क्या है इसके बारे में औसत दृष्टि वाले व्यक्ति की तुलना में बहुत अधिक समझता है कि अंधापन का अर्थ क्या है।"
अपेक्षित प्रभाव:
- स्वायत्तता वृद्धि: दूसरों की सहायता पर निर्भरता में कमी
- समावेशिता सुधार: अधिक समावेशी डिजाइन प्रथाओं और कार्य संस्कृति को बढ़ावा देना
- कौशल विकास: BLV पेशेवरों को रचनात्मक क्षमता प्रदर्शित करने में समर्थन
- समस्या-केंद्रित दृष्टिकोण: BLV व्यक्तियों की कार्यस्थल भागीदारी की मुख्य बाधाओं को सीधे संबोधित करता है
- डिजाइन विचार नवाचार: संदर्भित, व्यक्तिगतकृत एआई विवरण प्रणाली की अवधारणा प्रस्तावित करता है
- उच्च व्यावहारिक मूल्य: ठोस, कार्यान्वयन योग्य डिजाइन सिफारिशें प्रदान करता है
- मजबूत सैद्धांतिक आधार: संबंधित साहित्य का पर्याप्त संदर्भ, पूर्ण तर्क
- महत्वपूर्ण सामाजिक मूल्य: कमजोर समूहों के कार्यस्थल समान अधिकारों पर ध्यान केंद्रित करता है
- अनुभवजन्य सत्यापन की कमी: वैचारिक पेपर के रूप में, उपयोगकर्ता अनुसंधान और प्रणाली मूल्यांकन की कमी है
- तकनीकी कार्यान्वयन विवरण अपर्याप्त: एआई प्रणाली के विशिष्ट तकनीकी आर्किटेक्चर का विवरण सीमित है
- स्केलेबिलिटी विश्लेषण की कमी: डिजाइन सिफारिशों की अन्य व्यावसायिक परिदृश्यों में प्रयोज्यता पर गहन चर्चा नहीं
- लागत-लाभ विश्लेषण की कमी: प्रणाली विकास और तैनाती की वास्तविक लागत पर विचार नहीं किया गया
- शैक्षणिक योगदान: पहुंच प्रौद्योगिकी अनुसंधान के लिए नई डिजाइन सोच प्रदान करता है
- व्यावहारिक मार्गदर्शन: संबंधित प्रौद्योगिकी विकासकर्ताओं को ठोस डिजाइन मार्गदर्शन प्रदान करता है
- नीति प्रेरणा: कार्यस्थल पहुंच नीति निर्माण को प्रभावित कर सकता है
- सामाजिक मूल्य: BLV समूह की व्यावसायिक क्षमता के बारे में सामाजिक पुनर्विचार को बढ़ावा देता है
- सामग्री निर्माण उद्योग: वीडियो निर्माण, ग्राफिक डिजाइन, विपणन रचनात्मकता आदि क्षेत्र
- सहयोगी कार्य वातावरण: वास्तविक समय दृश्य सहयोग की आवश्यकता वाली टीम कार्य परिदृश्य
- शिक्षा प्रशिक्षण: दृश्य कौशल प्रशिक्षण और व्यावसायिक विकास समर्थन
- प्रौद्योगिकी विकास: एआई सहायता उपकरण और पहुंच प्रौद्योगिकी उत्पाद विकास
- उपयोगकर्ता अनुसंधान: विभिन्न व्यावसायिक BLV पेशेवरों की विशिष्ट आवश्यकताओं को गहराई से समझना
- तकनीकी कार्यान्वयन: प्रोटोटाइप प्रणाली विकास और तकनीकी व्यवहार्यता सत्यापन
- प्रभाव मूल्यांकन: मूल्यांकन संकेतक प्रणाली डिजाइन करना, उपयोगकर्ता कार्य दक्षता और संतुष्टि पर प्रणाली के प्रभाव को सत्यापित करना
- क्रॉस-डोमेन विस्तार: अन्य व्यावसायिक क्षेत्रों में डिजाइन सिद्धांतों की प्रयोज्यता की खोज
- नैतिक विचार: एआई विवरण प्रणाली द्वारा लाए जा सकने वाले पूर्वाग्रह और गोपनीयता समस्याओं का अनुसंधान
सारांश: यह पेपर एक महत्वपूर्ण और दूरदर्शी अनुसंधान दिशा प्रस्तावित करता है, जनरेटिव एआई प्रौद्योगिकी के माध्यम से BLV पेशेवरों को बेहतर कार्यस्थल समर्थन प्रदान करता है। हालांकि वैचारिक अनुसंधान के रूप में अनुभवजन्य सत्यापन की कमी है, लेकिन इसके डिजाइन विचार और सामाजिक मूल्य आगे के गहन अनुसंधान और व्यावहारिक अनुप्रयोग अन्वेषण के योग्य हैं।