2025-11-18T14:58:13.668903

Auction Design using Value Prediction with Hallucinations

Lobel, Moreira, Mouchtaki
We investigate a Bayesian mechanism design problem where a seller seeks to maximize revenue by selling an indivisible good to one of n buyers, incorporating potentially unreliable predictions (signals) of buyers' private values derived from a machine learning model. We propose a framework where these signals are sometimes reflective of buyers' true valuations but other times are hallucinations, which are uncorrelated with the buyers' true valuations. Our main contribution is a characterization of the optimal auction under this framework. Our characterization establishes a near-decomposition of how to treat types above and below the signal. For the one buyer case, the seller's optimal strategy is to post one of three fairly intuitive prices depending on the signal, which we call the "ignore", "follow" and "cap" actions.
academic

हॉलुसिनेशन के साथ मूल्य पूर्वानुमान का उपयोग करके नीलामी डिजाइन

बुनियादी जानकारी

  • पेपर ID: 2502.08792
  • शीर्षक: Auction Design using Value Prediction with Hallucinations
  • लेखक: Ilan Lobel (NYU Stern), Humberto Moreira (FGV/EPGE), Omar Mouchtaki (NYU Stern)
  • वर्गीकरण: cs.GT (गेम थ्योरी), cs.AI (कृत्रिम बुद्धिमत्ता)
  • प्रकाशन समय: 10 फरवरी 2025 (मूल संस्करण), 6 अक्टूबर 2025 (वर्तमान संस्करण)
  • पेपर लिंक: https://arxiv.org/abs/2502.08792

सारांश

यह पेपर एक बेयेसियन तंत्र डिजाइन समस्या का अध्ययन करता है, जहां विक्रेता n खरीदारों में से एक को अविभाज्य वस्तु बेचकर राजस्व को अधिकतम करना चाहता है, और मशीन लर्निंग मॉडल से प्राप्त खरीदारों के निजी मूल्य के संभावित अविश्वसनीय पूर्वानुमान (संकेत) को शामिल करता है। लेखकों ने एक ढांचा प्रस्तावित किया है, जिसमें ये संकेत कभी-कभी खरीदार के वास्तविक मूल्यांकन को प्रतिबिंबित करते हैं, लेकिन कभी-कभी खरीदार के वास्तविक मूल्यांकन से असंबंधित "हॉलुसिनेशन" होते हैं। मुख्य योगदान इस ढांचे के तहत इष्टतम नीलामी की विशेषता है, जो संकेत के ऊपर और नीचे के प्रकारों को संभालने के लिए अनुमानित अपघटन स्थापित करता है। एकल खरीदार के मामले में, विक्रेता की इष्टतम रणनीति संकेत के आधार पर तीन सहज मूल्यों में से एक को प्रकाशित करना है, जिसे "अनदेखा करना", "अनुसरण करना" और "सीमा लगाना" कार्य कहा जाता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

यह पेपर जो मूल समस्या हल करना चाहता है: आधुनिक मशीन लर्निंग मॉडल (विशेष रूप से बड़े भाषा मॉडल और गहन तंत्रिका नेटवर्क) के "हॉलुसिनेशन" की पृष्ठभूमि में इष्टतम नीलामी तंत्र कैसे डिजाइन करें। ये मॉडल कभी-कभी ऐसे आउटपुट उत्पन्न करते हैं जो उच्च गुणवत्ता प्रतीत होते हैं लेकिन वास्तव में वास्तविक लक्ष्य मात्रा से पूरी तरह असंबंधित होते हैं।

महत्व

  1. व्यावहारिक अनुप्रयोग मूल्य: विज्ञापन नीलामी जैसे व्यावहारिक अनुप्रयोगों में, विक्रेता अक्सर खरीदारों के मूल्यांकन की भविष्यवाणी करने के लिए मशीन लर्निंग मॉडल का उपयोग करते हैं, लेकिन ये भविष्यवाणियां अविश्वसनीय हो सकती हैं
  2. सैद्धांतिक चुनौती: शास्त्रीय Myerson (1981) नीलामी सिद्धांत को सीधे उन स्थितियों में लागू नहीं किया जा सकता जहां पश्च वितरण में निरंतर घनत्व नहीं होता है
  3. तकनीकी विकास प्रवृत्ति: LLMs और गहन तंत्रिका नेटवर्क के व्यापक अनुप्रयोग के साथ, हॉलुसिनेशन समस्या तेजी से महत्वपूर्ण हो गई है

मौजूदा विधियों की सीमाएं

  1. पारंपरिक तंत्र डिजाइन: केवल पूर्व वितरण जानकारी मानता है, मशीन लर्निंग भविष्यवाणी पर विचार नहीं करता है
  2. सीखने से बढ़ी हुई एल्गोरिदम: आमतौर पर प्रतिकूल त्रुटि धारणा अपनाते हैं, यादृच्छिक त्रुटि नहीं
  3. शास्त्रीय संकेत मॉडल: संकेत त्रुटि को गाऊसी शोर मानता है, हॉलुसिनेशन की वैश्विक विशेषताओं को नहीं पकड़ सकता है

मुख्य योगदान

  1. नवीन बेयेसियन ढांचा: पहली बार मशीन लर्निंग मॉडल की हॉलुसिनेशन घटना को नीलामी सिद्धांत में शामिल किया, जहां संकेत या तो सटीक है या पूरी तरह यादृच्छिक है, का द्विआधारी मॉडल स्थापित किया
  2. इष्टतम नीलामी की पूर्ण विशेषता: Monteiro और Svaiter (2010) की तकनीकों का विस्तार किया, जहां पश्च वितरण में घनत्व नहीं है, के लिए इष्टतम नीलामी का बंद-रूप समाधान दिया
  3. अनुमानित अपघटन प्रमेय: साबित किया कि आभासी मूल्य फलन संकेत बिंदु के पास अनुमानित रूप से अपघटित हो सकता है, जटिल आयरनिंग (ironing) प्रक्रिया को सरल बनाता है
  4. तीन-अंतराल रणनीति: एकल खरीदार के मामले में, सहज "अनदेखा करना-अनुसरण करना-सीमा लगाना" रणनीति प्रदान की
  5. तुलनात्मक विश्लेषण: पारंपरिक "मूल्य-प्लस-शोर" मॉडल के साथ गहन तुलना, विभिन्न त्रुटि मॉडल के इष्टतम तंत्र संरचना पर महत्वपूर्ण प्रभाव को प्रकट किया

विधि विवरण

कार्य परिभाषा

  • इनपुट: n खरीदार, प्रत्येक खरीदार i का निजी मूल्य viFiv_i \sim F_i, विक्रेता संकेत sis_i देखता है
  • संकेत उत्पन्न प्रक्रिया: संभावना γi\gamma_i के साथ, sis_i एक हॉलुसिनेशन है (FiF_i से स्वतंत्र रूप से नमूना लिया गया); संभावना 1γi1-\gamma_i के साथ, si=vis_i = v_i (सटीक संकेत)
  • उद्देश्य: राजस्व अधिकतमकरण नीलामी तंत्र (x,p)(x,p) डिजाइन करें, जहां xx आवंटन फलन है, pp भुगतान फलन है

मॉडल आर्किटेक्चर

बेयेसियन अपडेट

संकेत sis_i देखने के बाद, विक्रेता का viv_i के बारे में पश्च विश्वास है: fγi,sii(v)=γifi(v)+(1γi)δsi(v)f^i_{\gamma_i,s_i}(v) = \gamma_i \cdot f_i(v) + (1-\gamma_i) \cdot \delta_{s_i}(v)

जहां δsi()\delta_{s_i}(\cdot) sis_i पर डिराक डेल्टा फलन है।

आभासी मूल्य फलन

पश्च वितरण Fγ,sF_{\gamma,s} के लिए, आभासी मूल्य फलन है: ϕFγ,s(v)={v1/γF(v)f(v),for v<sv1F(v)f(v),for v>s\phi_{F_{\gamma,s}}(v) = \begin{cases} v - \frac{1/\gamma - F(v)}{f(v)}, & \text{for } v < s \\ v - \frac{1-F(v)}{f(v)}, & \text{for } v > s \end{cases}

मुख्य प्रमेय

प्रमेय 1: मान लीजिए FiF_i नियमितता शर्तों को संतुष्ट करता है, तो एक राजस्व अधिकतमकरण प्रत्यक्ष तंत्र मौजूद है, जिसका आभासी मूल्य फलन है: ϕˉγi,sii(v)={IRON[0,si][γiFi](v),if av<siϕFi(Ti),if siv<TiϕFi(v),if Tivb\bar{\phi}^i_{\gamma_i,s_i}(v) = \begin{cases} \text{IRON}_{[0,s_i]}[\gamma_i F_i](v), & \text{if } a \leq v < s_i \\ \phi_{F_i}(T_i), & \text{if } s_i \leq v < T_i \\ \phi_{F_i}(v), & \text{if } T_i \leq v \leq b \end{cases}

तकनीकी नवाचार बिंदु

  1. छंटनी आयरनिंग ऑपरेटर: Myerson आयरनिंग प्रक्रिया का छंटनी संस्करण पेश किया, जो उप-अंतराल पर आयरनिंग की अनुमति देता है
  2. सामान्यीकृत उत्तल पतवार विधि: Monteiro-Svaiter तकनीक का उपयोग करके बिना घनत्व वाले वितरण के आभासी मूल्य को संभालता है
  3. अनुमानित अपघटन संरचना: साबित किया कि संकेत के पहले और बाद की आयरनिंग अनुमानित रूप से स्वतंत्र रूप से की जा सकती है

प्रायोगिक सेटअप

सैद्धांतिक सत्यापन

पेपर मुख्य रूप से सैद्धांतिक विश्लेषण और संख्यात्मक उदाहरणों के माध्यम से परिणामों को सत्यापित करता है:

  1. समान वितरण मामला: FF [0,1][0,1] पर समान वितरण है
  2. घातीय वितरण मामला: सत्यापित करता है कि एकल मोनोटोन जोखिम दर वितरण के लिए भी, संकेत से पहले का वितरण आयरनिंग की आवश्यकता हो सकती है
  3. प्रतिउदाहरण निर्माण: नियमितता शर्तों की आवश्यकता को प्रदर्शित करता है

तुलनात्मक विधि

"मूल्य-प्लस-शोर" मॉडल के साथ तुलना, जहां संकेत s=v+ϵs = v + \epsilon, ϵN(0,σ2)\epsilon \sim N(0,\sigma^2)

प्रायोगिक परिणाम

मुख्य परिणाम

एकल खरीदार इष्टतम रणनीति (प्रस्ताव 1)

दहलीज LγL_\gamma और UγU_\gamma मौजूद हैं, जैसे कि इष्टतम मूल्य है: p={pignoreif s<Lγsif Lγs<Uγpcapif sUγp^* = \begin{cases} p_{\text{ignore}} & \text{if } s < L_\gamma \\ s & \text{if } L_\gamma \leq s < U_\gamma \\ p_{\text{cap}} & \text{if } s \geq U_\gamma \end{cases}

जहां:

  • pignorep_{\text{ignore}}: संकेत को अनदेखा करने वाली एकाधिकार मूल्य
  • pcapp_{\text{cap}}: सीमा मूल्य, pcap1/γF(pcap)f(pcap)=0p_{\text{cap}} - \frac{1/\gamma - F(p_{\text{cap}})}{f(p_{\text{cap}})} = 0 को संतुष्ट करता है

शोर मॉडल के साथ तुलना

चित्र 5 दोनों मॉडलों के तहत इष्टतम मूल्य की संरचनात्मक भिन्नता दिखाता है:

  • हॉलुसिनेशन मॉडल: तीन-खंड संरचना प्रदर्शित करता है (अनदेखा करना-अनुसरण करना-सीमा लगाना)
  • शोर मॉडल: चिकनी मूल्य समायोजन, कम संकेत पर मूल्य बढ़ाता है, उच्च संकेत पर घटाता है

केस विश्लेषण

समान वितरण मामला

F=Uniform[0,1]F = \text{Uniform}[0,1], γ=0.75\gamma = 0.75 के लिए:

  • कम संकेत अंतराल: संकेत को पूरी तरह अनदेखा करता है, पूर्व इष्टतम मूल्य 0.5 का उपयोग करता है
  • मध्यम संकेत अंतराल: संकेत पर पूरी तरह विश्वास करता है, मूल्य संकेत मूल्य के बराबर है
  • उच्च संकेत अंतराल: लगभग 0.66 की सीमा मूल्य का उपयोग करता है

घातीय वितरण मामला

एकल मोनोटोन जोखिम दर वाले घातीय वितरण के लिए भी, संकेत से पहले का आभासी मूल्य आयरनिंग प्रक्रिया की आवश्यकता है।

संबंधित कार्य

तंत्र डिजाइन सिद्धांत

  • Myerson (1981): शास्त्रीय राजस्व अधिकतमकरण नीलामी सिद्धांत की नींव
  • Monteiro & Svaiter (2010): मनमाने वितरण के लिए आयरनिंग तकनीकें

सीखने से बढ़ी हुई एल्गोरिदम

  • सामंजस्य बनाम मजबूती: पारंपरिक विधियां भविष्यवाणी परिपूर्ण होने पर प्रदर्शन (सामंजस्य) और प्रतिकूल होने पर (मजबूती) पर ध्यान केंद्रित करती हैं
  • यह पेपर अंतर: बेयेसियन ढांचा अपनाता है, मानता है कि त्रुटियां यादृच्छिक हैं, प्रतिकूल नहीं

डेटा-संचालित तंत्र

  • नमूना जटिलता: सीमित नमूनों का उपयोग करके तंत्र डिजाइन करना
  • यह पेपर योगदान: संकेत हॉलुसिनेशन हो सकते हैं, केवल नमूना प्रदूषण पर विचार नहीं करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. हॉलुसिनेशन मॉडल की सुगमता: हालांकि पश्च वितरण में निरंतर घनत्व नहीं है, फिर भी बंद-रूप इष्टतम समाधान प्राप्त किया जा सकता है
  2. तीन-खंड रणनीति की सहजता: एकल खरीदार के मामले में इष्टतम रणनीति स्पष्ट आर्थिक अंतर्ज्ञान रखती है
  3. त्रुटि मॉडल की महत्ता: विभिन्न भविष्यवाणी त्रुटि धारणाएं बिल्कुल अलग इष्टतम तंत्र संरचना की ओर ले जाती हैं

सीमाएं

  1. संकेत प्रकटीकरण धारणा: मानता है कि विक्रेता संकेत को सार्वजनिक करता है, व्यावहार में यह इष्टतम नहीं हो सकता है
  2. ज्ञात हॉलुसिनेशन संभावना: मानता है कि γi\gamma_i ज्ञात है, व्यावहारिक अनुप्रयोगों में अनुमान की आवश्यकता हो सकती है
  3. द्विआधारी त्रुटि मॉडल: वास्तविकता में ML त्रुटियां हॉलुसिनेशन और गाऊसी शोर का संयोजन हो सकती हैं

भविष्य की दिशाएं

  1. अप्रत्यक्ष तंत्र: विश्लेषण करें कि विक्रेता संकेत को प्रकट न करने पर इष्टतम तंत्र क्या है
  2. अज्ञात हॉलुसिनेशन संभावना: γi\gamma_i अज्ञात होने पर मजबूत तंत्र डिजाइन का अध्ययन करें
  3. मिश्रित त्रुटि मॉडल: हॉलुसिनेशन और पारंपरिक शोर को जोड़ने वाला अधिक यथार्थवादी मॉडल

गहन मूल्यांकन

शक्तियां

  1. समस्या की महत्ता: AI युग में तंत्र डिजाइन के सामने आने वाली मूल चुनौती को पकड़ता है
  2. सैद्धांतिक कठोरता: पूर्ण गणितीय विशेषता और प्रमाण प्रदान करता है
  3. सहज अंतर्दृष्टि: तीन-खंड रणनीति स्पष्ट आर्थिक अंतर्ज्ञान प्रदान करती है
  4. तकनीकी नवाचार: शास्त्रीय नीलामी सिद्धांत को नई सेटिंग तक सफलतापूर्वक विस्तारित करता है

कमियां

  1. मॉडल सरलीकरण: द्विआधारी त्रुटि मॉडल वास्तविक स्थिति को अत्यधिक सरल बना सकता है
  2. अनुभवजन्य सत्यापन अपर्याप्त: वास्तविक डेटा के साथ प्रायोगिक सत्यापन की कमी
  3. कम्प्यूटेशनल जटिलता: बहु-खरीदार मामले में कम्प्यूटेशनल जटिलता पर पर्याप्त चर्चा नहीं
  4. संकेत प्रकटीकरण धारणा: व्यावहारिक अनुप्रयोग आवश्यकताओं के अनुरूप नहीं हो सकती है

प्रभाव

  1. सैद्धांतिक योगदान: AI युग के लिए तंत्र डिजाइन के लिए नई सैद्धांतिक नींव प्रदान करता है
  2. व्यावहारिक मूल्य: विज्ञापन नीलामी आदि के लिए डिजाइन मार्गदर्शन प्रदान करता है
  3. अंतः-विषय प्रभाव: तंत्र डिजाइन, मशीन लर्निंग और सूचना अर्थशास्त्र को जोड़ता है

लागू परिदृश्य

  1. ऑनलाइन विज्ञापन नीलामी: उपयोगकर्ता मूल्य की भविष्यवाणी के लिए ML मॉडल का उपयोग करने वाले परिदृश्य
  2. ई-कॉमर्स प्लेटफॉर्म: उपयोगकर्ता व्यवहार भविष्यवाणी के आधार पर गतिशील मूल्य निर्धारण
  3. क्लाउड कंप्यूटिंग संसाधन आवंटन: लोड भविष्यवाणी के आधार पर संसाधन नीलामी

संदर्भ

  1. Myerson, R. B. (1981). Optimal auction design. Mathematics of operations research, 6(1), 58-73.
  2. Monteiro, P. K., & Svaiter, B. F. (2010). Optimal auction with a general distribution: Virtual valuation without densities. Journal of Mathematical Economics, 46(1), 21-31.
  3. Crémer, J., & McLean, R. P. (1988). Full extraction of the surplus in bayesian and dominant strategy auctions. Econometrica, 1247-1257.

यह पेपर सैद्धांतिक तंत्र डिजाइन क्षेत्र में महत्वपूर्ण योगदान देता है, आधुनिक AI प्रणालियों की हॉलुसिनेशन समस्या को शास्त्रीय नीलामी सिद्धांत ढांचे में सफलतापूर्वक शामिल करता है, और व्यावहारिक अनुप्रयोगों के लिए मूल्यवान सैद्धांतिक मार्गदर्शन प्रदान करता है। हालांकि मॉडल मान्यताओं और अनुभवजन्य सत्यापन के संदर्भ में सुधार की गुंजाइश है, लेकिन इसके सैद्धांतिक नवाचार और व्यावहारिक मूल्य इसे इस क्षेत्र का एक महत्वपूर्ण कार्य बनाते हैं।