The Price-Pareto growth model of networks with community structure
Brzozowski, Gagolewski, Siudem et al.
We introduce a new analytical framework for modelling degree sequences in individual communities of real-world networks, e.g., citations to papers in different fields. Our work is inspired by Price's model and its recent generalisation called 3DSI (three dimensions of scientific impact), which assumes that citations are gained partly accidentally, and to some extent preferentially. Our generalisation is motivated by existing research indicating significant differences between how various scientific disciplines grow, namely, minding different growth ratios, average reference list lengths, and preferential citing tendencies. Extending the 3DSI model to heterogeneous networks with a community structure allows us to devise new analytical formulas for, e.g., citation number inequality and preferentiality measures. We show that the distribution of citations in a community tends to a Pareto type II distribution. We also present analytical formulas for estimating its parameters and Gini's index. The new model is validated on real citation networks.
academic
नेटवर्क कम्युनिटी संरचना के साथ मूल्य-पारेटो वृद्धि मॉडल
यह पेपर वास्तविक नेटवर्क में विभिन्न कम्युनिटीज़ के डिग्री अनुक्रमों को मॉडल करने के लिए एक नई विश्लेषणात्मक रूपरेखा प्रस्तावित करता है, जैसे विभिन्न क्षेत्रों के पेपरों के उद्धरण। यह कार्य Price मॉडल और इसके नवीनतम सामान्यीकरण 3DSI (वैज्ञानिक प्रभाव के तीन आयाम) मॉडल से प्रेरित है, जो मानता है कि उद्धरण का एक हिस्सा संयोग से प्राप्त होता है और एक हिस्सा प्राथमिकता से। अनुसंधान प्रेरणा इस तथ्य से आती है कि विभिन्न वैज्ञानिक विषयों में वृद्धि के तरीकों में महत्वपूर्ण अंतर होते हैं, जिनमें विभिन्न वृद्धि दरें, औसत संदर्भ सूची की लंबाई और प्राथमिकता उद्धरण प्रवृत्तियां शामिल हैं। 3DSI मॉडल को कम्युनिटी संरचना वाले विषम नेटवर्क तक विस्तारित करने से उद्धरण असमानता और प्राथमिकता उपायों की गणना के लिए नए विश्लेषणात्मक सूत्र डिजाइन करना संभव हो जाता है। अनुसंधान से पता चलता है कि कम्युनिटीज़ में उद्धरण वितरण पारेटो II प्रकार के वितरण की ओर प्रवृत्त होता है, और इसके मापदंडों और गिनी गुणांक का अनुमान लगाने के लिए विश्लेषणात्मक सूत्र प्रदान करता है।
यह अनुसंधान मौजूदा उद्धरण नेटवर्क मॉडल की कम्युनिटी संरचना को प्रभावी ढंग से संभालने में असमर्थता की समस्या को हल करने का लक्ष्य रखता है। Barabási-Albert मॉडल और Price मॉडल जैसे पारंपरिक नेटवर्क वृद्धि मॉडल नेटवर्क की स्केल-मुक्त विशेषताओं की व्याख्या कर सकते हैं, लेकिन वे सापेक्ष समरूपता की धारणा पर आधारित हैं और स्थानीय परिवर्तनशीलता वाली नेटवर्क विशेषताओं को नहीं पकड़ सकते हैं, विशेष रूप से कम्युनिटी संरचना वाली नेटवर्क।
विषय विविधता: विभिन्न वैज्ञानिक विषयों में नेटवर्क वृद्धि पैटर्न में महत्वपूर्ण अंतर होते हैं, जिनमें वृद्धि दरें, औसत संदर्भ सूची की लंबाई और प्राथमिकता उद्धरण प्रवृत्तियां शामिल हैं
कम्युनिटी संरचना की सार्वभौमिकता: कम्युनिटी संरचना जैविक, शहरी और सामाजिक नेटवर्क में महत्वपूर्ण भूमिका निभाती है, लेकिन आधुनिक उद्धरण नेटवर्क मॉडलिंग में अक्सर अनदेखी की जाती है
विश्लेषणात्मक उपकरणों की कमी: ऐसे उपकरणों की कमी है जो सैद्धांतिक अंतर्दृष्टि प्रदान कर सकें और कम्युनिटी संरचना को संभाल सकें
सरल नेटवर्क मॉडल: BA मॉडल, Price मॉडल, 3DSI मॉडल अच्छे विश्लेषणात्मक गुण रखते हैं, लेकिन कम्युनिटी संरचना का समर्थन नहीं करते हैं
जटिल तकनीकी मॉडल: ग्राफ न्यूरल नेटवर्क, ग्राफ वेरिएशनल ऑटोएनकोडर कम्युनिटीज़ को संभाल सकते हैं, लेकिन सैद्धांतिक अंतर्दृष्टि की कमी है और ब्लैक-बॉक्स व्याख्या की आवश्यकता है
कम्प्यूटेशनली जटिल मॉडल: एक्सपोनेंशियल रैंडम ग्राफ मॉडल सांख्यिकीय रूप से सटीक हैं, लेकिन वास्तविक डेटा को फिट करने के लिए बड़ी मात्रा में कम्प्यूटेशन की आवश्यकता होती है
Price-Pareto वृद्धि मॉडल प्रस्तावित करना: 3DSI मॉडल को कम्युनिटी संरचना वाले विषम नेटवर्क तक विस्तारित करना, जो विभिन्न कम्युनिटीज़ को विभिन्न मापदंडों की अनुमति देता है
सैद्धांतिक विश्लेषण: यह साबित करना कि कम्युनिटी के भीतर उद्धरण वितरण पारेटो II प्रकार के वितरण में परिवर्तित होता है, और संबंधित विश्लेषणात्मक सूत्र प्राप्त करना
गिनी गुणांक सूत्र: कम्युनिटी के भीतर और संपूर्ण नेटवर्क के गिनी गुणांक की गणना के लिए सटीक विश्लेषणात्मक सूत्र प्रदान करना
पैरामीटर अनुमान विधि: कई पैरामीटर अनुमान विधियां विकसित करना, विशेष रूप से गिनी गुणांक पर आधारित अनुमानक
अनुभवजन्य सत्यापन: CORA और DBLP डेटासेट पर मॉडल की प्रभावशीलता को सत्यापित करना
इनपुट: कम्युनिटी संरचना वाली उद्धरण नेटवर्क
आउटपुट: प्रत्येक कम्युनिटी के डिग्री अनुक्रम मॉडल और उनके मापदंड
उद्देश्य: प्रत्येक कम्युनिटी के भीतर उद्धरण वितरण विशेषताओं को सटीकता से मॉडल करना
पैरामीटर विषमता: एक ही नेटवर्क के भीतर विभिन्न विषयों के ρ̂ मानों में बड़ा अंतर है, जो यह साबित करता है कि विभिन्न विषयों में संयोग-प्राथमिकता उद्धरण अनुपात अलग-अलग होते हैं
पूंछ फिटिंग लाभ: मॉडल डिग्री वितरण की पूंछ में विशेष रूप से अच्छा फिटिंग प्रभाव प्रदान करता है, जो उच्च उद्धरण पेपरों के वितरण पैटर्न को समझने के लिए महत्वपूर्ण है
वैश्विक सामंजस्य: कम्युनिटी मॉडल का भारित औसत वैश्विक 3DSI मॉडल के साथ अत्यधिक सुसंगत है
संपूर्ण गिनी गुणांक:
मिश्रित वितरण के अभिन्न प्रतिनिधित्व के माध्यम से, जिसमें हाइपरजियोमेट्रिक फ़ंक्शन के जटिल सूत्र शामिल हैं, और व्यावहारिक अनुमानित सूत्र प्रदान करता है।
Price (1965): वैज्ञानिक पेपरों के नेटवर्क - मूल Price मॉडल
Siudem et al. (2020): वैज्ञानिक प्रभाव के तीन आयाम - 3DSI मॉडल
Albert & Barabási (2002): जटिल नेटवर्क की सांख्यिकीय यांत्रिकी - BA मॉडल
Fortunato (2010): ग्राफ में कम्युनिटी डिटेक्शन - कम्युनिटी डिटेक्शन समीक्षा
Holland et al. (1983): स्टोकेस्टिक ब्लॉकमॉडल - यादृच्छिक ब्लॉक मॉडल
यह पेपर नेटवर्क विज्ञान और वैज्ञानिक मेट्रिक्स के अंतःविषय क्षेत्र में महत्वपूर्ण योगदान देता है। कठोर गणितीय विश्लेषण और अनुभवजन्य सत्यापन के माध्यम से, यह कम्युनिटी संरचना वाली नेटवर्क वृद्धि को समझने के लिए नए सैद्धांतिक उपकरण प्रदान करता है।