The Price-Pareto growth model of networks with community structure
Brzozowski, Gagolewski, Siudem et al.
We introduce a new analytical framework for modelling degree sequences in individual communities of real-world networks, e.g., citations to papers in different fields. Our work is inspired by Price's model and its recent generalisation called 3DSI (three dimensions of scientific impact), which assumes that citations are gained partly accidentally, and to some extent preferentially. Our generalisation is motivated by existing research indicating significant differences between how various scientific disciplines grow, namely, minding different growth ratios, average reference list lengths, and preferential citing tendencies. Extending the 3DSI model to heterogeneous networks with a community structure allows us to devise new analytical formulas for, e.g., citation number inequality and preferentiality measures. We show that the distribution of citations in a community tends to a Pareto type II distribution. We also present analytical formulas for estimating its parameters and Gini's index. The new model is validated on real citation networks.
academic
সম্প্রদায় কাঠামো সহ নেটওয়ার্কের মূল্য-পারেটো বৃদ্ধি মডেল
এই পেপারটি বাস্তব নেটওয়ার্কে বিভিন্ন সম্প্রদায়ের ডিগ্রি সিকোয়েন্স মডেল করার জন্য একটি নতুন বিশ্লেষণাত্মক কাঠামো প্রস্তাব করে, যেমন বিভিন্ন ক্ষেত্রের কাগজপত্রের উদ্ধৃতি। এই কাজটি মূল্য মডেল এবং এর সর্বশেষ সম্প্রসারণ 3DSI (বৈজ্ঞানিক প্রভাবের ত্রিমাত্রিক) মডেল দ্বারা অনুপ্রাণিত, যা অনুমান করে যে উদ্ধৃতির একটি অংশ দুর্ঘটনাক্রমে অর্জিত হয় এবং অংশটি পছন্দের মাধ্যমে অর্জিত হয়। গবেষণার প্রেরণা বিদ্যমান গবেষণা থেকে আসে যা দেখায় যে বিভিন্ন বৈজ্ঞানিক শৃঙ্খলা বৃদ্ধির পদ্ধতিতে উল্লেখযোগ্য পার্থক্য প্রদর্শন করে, যার মধ্যে রয়েছে বিভিন্ন বৃদ্ধির হার, গড় রেফারেন্স তালিকার দৈর্ঘ্য এবং পছন্দের উদ্ধৃতি প্রবণতা। 3DSI মডেলটি সম্প্রদায় কাঠামো সহ বিষমজাত নেটওয়ার্কে সম্প্রসারিত করা হয়েছে, যা উদ্ধৃতি সংখ্যার অসমতা এবং পছন্দের পরিমাপ গণনা করার জন্য নতুন বিশ্লেষণাত্মক সূত্র ডিজাইন করতে সক্ষম করে। গবেষণা দেখায় যে সম্প্রদায়ে উদ্ধৃতি বিতরণ পারেটো II-প্রকার বিতরণের দিকে প্রবণ হয় এবং এর পরামিতি এবং জিনি সহগ অনুমান করার জন্য বিশ্লেষণাত্মক সূত্র প্রদান করে।
এই গবেষণাটি বিদ্যমান উদ্ধৃতি নেটওয়ার্ক মডেলগুলি সম্প্রদায় কাঠামো কার্যকরভাবে পরিচালনা করতে পারে না এমন সমস্যা সমাধানের লক্ষ্য রাখে। ঐতিহ্যবাহী নেটওয়ার্ক বৃদ্ধি মডেল যেমন Barabási-Albert মডেল এবং মূল্য মডেল নেটওয়ার্কের স্কেল-মুক্ত বৈশিষ্ট্য ব্যাখ্যা করতে পারে, তবে তারা আপেক্ষিক সমজাতীয়তার অনুমানের উপর ভিত্তি করে, স্থানীয় পরিবর্তনশীলতা সহ নেটওয়ার্ক বৈশিষ্ট্য ক্যাপচার করতে পারে না, বিশেষত সম্প্রদায় কাঠামো সহ নেটওয়ার্ক।
শৃঙ্খলা পার্থক্য: বিভিন্ন বৈজ্ঞানিক শৃঙ্খলা নেটওয়ার্ক বৃদ্ধির প্যাটার্নে উল্লেখযোগ্য পার্থক্য প্রদর্শন করে, যার মধ্যে বৃদ্ধির হার, গড় রেফারেন্স তালিকার দৈর্ঘ্য এবং পছন্দের উদ্ধৃতি প্রবণতা রয়েছে
সম্প্রদায় কাঠামোর সর্বজনীনতা: সম্প্রদায় কাঠামো জৈব, শহুরে এবং সামাজিক নেটওয়ার্কে গুরুত্বপূর্ণ ভূমিকা পালন করে, তবে আধুনিক উদ্ধৃতি নেটওয়ার্ক মডেলিংয়ে প্রায়শই উপেক্ষা করা হয়
বিশ্লেষণাত্মক সরঞ্জামের অভাব: তাত্ত্বিক অন্তর্দৃষ্টি প্রদান এবং সম্প্রদায় কাঠামো পরিচালনা করতে পারে এমন বিশ্লেষণাত্মক সরঞ্জামের অভাব রয়েছে
সাধারণ নেটওয়ার্ক মডেল: BA মডেল, মূল্য মডেল, 3DSI মডেল ভাল বিশ্লেষণাত্মক বৈশিষ্ট্য থাকলেও সম্প্রদায় কাঠামো সমর্থন করে না
জটিল প্রযুক্তিগত মডেল: গ্রাফ নিউরাল নেটওয়ার্ক, গ্রাফ ভেরিয়েশনাল অটোএনকোডার ইত্যাদি সম্প্রদায় পরিচালনা করতে পারে কিন্তু তাত্ত্বিক অন্তর্দৃষ্টি এবং ব্ল্যাক বক্স ব্যাখ্যার অভাব রয়েছে
গণনাগত জটিল মডেল: সূচক র্যান্ডম গ্রাফ মডেল পরিসংখ্যানগতভাবে নির্ভুল কিন্তু বাস্তব ডেটা ফিট করার জন্য বিশাল গণনা প্রয়োজন
মূল্য-পারেটো বৃদ্ধি মডেল প্রস্তাব: 3DSI মডেলটি সম্প্রদায় কাঠামো সহ বিষমজাত নেটওয়ার্কে সম্প্রসারিত করা, বিভিন্ন সম্প্রদায়কে বিভিন্ন পরামিতি থাকতে অনুমতি দেয়
তাত্ত্বিক বিশ্লেষণ: সম্প্রদায়ের মধ্যে উদ্ধৃতি বিতরণ পারেটো II-প্রকার বিতরণে রূপান্তরিত হয় প্রমাণ করা এবং সম্পর্কিত বিশ্লেষণাত্মক সূত্র প্রাপ্ত করা
জিনি সহগ সূত্র: সম্প্রদায়ের মধ্যে এবং সামগ্রিক নেটওয়ার্ক জিনি সহগ গণনা করার জন্য সঠিক বিশ্লেষণাত্মক সূত্র প্রদান করা
পরামিতি অনুমান পদ্ধতি: একাধিক পরামিতি অনুমান পদ্ধতি উন্নয়ন, বিশেষত জিনি সহগ-ভিত্তিক অনুমানকারী
অভিজ্ঞতামূলক যাচাইকরণ: CORA এবং DBLP ডেটাসেটে মডেলের কার্যকারিতা যাচাই করা
ইনপুট: সম্প্রদায় কাঠামো সহ উদ্ধৃতি নেটওয়ার্ক
আউটপুট: প্রতিটি সম্প্রদায়ের ডিগ্রি সিকোয়েন্স মডেল এবং এর পরামিতি
উদ্দেশ্য: প্রতিটি সম্প্রদায়ের মধ্যে উদ্ধৃতি বিতরণ বৈশিষ্ট্য সঠিকভাবে মডেল করা
পরামিতি বিষমতা: একই নেটওয়ার্কের মধ্যে বিভিন্ন শৃঙ্খলার ρ̂ মান উল্লেখযোগ্য পার্থক্য প্রদর্শন করে, বিভিন্ন শৃঙ্খলা বিভিন্ন দুর্ঘটনাক্রমে-পছন্দের উদ্ধৃতি অনুপাত রয়েছে প্রমাণ করে
লেজ ফিটিং সুবিধা: মডেল ডিগ্রি বিতরণ লেজে ফিটিং প্রভাব বিশেষভাবে ভাল, যা উচ্চ-উদ্ধৃতি কাগজপত্রের বিতরণ প্যাটার্ন বোঝার জন্য গুরুত্বপূর্ণ
বৈশ্বিক সামঞ্জস্য: সম্প্রদায় মডেলের ওজনযুক্ত গড় বৈশ্বিক 3DSI মডেলের সাথে উচ্চ সামঞ্জস্যপূর্ণ
সামগ্রিক জিনি সহগ:
মিশ্র বিতরণের অবিচ্ছেদ্যের মাধ্যমে প্রতিনিধিত্ব করা, হাইপারজিওমেট্রিক ফাংশনের জটিল সূত্র জড়িত, এবং ব্যবহারিক আনুমানিক সূত্র প্রদান করা।
বৈশ্বিক ডিগ্রি সিকোয়েন্স: সম্প্রদায় মিশ্রণের জটিলতার কারণে, বৈশ্বিক ডিগ্রি সিকোয়েন্সের সাধারণ বিশ্লেষণাত্মক প্রকাশ পাওয়া যায় না
মডেল অনুমান: অনুমান করে যে দুর্ঘটনাক্রমে উদ্ধৃতি সম্পূর্ণ নেটওয়ার্ক জুড়ে সমানভাবে বিতরণ করা হয়, পছন্দের উদ্ধৃতি শুধুমাত্র সম্প্রদায়ের মধ্যে সীমাবদ্ধ
পরামিতি স্বাধীনতা: ν_i মান বিভিন্ন সম্প্রদায়ে স্বাধীন নয়, বিশ্লেষণ জটিলতা বৃদ্ধি করে
ফিটিং গুণমান: কিছু বাস্তব নেটওয়ার্ক সম্প্রদায় নিখুঁতভাবে ফিট করা যায় না, বাস্তব নেটওয়ার্ক আচরণের অপ্রত্যাশিততা প্রতিফলিত করে
Holland et al. (1983): স্টোকাস্টিক ব্লকমডেল - র্যান্ডম ব্লক মডেল
এই পেপারটি নেটওয়ার্ক বিজ্ঞান এবং বৈজ্ঞানিক পরিমাপের ক্রস-শৃঙ্খলা ক্ষেত্রে গুরুত্বপূর্ণ অবদান করে, কঠোর গাণিতিক বিশ্লেষণ এবং অভিজ্ঞতামূলক যাচাইকরণের মাধ্যমে, সম্প্রদায় কাঠামো সহ নেটওয়ার্ক বৃদ্ধি বোঝার জন্য নতুন তাত্ত্বিক সরঞ্জাম প্রদান করে।