Accelerated Evolving Set Processes for Local PageRank Computation
Huang, Luo, Xiao et al.
This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $ε$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtα)$ such linear systems, where $α$ is the damping factor. When $1/ε^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtαε^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.
academic
স্থানীয় PageRank গণনার জন্য ত্বরান্বিত বিবর্তনশীল সেট প্রক্রিয়া
এই পেপারটি নেস্টেড বিবর্তনশীল সেট প্রক্রিয়া (nested evolving set processes) এর উপর ভিত্তি করে ব্যক্তিগতকৃত PageRank (PPR) গণনা ত্বরান্বিত করার জন্য একটি নতুন কাঠামো প্রস্তাব করে। প্রতিটি পর্যায়ে, সরলীকৃত রৈখিক সিস্টেম সমাধানের জন্য স্থানীয়করণ করা অনির্ভুল আনুমানিক পয়েন্ট পুনরাবৃত্তি ব্যবহার করা হয়। গবেষণা দেখায় যে এই ধরনের স্থানীয়করণ পদ্ধতির সময় জটিলতার উপরের সীমা হল min{O~(R2/ε2),O~(m)} যা PPR ভেক্টরের ε-আনুমানিকতা পেতে, যেখানে m গ্রাফের প্রান্তের সংখ্যা এবং R নেস্টেড বিবর্তনশীল সেট প্রক্রিয়া দ্বারা সংজ্ঞায়িত একটি ধ্রুবক। কাঠামো দ্বারা প্ররোচিত অ্যালগরিদম শুধুমাত্র O~(1/α) এই ধরনের রৈখিক সিস্টেম সমাধান করতে হয়, যেখানে α হল ড্যাম্পিং ফ্যাক্টর। যখন 1/ε2≪m, এটি মানে একটি অ্যালগরিদম বিদ্যমান যা O~(R2/(αε2)) মোট সময় জটিলতায় PPR ভেক্টরের ε-আনুমানিকতা গণনা করতে পারে, এবং এটি অন্তর্নিহিত গ্রাফ আকারের উপর স্বাধীন।
ব্যক্তিগতকৃত PageRank (PPR) ভেক্টর π ∈ ℝⁿ সংজ্ঞায়িত হয় যেমন:
(I - (1-α)(I + AD⁻¹)/2)π = αeₛ
যেখানে eₛ উৎস নোড s এর সাথে সংশ্লিষ্ট মান ভেক্টর, α ∈ (0,1) হল ড্যাম্পিং ফ্যাক্টর, এবং A এবং D যথাক্রমে অনির্দেশিত গ্রাফ G(V,E) এর সংলগ্ন ম্যাট্রিক্স এবং ডিগ্রি ম্যাট্রিক্স।
গুরুত্ব: PPR গ্রাফ বিশ্লেষণের একটি মূল সরঞ্জাম, যা স্থানীয় ক্লাস্টারিং, বিস্তার প্রক্রিয়া মডেলিং, গ্রাফ নিউরাল নেটওয়ার্ক ইত্যাদিতে ব্যাপকভাবে প্রয়োগ করা হয়
বিদ্যমান সীমাবদ্ধতা:
APPR এর মতো মান পদ্ধতির সময় জটিলতা O(1/(αε))
ত্বরান্বিত পদ্ধতি গতিবেগ পদ অবশিষ্টাংশ একঘেয়েত্ব ভাঙার চ্যালেঞ্জের সম্মুখীন
বিদ্যমান ত্বরান্বিত পদ্ধতি সম্পূর্ণ গ্রাফ অ্যাক্সেস করতে পারে, যার ফলে O(m/√α) সময় জটিলতা
খোলা প্রশ্ন: এমন কোনো স্থানীয় ত্বরান্বিত পদ্ধতি বিদ্যমান যার সময় জটিলতা 1/α এর পরিবর্তে 1/√α এর উপর নির্ভর করে?
AESP কাঠামো: ত্বরান্বিত বিবর্তনশীল সেট প্রক্রিয়া (AESP) কাঠামো প্রস্তাব করে, যা একটি দীর্ঘ প্রক্রিয়ার পরিবর্তে O~(1/α) সংক্ষিপ্ত বিবর্তনশীল সেট প্রক্রিয়া ব্যবহার করে
তাত্ত্বিক গ্যারান্টি: O~(vol(St)/(αγt)) সময় জটিলতা প্রতিষ্ঠা করে, যা বিদ্যমান সাহিত্যে ত্বরান্বিত সীমানা অনুমান মেলে
স্থানীয়তা গ্যারান্টি: প্রমাণ করে যে vol(St)/γt এর উপরের সীমা হল min{O(R2/ε2),2m}, যখন 1/ε2≪m গ্রাফ আকারের সাথে স্বাধীন জটিলতা অর্জন করে
পরীক্ষামূলক যাচাইকরণ: বড় আকারের বাস্তব গ্রাফে পদ্ধতির কার্যকারিতা যাচাই করে, প্রাথমিক পর্যায়ে উল্লেখযোগ্য ত্বরণ প্রদর্শন করে
নির্ভুলতা প্যারামিটার ε দেওয়া, ε-আনুমানিক π̂ গণনা করার জন্য স্থানীয় অ্যালগরিদম ডিজাইন করুন, যা ∥D−1(π^−π)∥∞≤ε সন্তুষ্ট করে, একই সাথে সম্পূর্ণ গ্রাফ অ্যাক্সেস এড়ায়।
বাহ্যিক লুপ পুনরাবৃত্তি t তে, স্থানীয় সমাধানকারী M অভ্যন্তরীণ লুপ পুনরাবৃত্তি k এ সক্রিয় সেট অনুক্রম {S_t^(k)}_{k≥0} বজায় রাখে, আপডেট শুধুমাত্র সক্রিয় সেটের মধ্যে নোডে সীমাবদ্ধ।
এই পেপার 52টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, PPR গণনা, ত্বরান্বিত অপ্টিমাইজেশন, স্থানীয় অ্যালগরিদম ইত্যাদি একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের তাত্ত্বিক এবং ব্যবহারিক সমন্বয়ের পেপার, PPR গণনা ত্বরণের এই গুরুত্বপূর্ণ সমস্যায় উল্লেখযোগ্য অগ্রগতি অর্জন করেছে। যদিও কিছু তাত্ত্বিক সীমাবদ্ধতা বিদ্যমান, এর উদ্ভাবনী এবং ব্যবহারিক মূল্য এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ অবদান করে তোলে।