A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
Zhou, Luo, Wang et al.
A graph with $n$ vertices is an $f(\cdot)$-dense graph if it has at least $f(n)$ edges, $f(\cdot)$ being a well-defined function. The notion $f(\cdot)$-dense graph encompasses various clique models like $γ$-quasi cliques, $k$-defective cliques, and dense cliques, arising in cohesive subgraph extraction applications. However, the $f(\cdot)$-dense graph may be disconnected or weakly connected. To conquer this, we study the problem of finding the largest $f(\cdot)$-dense subgraph with a diameter of at most two in the paper. Specifically, we present a decomposition-based branch-and-bound algorithm to optimally solve this problem. The key feature of the algorithm is a decomposition framework that breaks the graph into $n$ smaller subgraphs, allowing independent searches in each subgraph. We also introduce decomposition strategies including degeneracy and two-hop degeneracy orderings, alongside a branch-and-bound algorithm with a novel sorting-based upper bound to solve each subproblem. Worst-case complexity for each component is provided. Empirical results on 139 real-world graphs under two $f(\cdot)$ functions show our algorithm outperforms the MIP solver and pure branch-and-bound, solving nearly twice as many instances optimally within one hour.
academic
अधिकतम निम्न-व्यास सघन उपग्राफ समस्याओं के लिए एक शाखा-और-सीमा दृष्टिकोण
शीर्षक: A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
लेखक: Yi Zhou (इलेक्ट्रॉनिक्स विज्ञान और प्रौद्योगिकी विश्वविद्यालय, चीन), Chunyu Luo (इलेक्ट्रॉनिक्स विज्ञान और प्रौद्योगिकी विश्वविद्यालय, चीन), Zhengren Wang (पीकिंग विश्वविद्यालय), Zhang-Hua Fu (शेनझेन कृत्रिम बुद्धिमत्ता और रोबोटिक्स सोसायटी संस्थान, CUHK शेनझेन)
यह पेपर अधिकतम निम्न-व्यास f(·)-सघन उपग्राफ समस्या (MfDS) का अध्ययन करता है। f(·)-सघन ग्राफ एक ऐसा ग्राफ है जिसमें n शीर्ष हैं और कम से कम f(n) किनारे हैं, जहां f(·) एक सुपरिभाषित फलन है। यह अवधारणा γ-अर्ध-समूह, k-त्रुटिपूर्ण समूह और सघन समूह जैसे कई समूह शिथिलीकरण मॉडल को शामिल करती है। हालांकि, f(·)-सघन ग्राफ असंयुक्त या कमजोर रूप से संयुक्त हो सकते हैं। इस समस्या को हल करने के लिए, यह पेपर व्यास 2 से अधिक न होने वाले अधिकतम f(·)-सघन उपग्राफ खोजने का अध्ययन करता है। विशेष रूप से, एक विघटन-आधारित शाखा-और-सीमा एल्गोरिदम प्रस्तावित किया गया है जो इस समस्या को इष्टतम रूप से हल करता है। एल्गोरिदम की मुख्य विशेषता ग्राफ को n छोटे उपग्राफ में विघटित करना है, जो प्रत्येक उपग्राफ में स्वतंत्र खोज की अनुमति देता है। पेपर विघटन रणनीतियों जैसे अपघटन क्रमण और दो-हॉप अपघटन क्रमण, साथ ही नवीन क्रमण ऊपरी सीमा के साथ शाखा-और-सीमा एल्गोरिदम भी प्रस्तुत करता है। 139 वास्तविक ग्राफ पर प्रायोगिक परिणाम दर्शाते हैं कि यह एल्गोरिदम MIP सॉल्वर और शुद्ध शाखा-और-सीमा विधियों से बेहतर है, एक घंटे में इष्टतम रूप से हल किए गए उदाहरणों की संख्या लगभग दोगुनी है।
नेटवर्क विश्लेषण में, कसकर जुड़े हुए उपग्राफ (cohesive subgraph) की पहचान करना एक मूल कार्य है, जो सामुदायिक खोज, प्रोटीन परिसर पहचान, वित्तीय नेटवर्क विश्लेषण आदि क्षेत्रों में लागू होता है। शास्त्रीय समूह (clique) मॉडल सभी शीर्ष जोड़ों के बीच किनारे की आवश्यकता करता है, लेकिन यह आवश्यकता बहुत कठोर है, विशेष रूप से शोर और त्रुटियों वाले व्यावहारिक अनुप्रयोगों में। इसलिए, कई शिथिलीकृत समूह मॉडल सामने आए हैं, जैसे:
γ-अर्ध-समूह: n शीर्षों के प्रेरित उपग्राफ में कम से कम γ(n choose 2) किनारे हैं
s-त्रुटिपूर्ण समूह: कम से कम (n choose 2) - s किनारे हैं
औसत s-plex: कम से कम n(n-s)/2 किनारे हैं
इन मॉडलों को f(·)-सघन ग्राफ के रूप में एकीकृत किया जा सकता है: n शीर्षों वाले ग्राफ में कम से कम f(n) किनारे हैं।
मौजूदा f(·)-सघन ग्राफ मॉडल में गंभीर खामियां हैं: वे असंयुक्त या कमजोर रूप से संयुक्त हो सकते हैं। पेपर चित्र 1 के माध्यम से दो उदाहरण प्रदर्शित करता है:
G1: 200 शीर्षों का समूह और 10 शीर्षों का पथ, v1 से v210 तक 10 हॉप की आवश्यकता है
G2: 200 शीर्षों का समूह और 10 अलग-थलग शीर्ष, v1 और v210 के बीच कोई पथ नहीं है
ये दोनों ग्राफ f(n)=0.9(n choose 2) की सघनता आवश्यकता को पूरा करते हैं, लेकिन स्पष्ट रूप से कसकर जुड़े हुए समुदाय नहीं हैं।
MIP विधि: हालांकि विशिष्ट f(·) कार्यों के लिए मिश्रित पूर्णांक प्रोग्रामिंग मॉडल (जैसे GF3) मौजूद हैं, लेकिन बड़े पैमाने के ग्राफ के लिए अक्षम हैं, और निम्न-व्यास बाधा के लिए कोई MIP मॉडल नहीं है
शाखा-और-सीमा विधि: विशिष्ट समस्याओं (जैसे अधिकतम s-त्रुटिपूर्ण समूह, अधिकतम γ-अर्ध-समूह) के लिए एल्गोरिदम पहले से मौजूद हैं, लेकिन सामान्य f(·)-सघन ग्राफ समाधान ढांचे की कमी है
संयोजकता बाधा: Santos et al. (2024) ने जनक वृक्ष-आधारित संयोजकता बाधा प्रस्तावित की है, लेकिन व्यास बाधा कसकर जुड़ाव को बेहतर तरीके से सुनिश्चित करती है
यह पेपर निम्न-व्यास f(·)-सघन ग्राफ की अवधारणा प्रस्तुत करता है: ग्राफ को संयुक्त होने, कम से कम f(n) किनारे होने, और व्यास 2 से अधिक न होने की आवश्यकता है। व्यास 2 की बाधा (2-club कहलाती है) सुनिश्चित करती है कि किसी भी दो शीर्षों के बीच सबसे छोटा पथ 2 से अधिक नहीं है, जो मजबूत संयोजकता सुनिश्चित करता है। पेपर इस NP-कठिन समस्या को हल करने के लिए कुशल सटीक एल्गोरिदम डिजाइन करने का लक्ष्य रखता है।
मुख्य लेम्मा (Lemma 3): ग्राफ G के किसी भी शीर्ष क्रमण π=⟨v1,...,vn⟩ को देखते हुए, प्रत्येक शीर्ष vi के लिए, परिभाषित करें:
Vi = {vi} ∪ {N^(2)_G(vi) ∩ {vi+1,...,vn}}
Gi = GVi
यदि S_i, Gi में vi युक्त अधिकतम निम्न-व्यास f(·)-सघन उपग्राफ है, तो:
**ωf(G) = max(|S_1|,...,|S*_n|)**
एल्गोरिदम प्रवाह:
1. अनुमानी एल्गोरिदम से प्रारंभिक समाधान S प्राप्त करें (निचली सीमा)
2. क्रमण एल्गोरिदम से शीर्ष क्रम π निर्धारित करें
3. π में प्रत्येक vi के लिए:
- उपग्राफ Gi = G[Vi] का निर्माण करें
- ExactSearch(Gi, f(·), {vi}, N^(2)_G(vi), lb) से समाधान करें
4. सभी उप-समस्याओं का अधिकतम समाधान लौटाएं
समय जटिलता: O(Theur(G) + Torder(G) + poly(αG)2^αG)
αG = max(|V1|,...,|Vn|): अधिकतम उपग्राफ आकार
मुख्य बात है αG को कम करके घातांकीय भाग को नियंत्रित करना
BranchBound(G, S, C, lb):
इनपुट: ग्राफ G, वर्तमान समाधान S, उम्मीदवार समुच्चय C, निचली सीमा lb
1. यदि G[S] व्यावहारिक समाधान है और |S|>lb: lb और इष्टतम समाधान अपडेट करें
2. यदि f(·) वंशानुगत है और |E(S)|<f(|S|): कट करके लौटें
3. UB ← SortBound(G, f(·), S, C) // ऊपरी सीमा की गणना करें
4. यदि UB ≤ lb: कट करके लौटें
5. यदि f(·) वंशानुगत है: कमी नियम लागू करें (Lemma 5)
6. C से यादृच्छिक रूप से u चुनें
7. यदि Lemma 4 की शर्तें पूरी होती हैं: केवल S∪{u} शाखा पर पुनरावृत्ति करें
अन्यथा: S∪{u} और S दोनों शाखाओं पर पुनरावृत्ति करें
सरल ऊपरी सीमा S और C के बीच के किनारों को नजरअंदाज करती है
सरल ऊपरी सीमा ने दो-हॉप बाधा पर विचार नहीं किया है
एल्गोरिदम प्रवाह:
1. लालची एल्गोरिदम से C को χ स्वतंत्र समुच्चयों में विभाजित करें Π1,...,Πχ
(χ को कम करने का प्रयास करें ≈ ग्राफ रंग समस्या, O(|C|³) लालची)
2. प्रत्येक Πi के लिए:
a. Πi को wS(v) के अनुसार क्रमित करें
b. Πi को आगे कई Rσ में विभाजित करें, जैसे कि Rσ में किसी भी दो शीर्षों की दूरी > 2 है
c. प्रत्येक Rσ से wS(·) न्यूनतम शीर्ष चुनें और C' में जोड़ें
d. w'S(uj) = wS(uj) + j - 1 की गणना करें
3. C' को w'S(·) के अनुसार क्रमित करें, अधिकतम k खोजें जैसे कि |E(S)| + w'S(Sk) ≤ gf(|S|+k)
4. |S|+k लौटाएं
समय जटिलता: O(|C|³ + |S||C|)
सही होना (Theorem 3):
प्रत्येक स्वतंत्र समुच्चय Πi से अधिकतम s'i शीर्ष चुनें
प्रत्येक Rσ से दो-हॉप बाधा के कारण अधिकतम 1 शीर्ष चुनें
समग्र मूल्यांकन: यह एक सैद्धांतिक रूप से कठोर, एल्गोरिदमिक रूप से नवीन, और प्रायोगिक रूप से व्यापक उत्कृष्ट पेपर है। विघटन ढांचा और क्रमण ऊपरी सीमा विधि उच्च सामान्यता और व्यावहारिक मूल्य रखते हैं। मुख्य योगदान कई समूह शिथिलीकरण मॉडलों को एकीकृत करना और कुशल समाधान एल्गोरिदम प्रदान करना है। स्वीकृति की अनुशंसा की जाती है, ग्राफ एल्गोरिदम और नेटवर्क विश्लेषण क्षेत्र में महत्वपूर्ण योगदान है।