A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
Zhou, Luo, Wang et al.
A graph with $n$ vertices is an $f(\cdot)$-dense graph if it has at least $f(n)$ edges, $f(\cdot)$ being a well-defined function. The notion $f(\cdot)$-dense graph encompasses various clique models like $γ$-quasi cliques, $k$-defective cliques, and dense cliques, arising in cohesive subgraph extraction applications. However, the $f(\cdot)$-dense graph may be disconnected or weakly connected. To conquer this, we study the problem of finding the largest $f(\cdot)$-dense subgraph with a diameter of at most two in the paper. Specifically, we present a decomposition-based branch-and-bound algorithm to optimally solve this problem. The key feature of the algorithm is a decomposition framework that breaks the graph into $n$ smaller subgraphs, allowing independent searches in each subgraph. We also introduce decomposition strategies including degeneracy and two-hop degeneracy orderings, alongside a branch-and-bound algorithm with a novel sorting-based upper bound to solve each subproblem. Worst-case complexity for each component is provided. Empirical results on 139 real-world graphs under two $f(\cdot)$ functions show our algorithm outperforms the MIP solver and pure branch-and-bound, solving nearly twice as many instances optimally within one hour.
academic
نهج البحث والحدود لمشاكل الرسوم البيانية الكثيفة منخفضة القطر الأقصى
العنوان: A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
المؤلفون: Yi Zhou (جامعة العلوم والتكنولوجيا الإلكترونية بالصين)، Chunyu Luo (جامعة العلوم والتكنولوجيا الإلكترونية بالصين)، Zhengren Wang (جامعة بكين)، Zhang-Hua Fu (معهد شنتشن للذكاء الاصطناعي والروبوتات من أجل المجتمع، جامعة الصين الجنوبية للعلوم والتكنولوجيا)
تتناول هذه الورقة مشكلة إيجاد أقصى رسم بياني كثيف منخفض القطر f(·) (MfDS). الرسم البياني f(·)-الكثيف هو رسم بياني يحتوي على n رأس وعلى الأقل f(n) حافة، حيث f(·) دالة محددة جيداً. يغطي هذا المفهوم عدة نماذج تخفيف الكليك مثل γ-شبه الكليك، k-الكليك الناقص، والكليك الكثيف. ومع ذلك، قد لا تكون الرسوم البيانية f(·)-الكثيفة متصلة أو ضعيفة الاتصال. لحل هذه المشكلة، تدرس الورقة إيجاد أقصى رسم بياني كثيف f(·) بقطر لا يتجاوز 2. على وجه التحديد، يتم اقتراح خوارزمية بحث وحدود قائمة على التحلل لحل المشكلة بشكل أمثل. الميزة الرئيسية للخوارزمية هي تحليل الرسم البياني إلى n رسم بياني أصغر، مما يسمح بالبحث المستقل في كل رسم بياني. تقدم الورقة أيضاً استراتيجيات تحلل مثل ترتيب التحلل وترتيب التحلل ثنائي القفزة، بالإضافة إلى خوارزمية بحث وحدود مع حدود ترتيب جديدة. تظهر النتائج التجريبية على 139 رسم بياني حقيقي أن الخوارزمية تتفوق على محللات MIP وطرق البحث والحدود النقية، حيث تحل عدداً من الحالات في ساعة واحدة يقارب ضعف ما تحله الطرق الأخرى.
في تحليل الشبكات، يعتبر تحديد الرسوم البيانية الجزئية المترابطة بإحكام (cohesive subgraph) مهمة أساسية، مع تطبيقات في اكتشاف المجتمعات، تحديد مجمعات البروتين، تحليل الشبكات المالية وغيرها. يتطلب نموذج الكليك الكلاسيكي وجود حافة بين جميع أزواج الرؤوس، لكن هذا المتطلب صارم جداً، خاصة في التطبيقات العملية التي تحتوي على ضوضاء وأخطاء. لذلك، ظهرت عدة نماذج تخفيف كليك:
γ-شبه الكليك: الرسم البياني الجزئي المستحث من n رأس يحتوي على ما لا يقل عن γ(n choose 2) حافة
s-الكليك الناقص: يحتوي على ما لا يقل عن (n choose 2) - s حافة
متوسط s-plex: يحتوي على ما لا يقل عن n(n-s)/2 حافة
يمكن تمثيل هذه النماذج بشكل موحد كـ رسم بياني f(·)-كثيف: رسم بياني بـ n رأس يحتوي على ما لا يقل عن f(n) حافة.
طريقة MIP: على الرغم من وجود نماذج برمجة خطية صحيحة مختلطة لوظائف f(·) محددة (مثل GF3)، إلا أنها غير فعالة للرسوم البيانية الكبيرة، وليس هناك نموذج MIP لقيود القطر المنخفض
طريقة البحث والحدود: توجد خوارزميات لمشاكل محددة (مثل أقصى كليك ناقص، أقصى γ-شبه كليك)، لكن تفتقر إلى إطار عمل عام لحل الرسوم البيانية f(·)-الكثيفة
قيود الاتصال: اقترح Santos et al. (2024) قيود اتصال قائمة على الأشجار الممتدة، لكن قيود القطر توفر ضماناً أفضل للاتصال الوثيق
تقدم هذه الورقة مفهوم الرسم البياني f(·)-الكثيف منخفض القطر: يتطلب أن يكون الرسم البياني متصلاً، يحتوي على ما لا يقل عن f(n) حافة، وقطره لا يتجاوز 2. يضمن قيد القطر 2 (يُسمى 2-club) أن أقصر مسار بين أي رأسين لا يتجاوز 2، مما يضمن اتصالاً قوياً. تهدف الورقة إلى تصميم خوارزميات دقيقة فعالة لحل هذه المشكلة NP-hard.
اللمة الرئيسية (Lemma 3): بالنظر إلى أي ترتيب رؤوس π=⟨v1,...,vn⟩ للرسم البياني G، لكل رأس vi، عرّف:
Vi = {vi} ∪ {N^(2)_G(vi) ∩ {vi+1,...,vn}}
Gi = GVi
إذا كانت S_i أقصى رسم بياني كثيف منخفض القطر f(·) في Gi يحتوي على vi، فإن:
**ωf(G) = max(|S_1|,...,|S*_n|)**
تدفق الخوارزمية:
1. الحصول على حل أولي S باستخدام خوارزمية استكشافية (الحد الأدنى)
2. تحديد ترتيب الرؤوس π باستخدام خوارزمية الترتيب
3. لكل vi في π:
- بناء الرسم البياني الجزئي Gi = G[Vi]
- حل باستخدام ExactSearch(Gi, f(·), {vi}, N^(2)_G(vi), lb)
4. إرجاع أقصى حل من جميع المشاكل الجزئية
التعريف: ترتيب k-تحلل هو ترتيب رؤوس ⟨v1,...,vn⟩ بحيث يكون لكل vi درجة ≤ k في الرسم البياني الجزئي المستحث من {vi,...,vn}
الحساب: استخدام خوارزمية peel، وقت O(|V|+|E|)، حذف متكرر لرؤوس الدرجة الدنيا
درجة التحلل dG: أصغر قيمة k
تدفق الاستكشاف:
1. حساب ترتيب التحلل ⟨v1,...,vn⟩
2. لكل vi:
- Si ← {vi} ∪ {NG(vi) ∩ {vi+1,...,vn}}
- Gi ← G[Si] (القطر ≤ 2)
- بينما |Ei| < f(|Si|):
حذف رأس الدرجة الدنيا في Gi
- تحديث الحل الأمثل S*
3. إرجاع S*
التعقيد الزمني: O(|E| + |V|d²G)
في الرسوم البيانية العملية dG << |V| (مثل ca-dblp-2010: dG=74, |V|=226413)
BranchBound(G, S, C, lb):
المدخلات: الرسم البياني G، الحل الحالي S، مجموعة المرشحين C، الحد الأدنى lb
1. إذا كان G[S] حلاً قابلاً وكان |S|>lb: تحديث lb والحل الأمثل
2. إذا كانت f(·) موروثة و |E(S)|<f(|S|): قص وإرجاع
3. UB ← SortBound(G, f(·), S, C) // حساب الحد الأعلى
4. إذا كان UB ≤ lb: قص وإرجاع
5. إذا كانت f(·) موروثة: تطبيق قواعد التقليل (Lemma 5)
6. اختيار عشوائي u∈C
7. إذا استوفى u شروط Lemma 4: تكرار فقط فرع S∪{u}
وإلا: تكرار فرعي S∪{u} و S
1. تقسيم C إلى χ مجموعة مستقلة Π1,...,Πχ باستخدام خوارزمية جشعة
(تقليل χ ≈ مشكلة تلوين الرسم البياني، جشع O(|C|³))
2. لكل Πi:
a. ترتيب Πi بـ wS(v)
b. تقسيم إضافي لـ Πi إلى عدة Rσ بحيث تكون المسافة بين أي رأسين في Rσ > 2
c. اختيار الرأس بأصغر wS(·) من كل Rσ وإضافته إلى C'
d. حساب w'S(uj) = wS(uj) + j - 1
3. ترتيب C' بـ w'S(·)، إيجاد أقصى k بحيث |E(S)| + w'S(Sk) ≤ gf(|S|+k)
4. إرجاع |S|+k
التعقيد الزمني: O(|C|³ + |S||C|)
الصحة (Theorem 3):
كل مجموعة مستقلة Πi يمكن اختيار ما يصل إلى s'i رأس منها
Matula & Beck (1983): "Smallest-last ordering and clustering and graph coloring algorithms" - العمل الكلاسيكي لترتيب التحلل
Asahiro et al. (2002): "Complexity of finding dense subgraphs" - نتائج التعقيد لـ f(·)-الرسوم البيانية الكثيفة
Downey & Fellows (2012): "Parameterized complexity" - نظرية W1-hardness
التقييم الشامل: هذه ورقة ممتازة بنظرية صارمة وابتكار خوارزمي وتجارب شاملة. إطار التحلل وطريقة حد الترتيب لهما قيمة عالية من حيث العمومية والفائدة العملية. تكمن المساهمة الرئيسية في توحيد نماذج تخفيف كليك متعددة وتوفير خوارزمية حل فعالة. يُوصى بقبولها، حيث لها مساهمة مهمة في مجالات خوارزميات الرسوم البيانية وتحليل الشبكات.