We investigate the problem of identifying planted cliques in random geometric graphs, focusing on two distinct algorithmic approaches: the first based on vertex degrees (VD) and the other on common neighbors (CN). We analyze the performance of these methods under varying regimes of key parameters, namely the average degree of the graph and the size of the planted clique. We demonstrate that exact recovery is achieved with high probability as the graph size increases, in a specific set of parameters. Notably, our results reveal that the CN-algorithm significantly outperforms the VD-algorithm. In particular, in the connectivity regime, tiny planted cliques (even edges) are correctly identified by the CN-algorithm, yielding a significant impact on anomaly detection. Finally, our results are confirmed by a series of numerical experiments, showing that the devised algorithms are effective in practice.
- পেপার আইডি: 2510.12365
- শিরোনাম: র্যান্ডম জ্যামিতিক গ্রাফে রোপিত ক্লিক পুনরুদ্ধার
- লেখক: Konstantin Avrachenkov, Andrei Bobu, Nelly Litvak, Riccardo Michielan
- শ্রেণীবিভাগ: math.PR (সম্ভাবনা তত্ত্ব), cs.DS (ডেটা কাঠামো এবং অ্যালগরিদম)
- প্রকাশের সময়: ২০২৫ সালের ১৫ অক্টোবর
- পেপার লিঙ্ক: https://arxiv.org/abs/2510.12365
এই পেপারটি র্যান্ডম জ্যামিতিক গ্রাফে রোপিত ক্লিক (planted clique) সনাক্তকরণের সমস্যা অধ্যয়ন করে, যা দুটি ভিন্ন অ্যালগরিদমিক পদ্ধতির উপর দৃষ্টি নিবদ্ধ করে: শীর্ষবিন্দু ডিগ্রি (VD) ভিত্তিক পদ্ধতি এবং সাধারণ প্রতিবেশী (CN) ভিত্তিক পদ্ধতি। লেখকরা এই পদ্ধতিগুলির কর্মক্ষমতা বিশ্লেষণ করেছেন গুরুত্বপূর্ণ পরামিতির বিভিন্ন ব্যবধানে, যার মধ্যে রয়েছে গ্রাফের গড় ডিগ্রি এবং রোপিত ক্লিকের আকার। গবেষণা প্রমাণ করে যে নির্দিষ্ট পরামিতি সেটের অধীনে, গ্রাফের আকার বৃদ্ধির সাথে সাথে উচ্চ সম্ভাবনায় নিখুঁত পুনরুদ্ধার অর্জন করা যায়। উল্লেখযোগ্যভাবে, CN অ্যালগরিদম VD অ্যালগরিদমকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়। বিশেষত সংযোগ ব্যবধানে, CN অ্যালগরিদম ক্ষুদ্র রোপিত ক্লিক (এমনকি প্রান্ত) সঠিকভাবে সনাক্ত করতে পারে, যা অসামান্য সনাক্তকরণের জন্য গুরুত্বপূর্ণ। অবশেষে, সংখ্যাসূচক পরীক্ষা-নিরীক্ষা তাত্ত্বিক ফলাফল যাচাই করে, যা দেখায় যে ডিজাইন করা অ্যালগরিদমগুলি ব্যবহারিক ক্ষেত্রে কার্যকর।
রোপিত ক্লিক সমস্যা গ্রাফ তত্ত্বে একটি ক্লাসিক সমস্যা, যা প্রাথমিকভাবে Erdős-Rényi র্যান্ডম গ্রাফের জন্য প্রস্তাবিত হয়েছিল। এই সমস্যাটি আনুষ্ঠানিকভাবে প্রকাশ করা যায়: একটি র্যান্ডম গ্রাফ দেওয়া হলে, এর মধ্যে র্যান্ডমভাবে k টি শীর্ষবিন্দু নির্বাচন করুন এবং তাদের একটি সম্পূর্ণ উপগ্রাফ (ক্লিক) গঠন করতে বাধ্য করুন, তারপর এই রোপিত ক্লিক সনাক্ত করার জন্য বহুপদ সময়ের অ্যালগরিদম ডিজাইন করুন।
- ব্যবহারিক প্রয়োগের মূল্য: রোপিত ক্লিক সনাক্তকরণ একাধিক ক্ষেত্রে গুরুত্বপূর্ণ প্রয়োগ রয়েছে, যার মধ্যে রয়েছে:
- সামাজিক নেটওয়ার্কে সম্প্রদায় সনাক্তকরণ
- জৈব নেটওয়ার্কে কার্যকরী মডিউল সনাক্তকরণ
- নেটওয়ার্ক অসামান্য সনাক্তকরণ
- স্টেগানোগ্রাফিতে লুকানো তথ্য সনাক্তকরণ
- তাত্ত্বিক গুরুত্ব: র্যান্ডম জ্যামিতিক গ্রাফ Erdős-Rényi গ্রাফের তুলনায় বাস্তব-বিশ্ব নেটওয়ার্কগুলিকে আরও ভালভাবে অনুকরণ করে, কারণ তাদের ক্লাস্টারিং প্রবণতা এবং স্থানিক কাঠামোর বৈশিষ্ট্য রয়েছে।
- ক্লাসিক শীর্ষবিন্দু ডিগ্রি ভিত্তিক অ্যালগরিদম (VD অ্যালগরিদম) Erdős-Rényi গ্রাফে সফল হওয়ার জন্য k = Ω(√n log n) প্রয়োজন
- র্যান্ডম জ্যামিতিক গ্রাফে রোপিত ক্লিক সমস্যার পদ্ধতিগত গবেষণার অভাব
- বিদ্যমান পদ্ধতিগুলি ছোট আকারের রোপিত কাঠামো সনাক্ত করতে অসুবিধা পায়
লেখকরা বিশ্বাস করেন যে র্যান্ডম জ্যামিতিক গ্রাফের জ্যামিতিক কাঠামো কৃত্রিম কাঠামো (যেমন রোপিত ক্লিক) সনাক্তকরণকে Erdős-Rényi গ্রাফে তুলনায় আরও কার্যকর করে তোলে এবং ঐতিহ্যবাহী অ্যালগরিদমের তাত্ত্বিক সীমা অতিক্রম করতে পারে।
- VD অ্যালগরিদমের তাত্ত্বিক বিশ্লেষণ: র্যান্ডম জ্যামিতিক গ্রাফে শীর্ষবিন্দু ডিগ্রি অ্যালগরিদমের পুনরুদ্ধার থ্রেশহোল্ড প্রথম সিস্টেমেটিকভাবে বিশ্লেষণ করা হয়েছে, অ্যালগরিদম সফল হওয়ার পরামিতি ব্যবধান নির্ধারণ করা হয়েছে।
- CN অ্যালগরিদমের প্রস্তাব এবং বিশ্লেষণ: সাধারণ প্রতিবেশী ভিত্তিক বহুপদ সময়ের অ্যালগরিদম প্রবর্তন করা হয়েছে এবং প্রমাণ করা হয়েছে যে এটি আরও বিস্তৃত পরামিতি ব্যবধানে কার্যকর।
- যুগান্তকারী তাত্ত্বিক ফলাফল: CN অ্যালগরিদম অত্যন্ত ছোট রোপিত ক্লিক পুনরুদ্ধার করতে পারে প্রমাণ করা হয়েছে, এমনকি রোপিত প্রান্ত (k=2 এর ক্ষেত্রে), যা Erdős-Rényi গ্রাফে অসম্ভব।
- পরীক্ষামূলক যাচাইকরণ: সংখ্যাসূচক পরীক্ষা-নিরীক্ষার মাধ্যমে তাত্ত্বিক ফলাফল যাচাই করা হয়েছে, অ্যালগরিদমের ব্যবহারিক কার্যকারিতা প্রমাণ করা হয়েছে।
ইনপুট: র্যান্ডম জ্যামিতিক গ্রাফ G_k(n,r_n), যাতে একটি আকার k এর রোপিত ক্লিক রয়েছে
আউটপুট: রোপিত ক্লিক K এর শীর্ষবিন্দু সেট সঠিকভাবে সনাক্ত করা
লক্ষ্য: নিখুঁত পুনরুদ্ধার অর্জন করা, অর্থাৎ lim_{n→∞} P(K_n = K̂_n) = 1
র্যান্ডম জ্যামিতিক গ্রাফ G(n,r_n) এর নির্মাণ:
- শীর্ষবিন্দু অবস্থান: X_i d-মাত্রিক একক টোরাস 0,1^d এ সমানভাবে বিতরণ করা হয়
- প্রান্ত নিয়ম: শীর্ষবিন্দু i এবং j সংযুক্ত হয় যদি এবং শুধুমাত্র যদি d_T(X_i, X_j) ≤ r_n
- গড় ডিগ্রি: μ_n = nφ_d r_n^d, যেখানে φ_d হল d-মাত্রিক একক গোলকের আয়তন
অ্যালগরিদম প্রবাহ:
- সমস্ত শীর্ষবিন্দুর ডিগ্রি Z_i = |N(i)| গণনা করুন
- ডিগ্রি সর্বোচ্চ k টি শীর্ষবিন্দু রোপিত ক্লিকের অনুমান হিসাবে নির্বাচন করুন
তাত্ত্বিক ফলাফল:
- ইতিবাচক ফলাফল (প্রমেয় 2): যখন k > (1+ε)(T(n)-t(n)), VD অ্যালগরিদম উচ্চ সম্ভাবনায় রোপিত ক্লিক সফলভাবে পুনরুদ্ধার করে
- নেতিবাচক ফলাফল (প্রমেয় 3): নির্দিষ্ট পরামিতি ব্যবধানে, VD অ্যালগরিদম অবশ্যই ব্যর্থ হয়
অ্যালগরিদম প্রবাহ:
- সমস্ত প্রান্ত (i,j) ∈ E পুনরাবৃত্তি করুন
- পরীক্ষা করুন যে i এবং j এর ঠিক k-2 টি সাধারণ প্রতিবেশী আছে কিনা
- এই k-2 টি সাধারণ প্রতিবেশী একটি ক্লিক গঠন করে কিনা তা যাচাই করুন
- যদি শর্তগুলি পূরণ হয়, {i,j} এবং এর সাধারণ প্রতিবেশীদের দ্বারা গঠিত k-ক্লিক ফেরত দিন
মূল ধারণা:
র্যান্ডম জ্যামিতিক গ্রাফের জ্যামিতিক কাঠামোর বৈশিষ্ট্য ব্যবহার করা। চিত্র 1 এ দেখা যায়, স্বাভাবিকভাবে গঠিত প্রান্তের সাধারণ প্রতিবেশীগুলি দুটি বিচ্ছিন্ন অঞ্চল R₁ এবং R₂ তে বিতরণ করা হয়, এই অঞ্চলগুলির শীর্ষবিন্দুগুলি একে অপরের সাথে সংযুক্ত হতে পারে না, তাই একটি ক্লিক গঠন করতে পারে না। যখন রোপিত ক্লিকের প্রান্তগুলি এই সীমাবদ্ধতার অধীন নয়।
- জ্যামিতিক কাঠামো ব্যবহার: CN অ্যালগরিদম র্যান্ডম জ্যামিতিক গ্রাফের স্থানিক সীমাবদ্ধতার বৈশিষ্ট্য চতুরভাবে ব্যবহার করে
- থ্রেশহোল্ড অতিক্রম: CN অ্যালগরিদম প্রাকৃতিক ক্লিক আকারের চেয়ে অনেক ছোট রোপিত ক্লিক সনাক্ত করতে পারে
- পরামিতি ব্যবধান সম্প্রসারণ: VD অ্যালগরিদমের তুলনায়, CN অ্যালগরিদম μ-k পরামিতি সমতলে আরও বিস্তৃত ব্যবধানে কার্যকর
- গ্রাফ স্কেল: n = 10⁴
- গড় ডিগ্রি: μ ∈ {1, 5, 20}
- রোপিত ক্লিক আকার: k বিভিন্ন মান থেকে বড় মান পর্যন্ত পরিবর্তিত হয়
- পুনরাবৃত্তি সংখ্যা: প্রতিটি পরামিতি সমন্বয়ের জন্য 1000 বার স্বাধীন পরীক্ষা-নিরীক্ষা
সাফল্যের হার: অ্যালগরিদম সঠিকভাবে রোপিত ক্লিক পুনরুদ্ধার করার পরীক্ষামূলক সংখ্যার অনুপাত
VD অ্যালগরিদম বনাম CN অ্যালগরিদমের সরাসরি তুলনা
পরীক্ষামূলক ফলাফল (চিত্র 3) সম্পূর্ণভাবে তাত্ত্বিক পূর্বাভাস যাচাই করে:
- μ = 1 এর সময়: দুটি অ্যালগরিদমের কর্মক্ষমতা অনুরূপ, উভয়ই বৃহত্তর k মানে সফল হতে পারে
- μ = 5 এর সময়: CN অ্যালগরিদম সুবিধা দেখাতে শুরু করে, ছোট রোপিত ক্লিক পুনরুদ্ধার করতে পারে
- μ = 20 এর সময়: CN অ্যালগরিদম VD অ্যালগরিদমকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়, প্রায় সমস্ত পরীক্ষিত রোপিত ক্লিক আকার পুনরুদ্ধার করতে পারে
- CN অ্যালগরিদম সমস্ত পরীক্ষিত পরিস্থিতিতে VD অ্যালগরিদমকে ছাড়িয়ে যায়
- গড় ডিগ্রি μ বৃদ্ধির সাথে সাথে, VD অ্যালগরিদমের কর্মক্ষমতা হ্রাস পায়, যখন CN অ্যালগরিদম স্থিতিশীল থাকে
- CN অ্যালগরিদম সফলভাবে রোপিত প্রান্ত (k=2) সনাক্ত করতে পারে, যা তাত্ত্বিক ফলাফলের পরীক্ষামূলক যাচাইকরণ
সাফল্যের শর্ত: min_{i∈K} Z_i > max_{i∈V\K} Z_i
র্যান্ডম জ্যামিতিক গ্রাফে সর্বোচ্চ ডিগ্রি Δ_n এবং ন্যূনতম ডিগ্রি δ_n এর অ্যাসিম্পটোটিক আচরণ বিশ্লেষণের মাধ্যমে:
- যখন α = μ_n/log(n) ∈ [0,∞): k > (1+ε)(T(n)-t(n)) প্রয়োজন
- যখন α = ∞: k > εμ_n প্রয়োজন
ব্যর্থতার শর্ত বিশ্লেষণ:
অ্যালগরিদম ব্যর্থ হয় যদি এবং শুধুমাত্র যদি নিম্নলিখিত ঘটনাগুলির মধ্যে একটি ঘটে:
- ঘটনা A: রোপিত ক্লিকের সমস্ত প্রান্ত জোড়ের ক্লিক বাইরের সাধারণ প্রতিবেশী রয়েছে
- ঘটনা B₁∩B₂: ক্লিক বাইরের প্রান্ত বিদ্যমান যা ঠিক k-2 টি সাধারণ প্রতিবেশী রয়েছে এবং একটি ক্লিক গঠন করে
সাফল্যের ব্যবধান (প্রমেয় 4):
- যখন k_n ≤ αn এবং μ_n ne^{-c₁,d μ_n} = o(1)
- অথবা আরও জটিল শর্ত (8) পূরণ করে
- Kučera (1995): প্রথম VD অ্যালগরিদম প্রস্তাব করেছেন, k = Ω(√n log n) এর জন্য প্রযোজ্য
- Alon এবং অন্যরা (1998): প্রমাণ করেছেন যে বহুপদ অ্যালগরিদম বিদ্যমান যখন k > c√n
- ক্লিক সংখ্যার অ্যাসিম্পটোটিক আচরণ গবেষণা (McDiarmid, Penrose এবং অন্যরা)
- প্রয়োগ ক্ষেত্র: সামাজিক নেটওয়ার্ক, জৈব নেটওয়ার্ক, মেশিন লার্নিং
প্রথমবারের মতো রোপিত ক্লিক সমস্যা র্যান্ডম জ্যামিতিক গ্রাফে সম্প্রসারিত করা হয়েছে এবং জ্যামিতিক কাঠামো দ্বারা আনা সুবিধা আবিষ্কার করা হয়েছে।
- CN অ্যালগরিদম র্যান্ডম জ্যামিতিক গ্রাফে ঐতিহ্যবাহী VD অ্যালগরিদমকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়
- জ্যামিতিক কাঠামো অত্যন্ত ছোট রোপিত ক্লিক (এমনকি রোপিত প্রান্ত) সনাক্তকরণ সম্ভব করে তোলে
- তাত্ত্বিক ফলাফল পরীক্ষা-নিরীক্ষা দ্বারা সম্পূর্ণভাবে যাচাই করা হয়েছে
- বিশ্লেষণ কঠিন র্যান্ডম জ্যামিতিক গ্রাফ মডেলের মধ্যে সীমাবদ্ধ
- নির্দিষ্ট পরামিতি ব্যবধানের তাত্ত্বিক নিশ্চয়তা এখনও অসম্পূর্ণ
- অ্যালগরিদমের জটিলতা সম্ভবত উচ্চ: CN অ্যালগরিদমের সর্বোচ্চ ক্ষেত্রে O(μ_n n(n + k²))
- নরম র্যান্ডম জ্যামিতিক গ্রাফে সম্প্রসারণ (যেমন Waxman গ্রাফ)
- উচ্চ-মাত্রিক পরিস্থিতিতে কর্মক্ষমতা গবেষণা
- জ্যামিতিকভাবে সংজ্ঞায়িত রোপিত ক্লিক বিবেচনা করা (যেমন বৃত্তাকার অঞ্চলের মধ্যে সমস্ত শীর্ষবিন্দু)
- অ্যালগরিদমের জটিলতা এবং ব্যবহারিক বাস্তবায়ন অপ্টিমাইজ করা
- তাত্ত্বিক উদ্ভাবন: র্যান্ডম জ্যামিতিক গ্রাফে রোপিত ক্লিক সমস্যা প্রথমবারের মতো সিস্টেমেটিকভাবে গবেষণা করা হয়েছে, গুরুত্বপূর্ণ তাত্ত্বিক শূন্যতা পূরণ করা হয়েছে
- পদ্ধতির উৎকর্ষতা: CN অ্যালগরিদম যুগান্তকারী কর্মক্ষমতা প্রদর্শন করে, অত্যন্ত ছোট কাঠামো সনাক্ত করতে পারে
- বিশ্লেষণের গভীরতা: সম্পূর্ণ তাত্ত্বিক বিশ্লেষণ কাঠামো প্রদান করা হয়েছে, ইতিবাচক এবং নেতিবাচক উভয় ফলাফল অন্তর্ভুক্ত
- পরীক্ষামূলক যাচাইকরণ: তত্ত্ব এবং পরীক্ষা-নিরীক্ষা উচ্চ সামঞ্জস্যপূর্ণ, ফলাফলের বিশ্বাসযোগ্যতা বৃদ্ধি করে
- মডেল সীমাবদ্ধতা: শুধুমাত্র কঠিন র্যান্ডম জ্যামিতিক গ্রাফ বিবেচনা করা হয়েছে, বাস্তব নেটওয়ার্ক আরও জটিল হতে পারে
- তাত্ত্বিক ফাঁক: নির্দিষ্ট পরামিতি ব্যবধানের তাত্ত্বিক নিশ্চয়তা অসম্পূর্ণ (চিত্র 2 এর বেজ রঙের অঞ্চল)
- অ্যালগরিদমের জটিলতা: CN অ্যালগরিদমের জটিলতা উচ্চ, যা ব্যবহারিক প্রয়োগ সীমাবদ্ধ করতে পারে
- মাত্রা সীমাবদ্ধতা: প্রধান বিশ্লেষণ নিম্ন-মাত্রিক পরিস্থিতিতে কেন্দ্রীভূত
- একাডেমিক মূল্য: র্যান্ডম গ্রাফ তত্ত্ব এবং অ্যালগরিদম ডিজাইনে নতুন চিন্তাভাবনা প্রদান করে
- প্রয়োগের সম্ভাবনা: নেটওয়ার্ক অসামান্য সনাক্তকরণ, সম্প্রদায় আবিষ্কার ইত্যাদি ক্ষেত্রে সম্ভাব্য প্রয়োগ রয়েছে
- তাত্ত্বিক তাৎপর্য: গ্রাফ অ্যালগরিদমে জ্যামিতিক কাঠামোর গুরুত্ব প্রমাণ করে
- নেটওয়ার্ক নিরাপত্তা: নেটওয়ার্কে অসামান্য সংযোগ প্যাটার্ন সনাক্ত করা
- সামাজিক নেটওয়ার্ক বিশ্লেষণ: কৃত্রিমভাবে নির্মিত মিথ্যা সম্প্রদায় সনাক্ত করা
- জৈব তথ্য বিজ্ঞান: প্রোটিন পারস্পরিক ক্রিয়া নেটওয়ার্কে কার্যকরী মডিউল আবিষ্কার করা
- ডেটা মাইনিং: স্থানিক কাঠামো সহ ডেটায় অসামান্য প্যাটার্ন সনাক্ত করা
পেপারটি 24 টি গুরুত্বপূর্ণ সংদর্ভ উদ্ধৃত করে, যা র্যান্ডম গ্রাফ তত্ত্ব, অ্যালগরিদম ডিজাইন, নেটওয়ার্ক বিশ্লেষণ এবং অন্যান্য ক্ষেত্রের ক্লাসিক কাজগুলি অন্তর্ভুক্ত করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি তত্ত্ব এবং অনুশীলন উভয় দিক থেকে গুরুত্বপূর্ণ অবদান রাখা একটি উচ্চ মানের পেপার। ক্লাসিক রোপিত ক্লিক সমস্যা র্যান্ডম জ্যামিতিক গ্রাফে সম্প্রসারিত করে, লেখকরা শুধুমাত্র তাত্ত্বিক শূন্যতা পূরণ করেননি, বরং জ্যামিতিক কাঠামো দ্বারা আনা উল্লেখযোগ্য সুবিধাও আবিষ্কার করেছেন। CN অ্যালগরিদমের উৎকর্ষ কর্মক্ষমতা এবং তাত্ত্বিক নিশ্চয়তা এটিকে ব্যবহারিক প্রয়োগে বিশাল সম্ভাবনা রাখে।