2025-11-15T15:52:10.939408

DEHYDRATOR: Enhancing Provenance Graph Storage via Hierarchical Encoding and Sequence Generation

Ying, Zhu, Lv et al.
As the scope and impact of cyber threats have expanded, analysts utilize audit logs to hunt threats and investigate attacks. The provenance graphs constructed from kernel logs are increasingly considered as an ideal data source due to their powerful semantic expression and attack historic correlation ability. However, storing provenance graphs with traditional databases faces the challenge of high storage overhead, given the high frequency of kernel events and the persistence of attacks. To address this, we propose Dehydrator, an efficient provenance graph storage system. For the logs generated by auditing frameworks, Dehydrator uses field mapping encoding to filter field-level redundancy, hierarchical encoding to filter structure-level redundancy, and finally learns a deep neural network to support batch querying. We have conducted evaluations on seven datasets totaling over one billion log entries. Experimental results show that Dehydrator reduces the storage space by 84.55%. Dehydrator is 7.36 times more efficient than PostgreSQL, 7.16 times than Neo4j, and 16.17 times than Leonard (the work most closely related to Dehydrator, published at Usenix Security'23).
academic

DEHYDRATOR: শ্রেণিবদ্ধ এনকোডিং এবং ক্রম উৎপাদনের মাধ্যমে প্রোভেন্যান্স গ্রাফ স্টোরেজ উন্নতকরণ

মৌলিক তথ্য

  • পেপার আইডি: 2501.00446
  • শিরোনাম: DEHYDRATOR: শ্রেণিবদ্ধ এনকোডিং এবং ক্রম উৎপাদনের মাধ্যমে প্রোভেন্যান্স গ্রাফ স্টোরেজ উন্নতকরণ
  • লেখক: জি ইয়িং, তিয়ান্তিয়ান ঝু*, মিংকি লভ, তিমিং চেন (ঝেজিয়াং ইন্ডাস্ট্রিয়াল ইউনিভার্সিটি)
  • শ্রেণীবিভাগ: cs.CR (ক্রিপ্টোগ্রাফি এবং নিরাপত্তা)
  • প্রকাশিত জার্নাল: IEEE Transactions on Information Forensics and Security
  • পেপার লিংক: https://arxiv.org/abs/2501.00446

সারসংক্ষেপ

নেটওয়ার্ক হুমকির পরিধি এবং প্রভাব বৃদ্ধির সাথে সাথে, বিশ্লেষকরা অডিট লগ ব্যবহার করে হুমকি ট্র্যাক করতে এবং আক্রমণ তদন্ত করতে পারেন। কার্নেল লগ থেকে নির্মিত প্রোভেন্যান্স গ্রাফ তাদের শক্তিশালী শব্দার্থিক প্রকাশ ক্ষমতা এবং আক্রমণের ইতিহাস সম্পর্ক স্থাপনের ক্ষমতার কারণে ক্রমবর্ধমান আদর্শ ডেটা উৎস হিসাবে বিবেচিত হচ্ছে। তবে, কার্নেল ইভেন্টের উচ্চ ফ্রিকোয়েন্সি এবং আক্রমণের স্থায়িত্বের কারণে, ঐতিহ্যবাহী ডাটাবেস ব্যবহার করে প্রোভেন্যান্স গ্রাফ সংরক্ষণ উচ্চ স্টোরেজ ওভারহেডের চ্যালেঞ্জের সম্মুখীন হয়। এই সমস্যা সমাধানের জন্য, এই পেপারটি DEHYDRATOR প্রস্তাব করে, একটি দক্ষ প্রোভেন্যান্স গ্রাফ স্টোরেজ সিস্টেম। অডিট ফ্রেমওয়ার্ক দ্বারা উৎপন্ন লগের জন্য, DEHYDRATOR ক্ষেত্র-স্তরের অপ্রয়োজনীয়তা ফিল্টার করতে ক্ষেত্র ম্যাপিং এনকোডিং ব্যবহার করে, কাঠামো-স্তরের অপ্রয়োজনীয়তা ফিল্টার করতে শ্রেণিবদ্ধ এনকোডিং ব্যবহার করে, এবং অবশেষে ব্যাচ প্রশ্নের সমর্থন করতে গভীর স্নায়ু নেটওয়ার্ক শিখে। মোট এক বিলিয়নেরও বেশি লগ এন্ট্রি সহ সাতটি ডেটাসেটে মূল্যায়ন করা হয়েছে, পরীক্ষামূলক ফলাফল দেখায় যে DEHYDRATOR স্টোরেজ স্থান 84.55% হ্রাস করে, PostgreSQL থেকে 7.36 গুণ বেশি দক্ষ, Neo4j থেকে 7.16 গুণ বেশি দক্ষ, এবং Leonard থেকে 16.17 গুণ বেশি দক্ষ।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

  1. নেটওয়ার্ক হুমকি বৃদ্ধি: মে 2024 পর্যন্ত, 9,478টি ডেটা লঙ্ঘন ঘটনা ঘটেছে, যার মধ্যে 2024 সালের জানুয়ারির MOAB ঘটনা 260 বিলিয়ন রেকর্ড ফাঁস করেছে
  2. প্রোভেন্যান্স গ্রাফের গুরুত্ব: প্রোভেন্যান্স গ্রাফ একটি নির্দেশিত গ্রাফ কাঠামো হিসাবে কাজ করে, যেখানে নোডগুলি সিস্টেম সত্তা (প্রক্রিয়া, ফাইল, সকেট) প্রতিনিধিত্ব করে এবং প্রান্তগুলি সিস্টেম ইভেন্ট প্রতিনিধিত্ব করে, শক্তিশালী শব্দার্থিক প্রকাশ এবং আক্রমণের ইতিহাস সম্পর্ক স্থাপনের ক্ষমতা সহ
  3. স্টোরেজ চ্যালেঞ্জ: চারটি ঘটনা স্টোরেজ অসুবিধা সৃষ্টি করে:
    • অপরিবর্তনীয় বৃদ্ধি: ডেটা সম্পূর্ণতা বজায় রাখতে, শুধুমাত্র যোগ করুন, মুছবেন না
    • দ্রুত সম্প্রসারণ: প্রতিটি মেশিন প্রতিদিন GB-স্তরের লগ উৎপন্ন করে
    • দীর্ঘ স্থায়িত্ব: অনুপ্রবেশ আবিষ্কৃত হওয়ার আগে গড়ে 188 দিন স্থায়ী হয়
    • প্রশ্নের চাহিদা: হুমকি শিকার এবং কার্যকারণ বিশ্লেষণের জন্য বড় আকারের প্রশ্ন সমর্থন করতে হবে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

বিদ্যমান দক্ষ প্রোভেন্যান্স গ্রাফ স্টোরেজ সিস্টেম (ESSPGs) দুটি বিভাগে বিভক্ত:

  1. ছাঁটাই-ভিত্তিক পদ্ধতি (যেমন LogGC, CPR, NodeMerge, DPR): ক্ষতিকর সংকোচন, উপরের স্তরের উপাদানগুলিতে মিথ্যা নেতিবাচক হতে পারে
  2. এনকোডিং-ভিত্তিক পদ্ধতি (যেমন SEAL, SLEUTH, ELISE, Leonard): হয় প্রশ্ন সমর্থন করতে পারে না বা সহায়ক উপাদানগুলি বিশাল স্টোরেজ স্থান দখল করে

গবেষণা প্রেরণা

বিদ্যমান পদ্ধতিগুলি তিনটি মূল প্রয়োজনীয়তা একযোগে পূরণ করতে পারে না:

  • বিষয়বস্তু ক্ষতিহীন: মিথ্যা নেতিবাচক এড়াতে সমস্ত ডেটা সংরক্ষণ করুন
  • স্টোরেজ দক্ষ: স্টোরেজ ওভারহেড কমিয়ে আনুন
  • প্রশ্ন সমর্থন: বড় আকারের প্রশ্ন চাহিদা পরিচালনা করুন

মূল অবদান

  1. DEHYDRATOR সিস্টেম প্রস্তাব: একটি দক্ষ প্রোভেন্যান্স গ্রাফ স্টোরেজ সিস্টেম যা বিদ্যমান পদ্ধতির সীমাবদ্ধতা অতিক্রম করে, ক্ষেত্র-স্তরের অপ্রয়োজনীয়তা ফিল্টার করতে ক্ষেত্র ম্যাপিং এনকোডিং ব্যবহার করে, কাঠামো-স্তরের অপ্রয়োজনীয়তা ফিল্টার করতে শ্রেণিবদ্ধ এনকোডিং ব্যবহার করে, এবং ব্যাচ প্রশ্ন সমর্থন করতে গভীর স্নায়ু নেটওয়ার্ক ব্যবহার করে
  2. প্রোটোটাইপ সিস্টেম নির্মাণ এবং বড় আকারের মূল্যায়ন: সাতটি ডেটাসেটে মূল্যায়ন (মোট এক বিলিয়নেরও বেশি লগ), স্টোরেজ স্থান 84.55% হ্রাস, PostgreSQL, Neo4j, Leonard থেকে যথাক্রমে 7.36 গুণ, 7.16 গুণ, 16.17 গুণ বেশি দক্ষ
  3. ব্যাপক মূল্যায়ন বিশ্লেষণ: উপাদান প্রভাব, প্রযোজ্য পরিস্থিতি এবং কর্মক্ষমতা নিম্ন সীমা অন্বেষণ করুন, বিলম্ব স্টোরেজ অনুপাত (LSR) মেট্রিক সংজ্ঞায়িত করুন যা স্টোরেজ ওভারহেড এবং বিলম্ব ভারসাম্য রাখে

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

ইনপুট: অডিট ফ্রেমওয়ার্ক দ্বারা সংগৃহীত কাঁচা কার্নেল লগ আউটপুট: দক্ষভাবে সংরক্ষিত প্রোভেন্যান্স গ্রাফ, উপরের স্তরের উপাদানগুলির প্রশ্ন সমর্থন করে সীমাবদ্ধতা: বিষয়বস্তু ক্ষতিহীন, স্টোরেজ দক্ষ, প্রশ্ন সমর্থন

সিস্টেম আর্কিটেকচার

DEHYDRATOR একটি তিন-পর্যায়ের ফ্রেমওয়ার্ক গ্রহণ করে:

1. প্রাক-প্রক্রিয়াকরণ পর্যায় (Pretreatment)

  • লগ পার্সিং: কাঁচা লগ থেকে মূল ক্ষেত্র নিষ্কাশন করতে নিয়মিত অভিব্যক্তি ব্যবহার করুন
  • প্রোভেন্যান্স গ্রাফ নির্মাণ: নোড টেবিল NT (IdentiID, Name, Type) এবং প্রান্ত টেবিল ET (SrcID, DstID, TimeStamp, Operation) নির্মাণ করুন
  • ক্ষেত্র ম্যাপিং এনকোডিং: তিন ধরনের ক্ষেত্র-স্তরের অপ্রয়োজনীয়তা পরিচালনা করুন
    • অনন্য মান: ছোট সংখ্যাসূচক অক্ষর দিয়ে প্রতিস্থাপন করুন
    • পুনরাবৃত্ত মান: সূচক দিয়ে প্রতিস্থাপন করুন
    • বৃদ্ধিমূলক মান: অফসেট দিয়ে প্রতিস্থাপন করুন

2. স্টোরেজ পর্যায় (Storage)

শ্রেণিবদ্ধ এনকোডিং:

  • প্রোভেন্যান্স গ্রাফকে শ্রেণিবদ্ধ নির্দেশিত গ্রাফ হিসাবে মডেল করুন
  • প্রতিটি নোড v এর জন্য, সমস্ত উৎস নোড এবং আগত প্রান্ত তথ্য রেকর্ড করুন
  • একীভূত ম্যাপিং টেবিল MMT এবং শ্রেণিবদ্ধ প্রান্ত টেবিল EThi নির্মাণ করুন
  • নেস্টেড তালিকা কাঠামো: Operation: timeOffset: nodeOffset

মডেল প্রশিক্ষণ:

  • একক-স্তরের শুধুমাত্র ডিকোডার Transformer নির্বাচন করুন
  • স্টোরেজ কাজকে ক্রম উৎপাদন কাজ হিসাবে মডেল করুন
  • char2vec এনকোডিং ব্যবহার করুন, স্বয়ংক্রিয় রিগ্রেসিভ উৎপাদন
  • মডেল পূর্বাভাস ত্রুটি পরিচালনা করতে ত্রুটি সংশোধন টেবিল ECT নির্মাণ করুন

3. প্রশ্ন পর্যায় (Query)

  • নোড তথ্য: ম্যাপিং টেবিল MT এর মাধ্যমে সূচক পান, নোড তথ্য পুনরুদ্ধার করুন
  • প্রান্ত তথ্য: সূচক DNN মডেলে ইনপুট করুন, ক্রম উৎপাদন করুন, ECT ত্রুটি সংশোধন, শ্রেণিবদ্ধ ডিকোডিং পাঠযোগ্য তথ্য পান

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. শ্রেণিবদ্ধ এনকোডিং ডিজাইন:
    • কার্যকারণ বিশ্লেষণের পিছনের দিকের প্রশ্ন বৈশিষ্ট্যের উপর ভিত্তি করে
    • একাধিক সমান্তরাল প্রান্তকে সংক্ষিপ্ত এনকোডিং ফর্মে সংকুচিত করুন
    • তথ্য ঘনত্ব বৃদ্ধি করুন, মডেল প্রশিক্ষণ ত্বরান্বিত করুন
  2. DNN মডেল নির্বাচন:
    • একক-স্তরের ডিকোডার Transformer বহু-স্তরের LSTM প্রতিস্থাপন করুন
    • আরও ভাল সমান্তরালকরণ ক্ষমতা এবং বৈশিষ্ট্য নিষ্কাশন ক্ষমতা
    • স্টোরেজ কাজের নিম্ন-স্তরের পুনরাবৃত্ত প্যাটার্ন স্বীকৃতির জন্য উপযুক্ত
  3. ত্রুটি সংশোধন প্রক্রিয়া:
    • ECT টেবিল অবস্থান এবং সঠিক অক্ষর রেকর্ড করুন
    • DNN সংকোচন সমর্থন করার সময় বিষয়বস্তু ক্ষতিহীনতা নিশ্চিত করুন

পরীক্ষামূলক সেটআপ

ডেটাসেট

সাতটি ডেটাসেট, মোট এক বিলিয়নেরও বেশি লগ:

  • G1-G4: DARPA TC E3 এর CADETS, THEIA, TRACE গ্রুপ
  • G5-G6: DARPA TC E4 এর TRACE গ্রুপ
  • G7: DEPIMACT ডেটাসেট সাবসেট
  • গড় প্রান্ত সংখ্যা: 17,754,566 (Leonard থেকে 9.6 গুণ বড়)

মূল্যায়ন মেট্রিক্স

  • স্টোরেজ ওভারহেড: BPpre (প্রাক-প্রক্রিয়াকরণ) এবং BPpost (পোস্ট-প্রক্রিয়াকরণ) বাইট সংখ্যা
  • স্টোরেজ বিলম্ব: Ts সময় খরচ
  • বিলম্ব স্টোরেজ অনুপাত: LSR = (BPpre - BPpost)/Ts

তুলনামূলক পদ্ধতি

  • PostgreSQL: সম্পর্কিত ডাটাবেস
  • Neo4j: গ্রাফ ডাটাবেস
  • Leonard: DNN-ভিত্তিক স্টোরেজ সিস্টেম (Usenix Security'23)

বাস্তবায়ন বিবরণ

  • পরিবেশ: Python 3.9, PyTorch 1.13.1, AMD EPYC 7513 প্রসেসর, RTX A6000 GPU
  • হাইপারপ্যারামিটার: ব্যাচ আকার 4096, Adam অপটিমাইজার, শেখার হার 0.001, সর্বাধিক প্রশিক্ষণ পুনরাবৃত্তি 5

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

সিস্টেমগড় স্টোরেজ ওভারহেড (MB)গড় বিলম্ব (s)DEHYDRATOR এর তুলনায় উন্নতি
PostgreSQL1,818457.36×
Neo4j1,770217.16×
Leonard3,99130,23316.17×
DEHYDRATOR2473,205-

প্রশ্ন কর্মক্ষমতা

বিভিন্ন গভীরতার BFS প্রশ্ন পরীক্ষায়:

  • Neo4j সেরা পারফরম্যান্স (~4.92s)
  • DEHYDRATOR দ্বিতীয় (~32.02s)
  • PostgreSQL সবচেয়ে খারাপ (~32.08s)

অপসারণ পরীক্ষা

উপাদান অবদান বিশ্লেষণ:

  • মূল গ্রাফ: 1598.69MB
  • ক্ষেত্র ম্যাপিং এনকোডিং পরে: 405.2MB (25.3%)
  • শ্রেণিবদ্ধ এনকোডিং পরে: 75.98MB (4.7%)
  • মডেল প্রশিক্ষণ পরে: 192.42MB (12%)

শ্রেণিবদ্ধ এনকোডিং প্রভাব:

  • শ্রেণিবদ্ধ এনকোডিং সহ: EThi 20.19M, প্রশিক্ষণ সময় 660.69s, ECT 50.79M
  • শ্রেণিবদ্ধ এনকোডিং ছাড়া: EThi 268.31M, প্রশিক্ষণ সময় 5814.42s, ECT 1064.25M
  • শ্রেণিবদ্ধ এনকোডিং প্রশিক্ষণ সময় 8.8 গুণ হ্রাস করে, ECT আকার 20.95 গুণ হ্রাস করে

প্রযোজ্য পরিস্থিতি বিশ্লেষণ

তাত্ত্বিক উদ্ভাবন প্রমাণ করে: যখন গড় ডিগ্রি davg ≥ 3, শ্রেণিবদ্ধ এনকোডিং কার্যকর পরীক্ষামূলক যাচাইকরণ: ডিগ্রি 3, 4, 5 সহ ডেটাসেটে শ্রেণিবদ্ধ এনকোডিং কার্যকর

সম্পর্কিত কাজ

অনুপ্রবেশ সনাক্তকরণ

  • হিউরিস্টিক পদ্ধতি: HOLMES, SLEUTH, Poirot ইত্যাদি MITRE ATT&CK এর উপর ভিত্তি করে ম্যাচিং নিয়ম নির্মাণ করে
  • অসামান্যতা সনাক্তকরণ: Streamspot, Unicorn, KAIROS ইত্যাদি স্বাভাবিক আচরণ বিচ্যুতি চিহ্নিত করে অনুপ্রবেশ সনাক্ত করে

আক্রমণ তদন্ত

  • RapSheet, HERCULE, NODOZE ইত্যাদি সিস্টেম হুমকি স্কোরিং এবং কার্যকারণ বিশ্লেষণ পরিচালনা করে
  • DEPIMPACT, ATLAS ইত্যাদি নির্ভরতা বিশ্লেষণ এবং আক্রমণ প্যাটার্ন স্বীকৃতি পরিচালনা করে

গ্রাফ সংকোচন

  • ক্ষতিকর পদ্ধতি: LogGC, CPR, NodeMerge, DPR ইত্যাদি ছাঁটাই কৌশল
  • ক্ষতিহীন পদ্ধতি: SEAL, ELISE, Leonard ইত্যাদি এনকোডিং কৌশল

উপসংহার এবং আলোচনা

প্রধান উপসংহার

  1. DEHYDRATOR সফলভাবে প্রোভেন্যান্স গ্রাফ স্টোরেজের তিনটি প্রধান চ্যালেঞ্জ সমাধান করে: বিষয়বস্তু ক্ষতিহীন, স্টোরেজ দক্ষ, প্রশ্ন সমর্থন
  2. শ্রেণিবদ্ধ এনকোডিং মূল উদ্ভাবন, কার্যকরভাবে কাঠামো-স্তরের অপ্রয়োজনীয়তা পরিচালনা করে
  3. একক-স্তরের Transformer বহু-স্তরের LSTM থেকে স্টোরেজ কাজের জন্য আরও উপযুক্ত
  4. বড় আকারের ডেটাসেটে বিদ্যমান পদ্ধতির উপর উল্লেখযোগ্য উন্নতি

সীমাবদ্ধতা

  1. স্টোরেজ বিলম্ব উচ্চ: গড় 3205 সেকেন্ড, ডেটাসেট সময় সময়ের 13.29% দখল করে
  2. প্রশ্ন দক্ষতা: স্বয়ংক্রিয় রিগ্রেসিভ উৎপাদন দীর্ঘ ক্রম প্রশ্ন বিলম্ব সৃষ্টি করে
  3. মডেল ক্ষমতা নির্বাচন: সর্বোত্তম মডেল ক্ষমতা η নির্ধারণের জন্য তাত্ত্বিক নির্দেশনা অভাব
  4. প্রযোজ্য পরিধি: প্রধানত শীতল স্টোরেজ পরিস্থিতিতে প্রযোজ্য, ACID বৈশিষ্ট্য সমর্থন করে না

ভবিষ্যত দিকনির্দেশনা

  1. AI ত্বরণ প্রযুক্তি ব্যবহার করে প্রশিক্ষণ এবং অনুমান দক্ষতা উন্নত করুন
  2. সর্বোত্তম মডেল ক্ষমতা নির্বাচনের তাত্ত্বিক বিশ্লেষণ
  3. সাধারণ গ্রাফ ডাটাবেস অ্যাপ্লিকেশনে সম্প্রসারণ করুন
  4. প্রশ্ন বিলম্ব হ্রাস করতে প্রশ্ন অ্যালগরিদম অপটিমাইজ করুন

গভীর মূল্যায়ন

সুবিধা

  1. সমস্যা গুরুত্ব: নেটওয়ার্ক নিরাপত্তা ক্ষেত্রের বাস্তব ব্যথার পয়েন্ট সমাধান করে
  2. পদ্ধতি উদ্ভাবনী: শ্রেণিবদ্ধ এনকোডিং চতুরভাবে ডোমেইন বৈশিষ্ট্য এবং DNN সুবিধা একত্রিত করে
  3. পরীক্ষা সম্পূর্ণ: বড় আকারের ডেটাসেট যাচাইকরণ, ব্যাপক অপসারণ পরীক্ষা এবং তুলনামূলক বিশ্লেষণ
  4. প্রকৌশল মূল্য: উল্লেখযোগ্য স্টোরেজ দক্ষতা উন্নতি, শক্তিশালী ব্যবহারিকতা

অপূর্ণতা

  1. বিলম্ব সমস্যা: স্টোরেজ এবং প্রশ্ন বিলম্ব এখনও উচ্চ, রিয়েল-টাইম অ্যাপ্লিকেশন সীমিত করে
  2. তাত্ত্বিক বিশ্লেষণ: মডেল ক্ষমতা নির্বাচনের তাত্ত্বিক নির্দেশনা অভাব
  3. প্রযোজ্য পরিধি: প্রধানত নির্দিষ্ট প্রোভেন্যান্স গ্রাফ পরিস্থিতিতে লক্ষ্য করা, সীমিত সাধারণীকরণ
  4. বেসলাইন তুলনা: Leonard বাস্তবায়ন অন্যায্য তুলনা থাকতে পারে

প্রভাব

  1. একাডেমিক অবদান: প্রোভেন্যান্স গ্রাফ স্টোরেজের জন্য নতুন প্রযুক্তি পথ প্রদান করে
  2. ব্যবহারিক মূল্য: নেটওয়ার্ক নিরাপত্তা অবকাঠামোর জন্য গুরুত্বপূর্ণ
  3. পুনরুৎপাদনযোগ্যতা: কোড এবং ডেটা ওপেন সোর্স করার প্রতিশ্রুতি
  4. প্রচার সম্ভাবনা: পদ্ধতি অন্যান্য গ্রাফ স্টোরেজ পরিস্থিতিতে সম্প্রসারণযোগ্য

প্রযোজ্য পরিস্থিতি

  1. নেটওয়ার্ক নিরাপত্তা: EDR সিস্টেম, হুমকি শিকার, আক্রমণ তদন্ত
  2. শীতল স্টোরেজ: ঐতিহাসিক ডেটা সংরক্ষণ এবং বিশ্লেষণ
  3. বড় আকারের গ্রাফ ডেটা: উচ্চ ডিগ্রি, উচ্চ অপ্রয়োজনীয়তা গ্রাফ কাঠামো স্টোরেজ
  4. ব্যাচ প্রশ্ন: বিপুল সংখ্যক সমান্তরাল প্রশ্নের প্রয়োজন এমন অ্যাপ্লিকেশন পরিস্থিতি

সংদর্ভ

পেপারটি 93টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, যা নেটওয়ার্ক নিরাপত্তা, গ্রাফ সংকোচন, গভীর শিক্ষা এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।