2025-11-12T22:58:10.887954

Learning Joint Embeddings of Function and Process Call Graphs for Malware Detection

Aneja, Aneja, Kantarcioglu

Software systems can be represented as graphs, capturing dependencies among functions and processes. An interesting aspect of software systems is that they can be represented as different types of graphs, depending on the extraction goals and priorities. For example, function calls within the software can be captured to create function call graphs, which highlight the relationships between functions and their dependencies. Alternatively, the processes spawned by the software can be modeled to generate process interaction graphs, which focus on runtime behavior and inter-process communication. While these graph representations are related, each captures a distinct perspective of the system, providing complementary insights into its structure and operation. While previous studies have leveraged graph neural networks (GNNs) to analyze software behaviors, most of this work has focused on a single type of graph representation. The joint modeling of both function call graphs and process interaction graphs remains largely underexplored, leaving opportunities for deeper, multi-perspective analysis of software systems. This paper presents a pipeline for constructing and training Function Call Graphs (FCGs) and Process Call Graphs (PCGs) and learning joint embeddings. We demonstrate that joint embeddings outperform a single-graph model. In this paper, we propose GeminiNet, a unified neural network approach that learns joint embeddings from both FCGs and PCGs. We construct a new dataset of 635 Windows executables (318 malicious and 317 benign), extracting FCGs via Ghidra and PCGs via Any.Run sandbox. GeminiNet employs dual graph convolutional branches with an adaptive gating mechanism that balances contributions from static and dynamic views.

academic

ম্যালওয়্যার সনাক্তকরণের জন্য ফাংশন এবং প্রসেস কল গ্রাফের যৌথ এম্বেডিং শেখা

মৌলিক তথ্য

পেপার আইডি: 2510.09984
শিরোনাম: Learning Joint Embeddings of Function and Process Call Graphs for Malware Detection
লেখক: Kartikeya Aneja (University of Wisconsin-Madison), Nagender Aneja (Virginia Tech), Murat Kantarcioglu (Virginia Tech)
শ্রেণীবিভাগ: cs.LG (মেশিন লার্নিং), cs.CR (ক্রিপ্টোগ্রাফি এবং নিরাপত্তা)
প্রকাশনা সম্মেলন: 39th Conference on Neural Information Processing Systems (NeurIPS 2025) Workshop: New Perspectives in Advancing Graph Machine Learning
পেপার লিঙ্ক: https://arxiv.org/abs/2510.09984

সারসংক্ষেপ

সফটওয়্যার সিস্টেমগুলি গ্রাফ কাঠামো হিসাবে প্রতিনিধিত্ব করা যায়, যা ফাংশন এবং প্রক্রিয়াগুলির মধ্যে নির্ভরতা ক্যাপচার করে। নিষ্কাশন লক্ষ্য এবং অগ্রাধিকারের উপর ভিত্তি করে, সফটওয়্যার সিস্টেমগুলি বিভিন্ন ধরনের গ্রাফ হিসাবে প্রতিনিধিত্ব করা যায়। উদাহরণস্বরূপ, ফাংশন কল গ্রাফ (FCG) ফাংশনগুলির মধ্যে সম্পর্ক তুলে ধরে, যখন প্রসেস ইন্টারঅ্যাকশন গ্রাফ (PCG) রানটাইম আচরণ এবং প্রক্রিয়া-মধ্যে যোগাযোগের উপর দৃষ্টি নিবদ্ধ করে। যদিও এই গ্রাফ প্রতিনিধিত্বগুলি সম্পর্কিত, প্রতিটি সিস্টেমের বিভিন্ন দৃষ্টিভঙ্গি ক্যাপচার করে এবং পরিপূরক অন্তর্দৃষ্টি প্রদান করে। পূর্ববর্তী গবেষণা প্রধানত একক গ্রাফ প্রতিনিধিত্বের উপর দৃষ্টি নিবদ্ধ করেছে, FCG এবং PCG-এর যৌথ মডেলিং সম্পর্কিত কাজ তুলনামূলকভাবে কম। এই পেপারটি GeminiNet প্রস্তাব করে, একটি একীভূত নিউরাল নেটওয়ার্ক পদ্ধতি যা FCG এবং PCG-এর যৌথ এম্বেডিং শেখে। 635টি Windows এক্সিকিউটেবল ফাইলের ডেটাসেটে পরীক্ষা-নিরীক্ষা দেখায় যে যৌথ এম্বেডিং একক-গ্রাফ মডেলগুলির চেয়ে উল্লেখযোগ্যভাবে ভাল।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

ম্যালওয়্যার সনাক্তকরণ সাইবার নিরাপত্তা ক্ষেত্রের একটি মূল চ্যালেঞ্জ। ঐতিহ্যবাহী পদ্ধতিগুলি প্রধানত বিশ্লেষণের জন্য সফটওয়্যার প্রতিনিধিত্বের একক ধরনের উপর নির্ভর করে, হয় স্ট্যাটিক বিশ্লেষণ (যেমন ফাংশন কল গ্রাফ) বা ডায়নামিক বিশ্লেষণ (যেমন প্রসেস ইন্টারঅ্যাকশন গ্রাফ), কিন্তু খুব কমই উভয়কে একত্রিত করে।

গবেষণার গুরুত্ব

বহু-দৃষ্টিভঙ্গি বিশ্লেষণের প্রয়োজন: সফটওয়্যার সিস্টেমগুলি জটিল, একক দৃষ্টিভঙ্গি গুরুত্বপূর্ণ তথ্য মিস করা সহজ
প্রতিকূল দৃঢ়তা: একক মোডালিটির উপর নির্ভরতা প্রতিকূল আক্রমণের জন্য সহজ, বহু-মোডাল ফিউশন দৃঢ়তা বৃদ্ধি করতে পারে
পরিপূরক তথ্য: স্ট্যাটিক FCG নিয়ন্ত্রণ প্রবাহ কাঠামো ক্যাপচার করে, ডায়নামিক PCG সম্পাদন ট্র্যাজেক্টরি প্রতিফলিত করে, উভয়ই পরিপূরক

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

একক গ্রাফ প্রতিনিধিত্ব: বেশিরভাগ গবেষণা শুধুমাত্র FCG বা PCG-এর একটি ব্যবহার করে
অসম্পূর্ণ তথ্য: স্ট্যাটিক বিশ্লেষণ রানটাইম আচরণ ক্যাপচার করতে পারে না, ডায়নামিক বিশ্লেষণ অনির্বাহিত কোড পাথ মিস করতে পারে
সরল ফিউশন পদ্ধতি: বিদ্যমান বহু-মোডাল পদ্ধতিগুলি প্রধানত সরল সংযোজন ব্যবহার করে, স্ব-অভিযোজিত ওজন প্রক্রিয়া অভাব

গবেষণা প্রেরণা

এই পেপারটি FCG এবং PCG-এর এম্বেডিং প্রতিনিধিত্ব যৌথভাবে শিখে একটি আরও ব্যাপক এবং শক্তিশালী ম্যালওয়্যার সনাক্তকরণ সিস্টেম তৈরি করার লক্ষ্য রাখে, একক মোডালিটির সীমাবদ্ধতা অতিক্রম করে।

মূল অবদান

GeminiNet আর্কিটেকচার প্রস্তাব: একটি দ্বি-শাখা গ্রাফ কনভোলিউশনাল নেটওয়ার্ক ডিজাইন করা যা যথাক্রমে FCG এবং PCG প্রক্রিয়া করে এবং স্ব-অভিযোজিত গেটিং মেকানিজমের মাধ্যমে এম্বেডিং ফিউজ করে
বহু-মোডাল ডেটাসেট নির্মাণ: 635টি Windows এক্সিকিউটেবল ফাইল সমন্বিত একটি ডেটাসেট তৈরি করা, একযোগে FCG এবং PCG নিষ্কাশন করা
যৌথ নোড বৈশিষ্ট্য ডিজাইন: স্থানীয় ডিগ্রি বিতরণ (LDP) এবং Shannon এন্ট্রপি একত্রিত করা, কাঠামোগত এবং পরিসংখ্যানগত তথ্য প্রদান করা
ফিউশন সুবিধা যাচাই: ব্যাপক পরীক্ষার মাধ্যমে যৌথ এম্বেডিং একক-গ্রাফ মডেল এবং সরল মার্জ পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে ভাল প্রমাণ করা

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

Windows এক্সিকিউটেবল ফাইল দেওয়া, এর ফাংশন কল গ্রাফ G₁=(V₁,E₁) এবং প্রসেস কল গ্রাফ G₂=(V₂,E₂) নিষ্কাশন করা, দ্বি-শ্রেণী (ম্যালিশাস/বেনিগন) সম্পাদনের জন্য যৌথ এম্বেডিং প্রতিনিধিত্ব শিখা।

ডেটাসেট নির্মাণ

ফাংশন কল গ্রাফ (FCG)

সরঞ্জাম: Ghidra রিভার্স ইঞ্জিনিয়ারিং ফ্রেমওয়ার্ক ব্যবহার করা
প্রতিনিধিত্ব: নোডগুলি ফাংশন প্রতিনিধিত্ব করে, নির্দেশিত প্রান্তগুলি ফাংশন কল সম্পর্ক প্রতিনিধিত্ব করে
স্কেল: 635টি এক্সিকিউটেবল ফাইল, মোট 449,960টি নোড এবং 1,048,741টি প্রান্ত
প্রাক-প্রক্রিয়াকরণ: ফাংশন নাম সংখ্যাগত সনাক্তকারী দ্বারা প্রতিস্থাপিত

প্রসেস কল গ্রাফ (PCG)

সরঞ্জাম: Any.Run ম্যালওয়্যার স্যান্ডবক্স ব্যবহার করা
সম্পাদন সময়: 60 সেকেন্ড (Küchler এবং অন্যদের গবেষণার উপর ভিত্তি করে, 98% কোড কভারেজ)
প্রতিনিধিত্ব: নোডগুলি প্রক্রিয়া প্রতিনিধিত্ব করে, নির্দেশিত প্রান্তগুলি প্রক্রিয়া-মধ্যে যোগাযোগ বা সৃষ্টি সম্পর্ক প্রতিনিধিত্ব করে
স্কেল: 3,053টি নোড এবং 2,663টি প্রান্ত

নোড বৈশিষ্ট্য ডিজাইন

স্থানীয় ডিগ্রি বিতরণ (LDP)

প্রতিটি নোডের জন্য একটি 5-মাত্রিক বৈশিষ্ট্য ভেক্টর গণনা করা:

নোডের নিজস্ব ডিগ্রি
প্রতিবেশী নোডের ডিগ্রির ন্যূনতম, সর্বোচ্চ, গড়, এবং মান বিচ্যুতি

Shannon এন্ট্রপি

ফাইল-স্তরের তথ্য এন্ট্রপি গণনা করা: H(X) = -∑ᵢ pᵢ log₂ pᵢ

যেখানে pᵢ হল বাইট i-এর সম্ভাবনা। উচ্চ এন্ট্রপি শক্তিশালী র্যান্ডমনেস নির্দেশ করে (সম্ভবত ম্যালওয়্যার), নিম্ন এন্ট্রপি উচ্চ অপ্রয়োজনীয়তা নির্দেশ করে (সম্ভবত বেনিগন সফটওয়্যার)।

সমন্বিত বৈশিষ্ট্য (LDP+Entropy)

LDP এবং Shannon এন্ট্রপি সংযোজন করা, একটি 6-মাত্রিক বৈশিষ্ট্য ভেক্টর গঠন করা, স্থানীয় কাঠামো এবং বৈশ্বিক পরিসংখ্যানগত তথ্য ফিউজ করা।

GeminiNet আর্কিটেকচার

দ্বি-শাখা ডিজাইন

শাখা 1: FCG → GCN₁ → বৈশ্বিক পুলিং → g₁
শাখা 2: PCG → GCN₂ → বৈশ্বিক পুলিং → g₂

স্ব-অভিযোজিত গেটিং মেকানিজম

শিক্ষণযোগ্য গেটিং ভেক্টর প্রবর্তন করা: α = softmax(w)

যেখানে w প্রশিক্ষণযোগ্য প্যারামিটার। চূড়ান্ত যৌথ এম্বেডিং হল: g = α₁g₁ + α₂g₂

α₁ + α₂ = 1 এবং αᵢ ≥ 0 সীমাবদ্ধতা সন্তুষ্ট করা।

শ্রেণীবিভাগ স্তর

যৌথ এম্বেডিং সম্পূর্ণ-সংযুক্ত স্তর এবং ReLU সক্রিয়করণের মাধ্যমে: ŷ = softmax(MLP(g))

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

স্ব-অভিযোজিত ওজন ফিউশন: স্ট্যাটিক সংযোজন বা গড়ের তুলনায়, গেটিং মেকানিজম নমুনা অনুযায়ী প্রতিটি মোডালিটির অবদান স্ব-অভিযোজিতভাবে সামঞ্জস্য করতে পারে
বহু-দানাদার বৈশিষ্ট্য: স্থানীয় টপোলজি (LDP) এবং বৈশ্বিক পরিসংখ্যান (এন্ট্রপি) তথ্য একত্রিত করা
প্রান্ত-থেকে-প্রান্ত শেখা: সম্পূর্ণ আর্কিটেকচার প্রান্ত-থেকে-প্রান্ত প্রশিক্ষণযোগ্য, গেটিং ওজন স্বয়ংক্রিয়ভাবে অপ্টিমাইজ করা
আর্কিটেকচার নমনীয়তা: শাখাগুলি বন্ধ করে একক-গ্রাফ মডেলে অবনত করা যায়

পরীক্ষামূলক সেটআপ

ডেটাসেট

স্কেল: 635টি Windows PE ফাইল (318 ম্যালিশাস, 317 বেনিগন)
উৎস: ম্যালওয়্যার নমুনা এবং বেনিগন সফটওয়্যার নমুনা
বিভাজন: 5-ফোল্ড ক্রস-ভ্যালিডেশন

মূল্যায়ন মেট্রিক্স

প্রধান মেট্রিক: F1 স্কোর (নির্ভুলতা এবং রিকল ভারসাম্য)
পরিসংখ্যানগত মেট্রিক্স: গড়, মান বিচ্যুতি, ন্যূনতম, মধ্যমা, সর্বোচ্চ

তুলনামূলক পদ্ধতি

একক-গ্রাফ মডেল: শুধুমাত্র FCG বা PCG ব্যবহার করা
মার্জ করা গ্রাফ মডেল: FCG এবং PCG প্রান্ত তালিকা একটি একক গ্রাফে মার্জ করা
বিভিন্ন GNN আর্কিটেকচার: GCN, SGC, GIN, GraphSAGE, MLP

বাস্তবায়ন বিবরণ

যাচাইকরণ পদ্ধতি: 5-ফোল্ড ক্রস-ভ্যালিডেশন
শেখার হার সময়সূচী: OneCycleLR, ReduceLROnPlateau
নিয়মিতকরণ: Dropout
আর্কিটেকচার প্যারামিটার: 4-6 স্তরের GCN, 2-6 স্তরের সম্পূর্ণ-সংযুক্ত, 32-64 লুকানো মাত্রা

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

সর্বোত্তম কনফিগারেশন কর্মক্ষমতা

টেবিল 1 অনুযায়ী, সর্বোত্তম কনফিগারেশন অর্জন করে:

গড় F1 স্কোর: 0.85 (মান বিচ্যুতি 0.06-0.09)
সর্বোচ্চ F1 স্কোর: 0.94
সর্বোত্তম বৈশিষ্ট্য: LDP+Entropy
সর্বোত্তম আর্কিটেকচার: ওজনযুক্ত যোগফল ফিউশন সহ SGC এবং GCN

বিভিন্ন কনফিগারেশন তুলনা

যৌথ এম্বেডিং (both_wsum): F1=0.85, মধ্যমা≈0.87
একক PCG মডেল: F1=0.81-0.83, মধ্যমা≈0.82
মার্জ করা গ্রাফ (both_merged): F1=0.72-0.73, মধ্যমা≈0.72
একক FCG মডেল: F1=0.68-0.72, মধ্যমা≈0.67

বিলোপন পরীক্ষা

গ্রাফ ধরনের বিলোপন

Kruskal-Wallis পরীক্ষা (p=3.86×10⁻⁷⁶) বিভিন্ন কনফিগারেশনের মধ্যে উল্লেখযোগ্য পার্থক্য নির্দেশ করে:

both_wsum > single_pcg > both_merged > single_fcg
সমস্ত পেয়ারওয়াইজ তুলনা উল্লেখযোগ্য (Bonferroni সংশোধনের পরে)

বৈশিষ্ট্য ধরনের বিলোপন

Kruskal-Wallis পরীক্ষা (p=2.57×10⁻³³) বৈশিষ্ট্যের গুরুত্ব প্রদর্শন করে:

LDP+Entropy (মধ্যমা≈0.85) > LDP (≈0.82) > Entropy (≈0.77)
সমন্বিত বৈশিষ্ট্য একক বৈশিষ্ট্যের চেয়ে উল্লেখযোগ্যভাবে ভাল

পরিসংখ্যানগত তাৎপর্য বিশ্লেষণ

Dunn পরীক্ষার মাধ্যমে যাচাই করা:

ওজনযুক্ত যোগফল ফিউশন প্রান্ত মার্জ পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে ভাল
PCG একক ব্যবহার FCG একক ব্যবহারের চেয়ে ভাল
যৌথ বৈশিষ্ট্য উল্লেখযোগ্যভাবে কর্মক্ষমতা বৃদ্ধি করে

পরীক্ষামূলক আবিষ্কার

মোডালিটি পরিপূরকতা: FCG এবং PCG পরিপূরক তথ্য প্রদান করে, যৌথ ব্যবহার সর্বোত্তম ফলাফল দেয়
ফিউশন পদ্ধতির গুরুত্ব: স্ব-অভিযোজিত ওজনযুক্ত যোগফল সরল প্রান্ত মার্জের চেয়ে ভাল
বৈশিষ্ট্য সমন্বয় প্রভাব: কাঠামোগত বৈশিষ্ট্য (LDP) এবং পরিসংখ্যানগত বৈশিষ্ট্য (এন্ট্রপি) সমন্বয় সিনার্জিস্টিক প্রভাব তৈরি করে
আর্কিটেকচার দৃঢ়তা: একাধিক GNN আর্কিটেকচার যৌথ এম্বেডিং ডিজাইন থেকে উপকৃত হতে পারে

উপসংহার এবং আলোচনা

প্রধান উপসংহার

যৌথ এম্বেডিং সুবিধা: FCG এবং PCG যৌথ শেখা একক মোডালিটির চেয়ে উল্লেখযোগ্যভাবে ভাল
ফিউশন মেকানিজমের গুরুত্ব: স্ব-অভিযোজিত গেটিং মেকানিজম সরল মার্জ কৌশলের চেয়ে ভাল
বৈশিষ্ট্য প্রকৌশলের মূল্য: কাঠামোগত বৈশিষ্ট্য এবং পরিসংখ্যানগত বৈশিষ্ট্য সমন্বয় বৈষম্যমূলক ক্ষমতা বৃদ্ধি করে
পদ্ধতি সর্বজনীনতা: দুর্বলতা সনাক্তকরণ, বাইনারি সাদৃশ্য সনাক্তকরণ ইত্যাদি কাজে প্রসারিত করা যায়

সীমাবদ্ধতা

ডেটাসেট স্কেল: 635টি নমুনা তুলনামূলকভাবে ছোট, সাধারণীকরণ ক্ষমতা প্রভাবিত করতে পারে
সম্পাদন সময় সীমাবদ্ধতা: 60 সেকেন্ডের স্যান্ডবক্স সম্পাদন সমস্ত ম্যালিশাস আচরণ ক্যাপচার করতে পারে না
বৈশিষ্ট্য প্রকৌশল: হাতে-কলমে ডিজাইন করা LDP এবং এন্ট্রপি বৈশিষ্ট্যের উপর নির্ভরতা
গণনামূলক জটিলতা: দ্বি-শাখা আর্কিটেকচার গণনামূলক ওভারহেড বৃদ্ধি করে

ভবিষ্যত দিকনির্দেশনা

স্কেল সম্প্রসারণ: বৃহত্তর ডেটাসেটে পদ্ধতির কার্যকারিতা যাচাই করা
ব্যাখ্যাযোগ্যতা: মডেল সিদ্ধান্ত প্রক্রিয়া বোঝার জন্য ব্যাখ্যা কৌশল বিকাশ করা
প্রতিকূল দৃঢ়তা: প্রতিকূল নমুনার বিরুদ্ধে দৃঢ়তা মূল্যায়ন করা
স্বয়ংক্রিয় বৈশিষ্ট্য শেখা: হাতে-কলমে বৈশিষ্ট্যের উপর নির্ভরতা হ্রাস করা

গভীর মূল্যায়ন

সুবিধা

শক্তিশালী উদ্ভাবনী: প্রথমবার ম্যালওয়্যার সনাক্তকরণের জন্য FCG এবং PCG পদ্ধতিগতভাবে যৌথভাবে ব্যবহার করা
যুক্তিসঙ্গত পদ্ধতি: দ্বি-শাখা আর্কিটেকচার ডিজাইন যুক্তিসঙ্গত, গেটিং মেকানিজমের তাত্ত্বিক সমর্থন রয়েছে
ব্যাপক পরীক্ষা: 5-ফোল্ড ক্রস-ভ্যালিডেশন, একাধিক আর্কিটেকচার তুলনা, পরিসংখ্যানগত তাৎপর্য পরীক্ষা
শক্তিশালী ফলাফল প্ররোচনা: সামঞ্জস্যপূর্ণ ফলাফল পদ্ধতির কার্যকারিতা এবং স্থিতিশীলতা নির্দেশ করে

অপূর্ণতা

ডেটাসেট সীমাবদ্ধতা: শুধুমাত্র Windows PE ফাইলের মধ্যে সীমাবদ্ধ, নমুনা পরিমাণ তুলনামূলকভাবে ছোট
অপর্যাপ্ত বেসলাইন তুলনা: সর্বশেষ ম্যালওয়্যার সনাক্তকরণ পদ্ধতির সাথে তুলনার অভাব
গণনামূলক ওভারহেড বিশ্লেষণ: দ্বি-শাখা আর্কিটেকচারের গণনামূলক জটিলতা বিস্তারিত বিশ্লেষণ অনুপস্থিত
হাইপারপ্যারামিটার সংবেদনশীলতা: গেটিং মেকানিজমের হাইপারপ্যারামিটার সংবেদনশীলতা সম্পূর্ণভাবে বিশ্লেষণ করা হয়নি

প্রভাব

একাডেমিক অবদান: নিরাপত্তা ক্ষেত্রে বহু-মোডাল গ্রাফ শেখার প্রয়োগের জন্য নতুন চিন্তাভাবনা প্রদান করে
ব্যবহারিক মূল্য: ম্যালওয়্যার সনাক্তকরণ সিস্টেমে সরাসরি প্রয়োগ করা যায়
পুনরুৎপাদনযোগ্যতা: পদ্ধতি বর্ণনা স্পষ্ট, পরীক্ষামূলক সেটআপ বিস্তারিত
সম্প্রসারণযোগ্যতা: ফ্রেমওয়ার্ক অন্যান্য সফটওয়্যার বিশ্লেষণ কাজে প্রসারিত করা যায়

প্রযোজ্য পরিস্থিতি

ম্যালওয়্যার সনাক্তকরণ: এন্টারপ্রাইজ নিরাপত্তা পণ্য, অ্যান্টিভাইরাস সফটওয়্যার
সফটওয়্যার বিশ্লেষণ: দুর্বলতা সনাক্তকরণ, কোড সাদৃশ্য বিশ্লেষণ
গবেষণা প্ল্যাটফর্ম: বহু-মোডাল গ্রাফ শেখার পরীক্ষার প্ল্যাটফর্ম
শিক্ষা প্রয়োগ: নিরাপত্তা ক্ষেত্রে গ্রাফ নিউরাল নেটওয়ার্কের শিক্ষা কেস

তথ্যসূত্র

পেপারটি 18টি সম্পর্কিত তথ্যসূত্র উদ্ধৃত করে, যা অন্তর্ভুক্ত করে:

গ্রাফ প্রতিনিধিত্ব শেখার মৌলিক পদ্ধতি
ম্যালওয়্যার সনাক্তকরণ সম্পর্কিত কাজ
গ্রাফ নিউরাল নেটওয়ার্ক আর্কিটেকচার (GCN, GIN, GraphSAGE, SGC)
সফটওয়্যার বিশ্লেষণ সরঞ্জাম এবং প্ল্যাটফর্ম

মূল তথ্যসূত্রগুলি Xu এবং অন্যদের GIN আর্কিটেকচার, Wu এবং অন্যদের SGC সরলীকরণ পদ্ধতি, এবং ম্যালওয়্যার সনাক্তকরণের একাধিক সম্পর্কিত কাজ অন্তর্ভুক্ত করে, যা এই পেপারের জন্য দৃঢ় তাত্ত্বিক ভিত্তি এবং তুলনামূলক মানদণ্ড প্রদান করে।