The development of self-supervised graph pre-training methods is a crucial ingredient in recent efforts to design robust graph foundation models (GFMs). Structure-based pre-training methods are under-explored yet crucial for downstream applications which rely on underlying graph structure. In addition, pre-training traditional message passing GNNs to capture global and regional structure is often challenging due to the risk of oversmoothing as network depth increases. We address these gaps by proposing the Laplacian Eigenvector Learning Module (LELM), a novel pre-training module for graph neural networks (GNNs) based on predicting the low-frequency eigenvectors of the graph Laplacian. Moreover, LELM introduces a novel architecture that overcomes oversmoothing, allowing the GNN model to learn long-range interdependencies. Empirically, we show that models pre-trained via our framework outperform baseline models on downstream molecular property prediction tasks.
- পেপার আইডি: 2509.02803
- শিরোনাম: A Graph Laplacian Eigenvector-based Pre-training Method for Graph Neural Networks
- লেখক: Howard Dai, Nyambura Njenga, Hiren Madhu, Siddharth Viswanath, Ryan Pellico, Ian Adelstein, Smita Krishnaswamy
- শ্রেণীবিভাগ: cs.LG (মেশিন লার্নিং)
- প্রকাশনার সময়: ২০২৫ সালের ১১ অক্টোবর (arXiv প্রিপ্রিন্ট)
- পেপার লিঙ্ক: https://arxiv.org/abs/2509.02803v2
এই পেপারটি গ্রাফ ল্যাপ্লাসিয়ান আইজেনভেক্টরের উপর ভিত্তি করে গ্রাফ নিউরাল নেটওয়ার্কের জন্য একটি প্রি-ট্রেনিং পদ্ধতি প্রস্তাব করে। গ্রাফ ভিত্তিক মডেল (GFMs) এ কাঠামোগত প্রি-ট্রেনিং পদ্ধতির অভাবের সমস্যা মোকাবেলা করতে, লেখকরা ল্যাপ্লাসিয়ান আইজেনভেক্টর লার্নিং মডিউল (LELM) তৈরি করেছেন, যা গ্রাফ ল্যাপ্লাসিয়ানের নিম্ন-ফ্রিকোয়েন্সি আইজেনভেক্টর পূর্বাভাস দিয়ে প্রি-ট্রেনিং করে। এই পদ্ধতিটি উপরিতল মসৃণকরণ সমস্যা অতিক্রম করে এমন উপন্যাস স্থাপত্য ডিজাইন প্রবর্তন করে, যা GNN মডেলকে দীর্ঘ-দূরত্বের নির্ভরতা শিখতে সক্ষম করে। পরীক্ষা-নিরীক্ষা দেখায় যে এই কাঠামো ব্যবহার করে প্রি-ট্রেনিং করা মডেলগুলি আণবিক সম্পত্তি পূর্বাভাস কাজে বেসলাইন মডেলকে ছাড়িয়ে যায়।
- কাঠামোগত প্রি-ট্রেনিং পদ্ধতির অভাব: বিদ্যমান গ্রাফ নিউরাল নেটওয়ার্ক প্রি-ট্রেনিং পদ্ধতিগুলি প্রধানত বৈশিষ্ট্য পুনর্নির্মাণ এবং বৈপরীত্যমূলক শিক্ষার উপর ভিত্তি করে, যখন গ্রাফ কাঠামোগত সম্পত্তির উপর ভিত্তি করে প্রি-ট্রেনিং পদ্ধতি তুলনামূলকভাবে কম অন্বেষণ করা হয়েছে।
- উপরিতল মসৃণকরণ সমস্যা: ঐতিহ্যবাহী বার্তা-প্রেরণ GNN গ্লোবাল এবং আঞ্চলিক কাঠামো ক্যাপচার করার সময় চ্যালেঞ্জের সম্মুখীন হয়, নেটওয়ার্ক গভীরতা বৃদ্ধির সাথে সাথে উপরিতল মসৃণকরণ ঘটনা সহজেই ঘটে।
- দীর্ঘ-দূরত্বের নির্ভরতা শেখা কঠিন: বিদ্যমান GNN স্থাপত্য গ্রাফে দীর্ঘ-দূরত্বের পারস্পরিক নির্ভরতা সম্পর্ক শেখার ক্ষেত্রে প্রকাশনা ক্ষমতা সীমাবদ্ধতার সম্মুখীন হয়।
- গ্রাফ ভিত্তিক মডেলের বিকাশের জন্য কার্যকর স্ব-তত্ত্বাবধানী প্রি-ট্রেনিং কাজ প্রয়োজন
- কাঠামো-সচেতন ডাউনস্ট্রিম অ্যাপ্লিকেশনগুলি অন্তর্নিহিত গ্রাফ কাঠামো ক্যাপচার করতে পারে এমন প্রি-ট্রেনিং পদ্ধতির প্রয়োজন
- আণবিক সম্পত্তি পূর্বাভাস এবং অন্যান্য অ্যাপ্লিকেশনগুলি গ্রাফের গ্লোবাল কাঠামোর বোঝার উপর নির্ভর করে
- বৈপরীত্যমূলক পদ্ধতি: প্রধানত Jensen-Shannon অনুমানকারী বা InfoNCE উদ্দেশ্য ফাংশন ব্যবহার করে, কাঠামো তথ্যের সরাসরি মডেলিং অভাব
- পূর্বাভাস পদ্ধতি: বেশিরভাগ গ্রাফ পুনর্নির্মাণ কাজে কেন্দ্রীভূত, গ্রাফ সম্পত্তি পূর্বাভাসের উপর ভিত্তি করে পদ্ধতি কম
- কাঠামো প্রতিনিধিত্ব ক্ষমতা: বিদ্যমান পদ্ধতিগুলি গ্রাফের গ্লোবাল কাঠামো তথ্য কার্যকরভাবে ক্যাপচার করতে অসুবিধা পায়
- LELM কাঠামো প্রস্তাব: গ্রাফ ল্যাপ্লাসিয়ান আইজেনভেক্টরকে প্রি-ট্রেনিং লক্ষ্য হিসাবে ব্যবহার করার প্রথম পদ্ধতি
- উদ্ভাবনী স্থাপত্য ডিজাইন: গ্রাফ-স্তরের MLP হেড প্রবর্তন করে, GNN কে অত্যন্ত গভীর নেটওয়ার্ক ছাড়াই বড় আকারের কাঠামো ক্যাপচার করতে সক্ষম করে
- নোড বৈশিষ্ট্য বর্ধন: গ্রাফ বিস্তার অপারেটরের উপর ভিত্তি করে বর্ধিত নোড বৈশিষ্ট্য প্রস্তাব করে, GNN এর প্রকাশনা ক্ষমতা সীমাবদ্ধতা অতিক্রম করে
- পরীক্ষামূলক যাচাইকরণ: আণবিক ডেটাসেটে পদ্ধতির কার্যকারিতা প্রমাণ করে, স্বাধীন প্রি-ট্রেনিং পদ্ধতি বা বিদ্যমান পাইপলাইনের প্লাগইন হিসাবে কাজ করতে পারে
প্রদত্ত গ্রাফ G=(V,E), লক্ষ্য হল GNN মডেল প্রি-ট্রেন করা যাতে এটি গ্রাফ ল্যাপ্লাসিয়ান ম্যাট্রিক্স L=D−A এর k সর্বনিম্ন-ফ্রিকোয়েন্সি আইজেনভেক্টর ψ1,ψ2,…,ψk পূর্বাভাস দিতে পারে, যেখানে Lψi=λiψi।
LELM কাঠামোতে তিনটি মূল উপাদান রয়েছে:
তরঙ্গ অবস্থান এনকোডিং: নোডগুলির মধ্যে আপেক্ষিক অবস্থান তথ্য এনকোড করে
- দুটি নোড i,j এলোমেলোভাবে নির্বাচন করুন, ডিরাক সিগন্যাল δi,δj তৈরি করুন
- তরঙ্গ অপারেটর প্রয়োগ করুন Ψk=P2j−1−P2j, যেখানে P=D−1A হল বিস্তার অপারেটর
- নোড m এর তরঙ্গ অবস্থান এনকোডিং: wm=[wm,1…wm,J]
বিস্তার ডিরাক এনকোডিং: স্থানীয় সংযোগ কাঠামো এনকোড করে
- প্রতিটি নোড m এর জন্য, dm,k=Ψk(m,⋅)P(m,⋅)T গণনা করুন
- বিস্তার ডিরাক এনকোডিং: dm=[dm,1…dm,J]
- ভিত্তি GNN: বর্ধিত বৈশিষ্ট্যের গ্রাফ প্রক্রিয়া করে, নোড প্রতিনিধিত্ব তৈরি করে
- গ্রাফ-স্তরের সমন্বয়: সমস্ত নোড প্রতিনিধিত্ব গ্রাফ-স্তরের ভেক্টর Z=[z1,…,zn]∈Rnd এ সংযুক্ত করুন
- MLP পূর্বাভাস হেড: U~=MLP(Z) পূর্বাভাসিত আইজেনভেক্টর আউটপুট করে
QR বিয়োজনের মাধ্যমে অর্থোগোনালিটি সীমাবদ্ধতা প্রয়োগ করুন: U^=QR(U~)
ক্ষতি ফাংশন:
- শক্তি ক্ষতি: Lenergy=k1∑i=1ku^iTLu^i
- আইজেনভেক্টর ক্ষতি: Leigvec=k1∑i=1k∥Lu^i−λiu^i∥
- মোট ক্ষতি: L=α⋅Lenergy+β⋅Leigvec
- গ্রাফ-স্তরের MLP ডিজাইন: নোড-স্তরের MLP দীর্ঘ-দূরত্বের মিথস্ক্রিয়া শিখতে অক্ষম হওয়ার সমস্যা এড়ায়
- আইজেনভেক্টর লক্ষ্য: নিম্ন-ফ্রিকোয়েন্সি ল্যাপ্লাসিয়ান আইজেনভেক্টর স্বাভাবিকভাবে গ্লোবাল, আঞ্চলিক এবং স্থানীয় গ্রাফ কাঠামো এনকোড করে
- বিস্তার অপারেটর বর্ধন: কাঠামোগত প্রসঙ্গ তথ্য প্রদান করে, GNN প্রকাশনা ক্ষমতা বৃদ্ধি করে
- দ্বৈত ক্ষতি প্রক্রিয়া: শক্তি ক্ষতি সাবস্পেস সঠিকতা নিশ্চিত করে, আইজেনভেক্টর ক্ষতি কঠোর অর্ডারিং নিশ্চিত করে
- ZINC-12k: ১২,০০০ আণবিক গ্রাফ
- ZINC-250k: ২৫০,০০০ আণবিক গ্রাফ
- QM9: ১৩৪,০০০ আণবিক গ্রাফ, একাধিক কোয়ান্টাম রসায়ন সম্পত্তি সহ
- MAE (গড় পরম ত্রুটি): প্রধান মূল্যায়ন মেট্রিক
- ROC-AUC: দ্বিমুখী শ্রেণীবিভাগ কাজের জন্য ব্যবহৃত
- বেসলাইন মডেল: প্রি-ট্রেনিং ছাড়া GIN এবং GPS মডেল
- বিকল্প প্রি-ট্রেনিং লক্ষ্য: নোড ডিগ্রি, স্থানীয় ক্লাস্টারিং সহগ, চক্র গণনা, ল্যাপ্লাসিয়ান আইজেনভ্যালু
- বিদ্যমান প্রি-ট্রেনিং পদ্ধতি: ContextPred, Masking ইত্যাদি
- প্রি-ট্রেনিং epochs: ১০০-২০০ রাউন্ড
- ফাইন-টিউনিং epochs: ১৫০-৫০০ রাউন্ড
- আইজেনভেক্টর সংখ্যা: k=6
- ক্ষতি ওজন: α=2,β=1 (প্রধান পরীক্ষা)
- অপটিমাইজার: Adam
- শেখার হার: ০.০০১
ZINC এবং QM9 ডেটাসেট কর্মক্ষমতা তুলনা:
| মডেল | ZINC full | ZINC subset | QM9 μ | QM9 α | QM9 εHOMO |
|---|
| GIN + LELM | ০.১৩০ | ০.৩৫३ | ०.४८४ | ०.४८९ | ०.००३५३ |
| GIN (baseline) | ०.२२८ | ०.४३८ | ०.४७२ | १.१३२ | ०.००३८६ |
| GPS + LELM | ०.१०४ | ०.२१० | ०.५०२ | ०.५९२ | ००३७२ |
| GPS (baseline) | ०.१५० | ०.३५८ | ०.४१३ | ०.७१८ | ००४३४ |
LELM বেশিরভাগ কাজে উল্লেখযোগ্যভাবে কর্মক্ষমতা উন্নত করেছে, বিশেষ করে ZINC ডেটাসেটে উল্লেখযোগ্য উন্নতি।
গ্রাফ-স্তরের MLP বনাম নোড-স্তরের MLP:
| মডেল | ZINC full | ZINC subset |
|---|
| GIN + LELM (গ্রাফ-স্তর) | ०.१३० | ०.३५३ |
| GIN + LELM (নোড-স্তর) | ०.१५२ | ०.४३५ |
| GPS + LELM (গ্রাফ-স্তর) | ०.१०४ | ०.२१० |
| GPS + LELM (নোড-স্তর) | ०.१२६ | ०.२६१ |
গ্রাফ-স্তরের MLP উভয় স্থাপত্যে নোড-স্তরের MLP এর চেয়ে উল্লেখযোগ্যভাবে ভাল।
বিকল্প কাঠামোগত প্রি-ট্রেনিং লক্ষ্য তুলনা:
| প্রি-ট্রেনিং লক্ষ্য | ZINC full | ZINC subset |
|---|
| LELM | ०.१३० | ०.३५३ |
| নোড ডিগ্রি | ०.२३८ | ०.४७१ |
| স্থানীয় ক্লাস্টারিং সহগ | १.४९३ | १.५५१ |
| চক্র গণনা | ०.२८५ | ०.४२० |
| ল্যাপ্লাসিয়ান আইজেনভ্যালু | ०.२५० | ०.५२० |
LELM অন্যান্য কাঠামোগত প্রি-ট্রেনিং লক্ষ্যের চেয়ে স্পষ্টভাবে উন্নত।
আণবিক পূর্বাভাস কাজে LELM কে প্লাগইন হিসাবে বিদ্যমান প্রি-ট্রেনিং পাইপলাইনে যোগ করা:
- Masking + LELM: সমস্ত ৫টি ডেটাসেটে উন্নতি
- ContextPred + LELM: বেশিরভাগ কাজে উন্নতি
- গ্রাফ-স্তরের স্থাপত্যের গুরুত্ব: গ্রাফ-স্তরের MLP কার্যকরভাবে দীর্ঘ-দূরত্বের নির্ভরতা শিখতে পারে
- আইজেনভেক্টরের উচ্চতর: ল্যাপ্লাসিয়ান আইজেনভেক্টর অন্যান্য কাঠামোগত লক্ষ্যের চেয়ে প্রি-ট্রেনিংয়ের জন্য আরও উপযুক্ত
- সর্বজনীনতা: LELM বিদ্যমান প্রি-ট্রেনিং পদ্ধতির সাথে একত্রিত করা যেতে পারে
- স্কেলেবিলিটি: পদ্ধতি বিভিন্ন GNN স্থাপত্যের জন্য প্রযোজ্য (GIN, GPS)
- বৈপরীত্যমূলক পদ্ধতি:
- গ্রাফ-নোড বৈপরীত্য (Deep Graph Infomax ইত্যাদি)
- সাবগ্রাফ-নোড বৈপরীত্য (InfoGraph ইত্যাদি)
- সাবগ্রাফ-সাবগ্রাফ বৈপরীত্য (GraphCL ইত্যাদি)
- পূর্বাভাস পদ্ধতি:
- গ্রাফ পুনর্নির্মাণ (নোড/প্রান্ত মাস্কিং, অটোএনকোডার)
- সম্পত্তি পূর্বাভাস (k-hop সংযোগযোগ্যতা, মেটা-পাথ)
- অবস্থান এনকোডিং: গ্রাফ ট্রান্সফর্মারে মান অবস্থান এনকোডিং
- বর্ণালী গ্রাফ নিউরাল নেটওয়ার্ক: সিগন্যাল ডোমেনে ফিল্টার শিখুন
- বর্ণালী ক্লাস্টারিং: ক্লাস্টারিংয়ের জন্য নিম্ন-মাত্রিক এম্বেডিং তৈরি করুন
- গ্রাফ বিভাজন: Fiedler ভেক্টর সর্বোত্তম গ্রাফ বিভাজন তৈরি করে
LELM হল প্রথম পদ্ধতি যা গ্রাফ ল্যাপ্লাসিয়ান আইজেনভেক্টরকে প্রি-ট্রেনিং লক্ষ্য হিসাবে ব্যবহার করে, কাঠামোগত প্রি-ট্রেনিং পদ্ধতির ফাঁক পূরণ করে।
- কার্যকারিতা যাচাইকরণ: LELM আণবিক সম্পত্তি পূর্বাভাস কাজে GNN কর্মক্ষমতা উল্লেখযোগ্যভাবে উন্নত করেছে
- স্থাপত্য উদ্ভাবন: গ্রাফ-স্তরের MLP কার্যকরভাবে উপরিতল মসৃণকরণ সমস্যা সমাধান করেছে
- সর্বজনীন কাঠামো: স্বাধীন পদ্ধতি বা বিদ্যমান পাইপলাইনের বর্ধন উপাদান হিসাবে কাজ করতে পারে
- তাত্ত্বিক গ্যারান্টি: ক্ষতি ফাংশন প্রয়োজনীয় চিহ্ন এবং ভিত্তি অপরিবর্তনীয়তা রয়েছে
- স্থানান্তর শেখার ক্ষমতা অন্বেষণ করা হয়নি: বর্তমানে শুধুমাত্র একই বা সম্পর্কিত ডোমেন ডেটাসেটে যাচাই করা হয়েছে
- গণনামূলক জটিলতা: ল্যাপ্লাসিয়ান আইজেনবিয়োজন গণনা প্রয়োজন, বড় গ্রাফের জন্য চ্যালেঞ্জিং হতে পারে
- ক্রস-ডোমেন সাধারণীকরণ: সিন্থেটিক গ্রাফ বা ক্রস-ডোমেন ডেটাসেটে প্রভাব অজানা
- পরিসংখ্যানগত তাৎপর্য: গণনামূলক খরচ সীমাবদ্ধতার কারণে ত্রুটি শর্ত রিপোর্ট করা হয়নি
- ক্রস-ডোমেন প্রি-ট্রেনিং: সিন্থেটিক গ্রাফ বা ক্রস-ডোমেন ডেটাসেটে প্রি-ট্রেনিং প্রভাব অন্বেষণ করুন
- বড় আকারের প্রয়োগ: আরও বড় আকারের গ্রাফে স্কেলেবিলিটি গবেষণা করুন
- তাত্ত্বিক বিশ্লেষণ: কেন ল্যাপ্লাসিয়ান আইজেনভেক্টর ভাল প্রি-ট্রেনিং লক্ষ্য তা গভীরভাবে বিশ্লেষণ করুন
- স্থাপত্য অপটিমাইজেশন: গ্রাফ-স্তরের MLP ডিজাইন আরও অপটিমাইজ করুন
- শক্তিশালী উদ্ভাবনী: প্রথমবারের মতো ল্যাপ্লাসিয়ান আইজেনভেক্টর GNN প্রি-ট্রেনিংয়ে ব্যবহার করা হয়েছে, ধারণা নতুন
- দৃঢ় তাত্ত্বিক ভিত্তি: ল্যাপ্লাসিয়ান আইজেনভেক্টর গ্রাফ তত্ত্বে গভীর তাত্ত্বিক ভিত্তি রয়েছে
- চতুর স্থাপত্য ডিজাইন: গ্রাফ-স্তরের MLP দীর্ঘ-দূরত্বের নির্ভরতা শেখার সমস্যা কার্যকরভাবে সমাধান করে
- সম্পূর্ণ পরীক্ষা: একাধিক তুলনামূলক পরীক্ষা, বিলোপন পরীক্ষা এবং বর্ধন পরীক্ষা অন্তর্ভুক্ত
- ভাল সর্বজনীনতা: বিভিন্ন GNN স্থাপত্য এবং বিদ্যমান প্রি-ট্রেনিং পদ্ধতির সাথে একত্রিত করা যেতে পারে
- সীমিত প্রয়োগ ক্ষেত্র: প্রধানত আণবিক ডেটায় যাচাই করা হয়েছে, অন্যান্য গ্রাফ ধরনের প্রভাব অজানা
- গণনামূলক ওভারহেড: আইজেনবিয়োজনের গণনামূলক খরচ বড় আকারের প্রয়োগ সীমাবদ্ধ করতে পারে
- হাইপারপ্যারামিটার সংবেদনশীলতা: ক্ষতি ফাংশন ওজন ইত্যাদি হাইপারপ্যারামিটার নির্বাচনের জন্য সিস্টেমেটিক বিশ্লেষণ অভাব
- অপর্যাপ্ত তাত্ত্বিক ব্যাখ্যা: পদ্ধতি কেন কার্যকর তার গভীর তাত্ত্বিক বিশ্লেষণ অভাব
- একাডেমিক মূল্য: গ্রাফ প্রি-ট্রেনিংয়ের জন্য নতুন গবেষণা দিকনির্দেশনা প্রদান করে
- ব্যবহারিক মূল্য: আণবিক সম্পত্তি পূর্বাভাস এবং অন্যান্য ব্যবহারিক প্রয়োগে সম্ভাব্য মূল্য রয়েছে
- পুনরুৎপাদনযোগ্যতা: সম্পূর্ণ কোড এবং পরীক্ষা সেটআপ প্রদান করে
- অনুপ্রেরণামূলক: গ্রাফ বর্ণালী সম্পত্তির উপর ভিত্তি করে আরও প্রি-ট্রেনিং পদ্ধতি অনুপ্রাণিত করতে পারে
- আণবিক সম্পত্তি পূর্বাভাস: ইতিমধ্যে যাচাই করা কার্যকর প্রয়োগ পরিস্থিতি
- সামাজিক নেটওয়ার্ক বিশ্লেষণ: গ্লোবাল কাঠামো বোঝা প্রয়োজন এমন কাজ
- জ্ঞান গ্রাফ: কাঠামো তথ্য গুরুত্বপূর্ণ গ্রাফ অনুমান কাজ
- জৈব নেটওয়ার্ক: প্রোটিন মিথস্ক্রিয়া নেটওয়ার্ক ইত্যাদি জৈব প্রয়োগ
পেপারটি একাধিক গুরুত্বপূর্ণ সম্পর্কিত কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:
- Hu et al. (2019): "Strategies for pre-training graph neural networks" - গ্রাফ প্রি-ট্রেনিংয়ের ক্লাসিক কাজ
- Shaham et al. (2018): "SpectralNet" - বর্ণালী ক্লাস্টারিংয়ের নিউরাল নেটওয়ার্ক পদ্ধতি
- Dwivedi et al. (2021): "Graph neural networks with learnable structural and positional representations" - কাঠামোগত অবস্থান প্রতিনিধিত্ব শিক্ষা
- Rampášek et al. (2022): "Recipe for a general, powerful, scalable graph transformer" - GPS স্থাপত্য
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের গবেষণা পেপার যা গ্রাফ নিউরাল নেটওয়ার্কের জন্য উদ্ভাবনী প্রি-ট্রেনিং পদ্ধতি প্রস্তাব করে। যদিও কিছু দিক থেকে উন্নতির সুযোগ রয়েছে, তবে এর মূল ধারণা নতুন, পরীক্ষা-নিরীক্ষা সম্পূর্ণ, এবং গ্রাফ প্রি-ট্রেনিং ক্ষেত্রে গুরুত্বপূর্ণ অবদান রাখে। পদ্ধতির সর্বজনীনতা এবং স্কেলেবিলিটি এটিকে ভাল প্রয়োগ সম্ভাবনা প্রদান করে।