Motivation: Mendelian randomization (MR) infers causal relationships between exposures and outcomes using genetic variants as instrumental variables. Typically, MR considers only a pair of exposure and outcome at a time, limiting its capability of capturing the entire causal network. We overcome this limitation by developing 'MR.RGM' (Mendelian randomization via reciprocal graphical model), a fast R-package that implements the Bayesian reciprocal graphical model and enables practitioners to construct holistic causal networks with possibly cyclic/reciprocal causation and proper uncertainty quantifications, offering a comprehensive understanding of complex biological systems and their interconnections. We developed 'MR.RGM', an open-source R package that applies bidirectional MR using a network-based strategy, enabling the exploration of causal relationships among multiple variables in complex biological systems. 'MR.RGM' holds the promise of unveiling intricate interactions and advancing our understanding of genetic networks, disease risks, and phenotypic complexities.
- পেপার আইডি: 2403.03944
- শিরোনাম: MR.RGM: বেইজিয়ান মাল্টিভেরিয়েট দ্বিমুখী মেন্ডেলিয়ান র্যান্ডমাইজেশন নেটওয়ার্ক ফিটিংয়ের জন্য একটি R প্যাকেজ
- লেখক: বিতান সরকার, ইয়াং নি (টেক্সাস এ অ্যান্ড এম বিশ্ববিদ্যালয়)
- শ্রেণীবিভাগ: stat.AP (পরিসংখ্যান প্রয়োগ)
- প্রকাশিত জার্নাল: বায়োইনফরম্যাটিক্স
- পেপার লিংক: https://arxiv.org/abs/2403.03944
- কোড রিপোজিটরি: https://github.com/bitansa/MR.RGM
মেন্ডেলিয়ান র্যান্ডমাইজেশন (MR) জেনেটিক ভেরিয়েশনকে যন্ত্র ভেরিয়েবল হিসাবে ব্যবহার করে এক্সপোজার এবং ফলাফলের মধ্যে কার্যকারণ সম্পর্ক অনুমান করে। ঐতিহ্যবাহী MR পদ্ধতি একবারে শুধুমাত্র একটি এক্সপোজার এবং ফলাফল ভেরিয়েবলের জোড়া বিবেচনা করে, যা সম্পূর্ণ কার্যকারণ নেটওয়ার্ক ক্যাপচার করার ক্ষমতা সীমিত করে। এই পেপারটি 'MR.RGM' (পারস্পরিক গ্রাফ মডেলের মাধ্যমে মেন্ডেলিয়ান র্যান্ডমাইজেশন) বিকশিত করেছে, যা একটি দ্রুত R প্যাকেজ যা বেইজিয়ান পারস্পরিক গ্রাফ মডেল বাস্তবায়ন করে, গবেষকদের সম্ভাব্য চক্রাকার/পারস্পরিক কার্যকারণ সম্পর্ক সহ সামগ্রিক কার্যকারণ নেটওয়ার্ক তৈরি করতে সক্ষম করে এবং উপযুক্ত অনিশ্চয়তা পরিমাণকরণ প্রদান করে, যা জটিল জৈব সিস্টেম এবং তাদের পারস্পরিক সংযোগের ব্যাপক বোঝাপড়া সক্ষম করে।
ঐতিহ্যবাহী মেন্ডেলিয়ান র্যান্ডমাইজেশন (MR) পদ্ধতি প্রধানত একক এক্সপোজার-ফলাফল জোড়ার কার্যকারণ অনুমানের উপর দৃষ্টি নিবদ্ধ করে, এই পদ্ধতিতে নিম্নলিখিত সীমাবদ্ধতা রয়েছে:
- নেটওয়ার্ক জটিলতা উপেক্ষা: একাধিক ভেরিয়েবলের মধ্যে জটিল কার্যকারণ নেটওয়ার্ক কাঠামো ক্যাপচার করতে পারে না
- দ্বিমুখী কার্যকারণ সম্পর্ক অনুপস্থিত: ভেরিয়েবলের মধ্যে পারস্পরিক বা চক্রাকার কার্যকারণ সম্পর্ক পরিচালনা করা কঠিন
- সামগ্রিক দৃষ্টিভঙ্গির অভাব: জৈব সিস্টেমের বৈশ্বিক কার্যকারণ বোঝাপড়া প্রদান করতে পারে না
জটিল জৈব সিস্টেমে, জিন, প্রোটিন এবং ফেনোটাইপের মধ্যে প্রায়ই জটিল পারস্পরিক ক্রিয়া নেটওয়ার্ক বিদ্যমান থাকে। এই নেটওয়ার্কগুলি বোঝা গুরুত্বপূর্ণ:
- রোগ ঝুঁকি মূল্যায়ন
- চিকিৎসা লক্ষ্য সনাক্তকরণ
- জৈব প্রক্রিয়া বিশ্লেষণ
- নির্ভুল ওষুধ উন্নয়ন
বিদ্যমান R প্যাকেজগুলির ব্যাপক সমীক্ষার মাধ্যমে (mr.pivw, mr.raps, PPMR, OneSampleMR, MVMR সহ), লেখক আবিষ্কার করেছেন যে সমস্ত বিদ্যমান পদ্ধতি দ্বিমুখী MR বিশ্লেষণ সমর্থন করে না, যা সম্পূর্ণ কার্যকারণ নেটওয়ার্ক তৈরির একটি মূল ত্রুটি।
- দ্বিমুখী MR সমর্থনকারী প্রথম R প্যাকেজ: MR.RGM হল একমাত্র প্যাকেজ যা দ্বিমুখী কার্যকারণ সম্পর্ক পরিচালনা করতে পারে
- বেইজিয়ান নেটওয়ার্ক কাঠামো: পারস্পরিক গ্রাফ মডেলের উপর ভিত্তি করে অনিশ্চয়তা পরিমাণকরণ এবং নেটওয়ার্ক কাঠামো অনুমান বাস্তবায়ন
- একাধিক ডেটা ইনপুট ফরম্যাট: ব্যক্তিগত স্তরের ডেটা এবং দুটি সারসংক্ষেপ স্তরের ডেটা ফরম্যাট সমর্থন করে
- গণনামূলক দক্ষতা অপ্টিমাইজেশন: C++ ব্যাকএন্ড এবং উডবারি ম্যাট্রিক্স পরিচয় ব্যবহার করে গণনামূলক দক্ষতা বৃদ্ধি করে
- নেটওয়ার্ক মোটিফ বিশ্লেষণ: নির্দিষ্ট নেটওয়ার্ক কাঠামোর অনিশ্চয়তা পরিমাণকরণের জন্য NetworkMotif ফাংশন প্রদান করে
প্রতিক্রিয়া ভেরিয়েবল Yi=(Yi1,…,Yip)T এবং যন্ত্র ভেরিয়েবল Xi=(Xi1,…,Xik)T এর জন্য, মডেলটি সংজ্ঞায়িত করা হয়েছে:
Yi=AYi+BXi+Ei,Ei∼N(0,Σ)
যেখানে:
- A∈Rp×p: প্রতিক্রিয়া ভেরিয়েবলের মধ্যে কার্যকারণ প্রভাব ম্যাট্রিক্স (কর্ণ শূন্য)
- B∈Rp×k: যন্ত্র ভেরিয়েবলের প্রতিক্রিয়া ভেরিয়েবলে প্রভাব ম্যাট্রিক্স
- Σ=diag(σ1,…,σp): ত্রুটি সহভেরিয়েন্স ম্যাট্রিক্স
মডেলটি পুনর্লিখিত করা যায়:
Yi∼Np{(Ip−A)−1BXi,(Ip−A)−1Σ(Ip−A)−T}
ম্যাট্রিক্স A এর উপাদানগুলির জন্য:
aij∼γijN(0,τij)+(1−γij)N(0,ν1×τij)γij∼Ber(ρij),ρij∼Beta(aρ,bρ)
a~ij∼N(0,τij),aij=a~ijI(∣a~ij∣>tA)
মেট্রোপলিস-হেস্টিংস অ্যালগরিদম এবং গিবস স্যাম্পলিংয়ের মিশ্র কৌশল ব্যবহার করে পশ্চাদ্বর্তী অনুমান, যার মধ্যে রয়েছে:
- প্রান্তিক সম্ভাবনা আপডেট (গিবস)
- প্রভাব সহগ আপডেট (M-H)
- ভেরিয়েন্স প্যারামিটার আপডেট (গিবস)
- থ্রেশহোল্ড প্যারামিটার আপডেট (M-H, শুধুমাত্র থ্রেশহোল্ড পূর্ববর্তী)
গণনামূলক দক্ষতা বৃদ্ধির জন্য, নির্ধারক এবং বিপরীত ম্যাট্রিক্স গণনা করতে উডবারি পরিচয় ব্যবহার করুন:
det(Ip−A∗)=(1+(Ip−A)(j,i)−1×(aij−aij∗))det(Ip−A)
(Ip−A∗)−1=(Ip−A)−1−1+(aij−aij∗)(Ip−A)(j,i)−1aij−aij∗(Ip−A)(⋅,i)−1×(Ip−A)(j,⋅)−1
- ইনপুট ফরম্যাট:
- ব্যক্তিগত স্তরের ডেটা: X (যন্ত্র ভেরিয়েবল ম্যাট্রিক্স), Y (প্রতিক্রিয়া ভেরিয়েবল ম্যাট্রিক্স)
- সারসংক্ষেপ ডেটা 1: Syy, Syx, Sxx সহভেরিয়েন্স ম্যাট্রিক্স
- সারসংক্ষেপ ডেটা 2: Sxx, বিটা, SigmaHat ম্যাট্রিক্স
- প্রয়োজনীয় প্যারামিটার: D (বাইনারি সূচক ম্যাট্রিক্স), n (নমুনা আকার)
- আউটপুট: কার্যকারণ প্রভাব অনুমান, নেটওয়ার্ক কাঠামো, পশ্চাদ্বর্তী সম্ভাবনা ইত্যাদি
- কার্যকারিতা: নির্দিষ্ট নেটওয়ার্ক মোটিফের অনিশ্চয়তা পরিমাণকরণ
- ইনপুট: লক্ষ্য নেটওয়ার্ক কাঠামো গামা, পশ্চাদ্বর্তী নমুনা GammaPst
- আউটপুট: পশ্চাদ্বর্তী সম্ভাবনা
মডেল সনাক্তকরণ নিশ্চিত করতে, প্রতিটি প্রতিক্রিয়া ভেরিয়েবলের কমপক্ষে একটি অনন্য যন্ত্র ভেরিয়েবল থাকা প্রয়োজন, অর্থাৎ D ম্যাট্রিক্সের প্রতিটি সারিতে কমপক্ষে একটি অনন্য 1 থাকা প্রয়োজন।
- মডেল: Y=AY+BX+E
- নমুনা আকার: 10k, 30k, 50k
- নেটওয়ার্ক স্কেল: 5, 10 নোড
- বিরলতা: 25%, 50%
- প্রভাব আকার: ±0.1
- ভেরিয়েন্স ব্যাখ্যা: 1%, 3%, 5%, 10%
- TPR (সত্য ইতিবাচক হার)
- FPR (মিথ্যা ইতিবাচক হার)
- FDR (মিথ্যা আবিষ্কার হার)
- MCC (ম্যাথিউস সহসম্পর্ক সহগ)
- AUC (ROC বক্ররেখার অধীন এলাকা)
প্রধানত OneSampleMR প্যাকেজের সাথে তুলনা, যা সর্বশেষ উন্নত MR সরঞ্জাম।
সমস্ত পরীক্ষার শর্তে, MR.RGM উল্লেখযোগ্যভাবে OneSampleMR থেকে ভাল:
নেটওয়ার্ক স্কেল 5, বিরলতা 50%:
- স্পাইক এবং স্ল্যাব পূর্ববর্তী: AUC = 0.77-0.99, TPR = 0.50-0.99
- OneSampleMR: AUC = 0.56-0.79, TPR = 0.08-0.84
নেটওয়ার্ক স্কেল 10, বিরলতা 25%:
- স্পাইক এবং স্ল্যাব পূর্ববর্তী: AUC = 0.87-0.995, TPR = 0.69-0.99
- OneSampleMR: AUC = 0.48-0.52, TPR = 0.07-0.39
- স্কেলেবিলিটি ভাল: নোড এবং যন্ত্র ভেরিয়েবল সংখ্যার সাথে সাব-লিনিয়ার বৃদ্ধি
- বাস্তব চলার সময়: Apple M2 Pro-তে, 15টি জিন 31টি SNP-এর বিশ্লেষণ মাত্র 32.329 সেকেন্ড সময় নেয়
বিভিন্ন ত্রুটি বিতরণের প্রতি সংবেদনশীলতা পরীক্ষা দেখায় যে MR.RGM সাধারণ ত্রুটি অনুমানের প্রতি অসংবেদনশীল:
- সাধারণ বিতরণ: TPR=0.86, FPR=0.0133, MAD=0.0169
- t বিতরণ (df=3): TPR=0.86, FPR=0.0200, MAD=0.0153
- ল্যাপ্লেস বিতরণ: TPR=0.87, FPR=0.0333, MAD=0.0164
GTEx V7 ডেটাসেটে প্রয়োগ (332 নমুনা, 15 জিন) সফলভাবে জিন নিয়ন্ত্রক নেটওয়ার্ক তৈরি করেছে, পদ্ধতির ব্যবহারিকতা প্রদর্শন করে।
- এক-পরিবর্তনশীল পদ্ধতি: mr.pivw, OneSampleMR
- বহু-পরিবর্তনশীল পদ্ধতি: MVMR, MRPC, MendelianRandomization
- বেইজিয়ান পদ্ধতি: mrbayes, MrDAG
- নেটওয়ার্ক পদ্ধতি: MrDAG (শুধুমাত্র DAG সমর্থন করে)
MR.RGM হল একমাত্র সরঞ্জাম যা নিম্নলিখিত বৈশিষ্ট্যগুলির সমন্বয় সমর্থন করে:
- বহু-পরিবর্তনশীল বিশ্লেষণ
- দ্বিমুখী কার্যকারণ সম্পর্ক
- অনিশ্চয়তা পরিমাণকরণ
- একাধিক ডেটা ফরম্যাট সমর্থন
- MR.RGM সফলভাবে দ্বিমুখী MR বিশ্লেষণের ফাঁক পূরণ করেছে
- বেইজিয়ান কাঠামো কার্যকর অনিশ্চয়তা পরিমাণকরণ প্রদান করে
- পদ্ধতি অনুকরণ এবং বাস্তব ডেটা উভয়েই চমৎকার কর্মক্ষমতা প্রদর্শন করে
- গণনামূলক দক্ষতা ব্যবহারিক প্রয়োগ প্রয়োজনীয়তা পূরণ করে
- সাধারণতা অনুমান: যদিও শক্তিশালীতা পরীক্ষা অসংবেদনশীলতা দেখায়, তত্ত্বগতভাবে এখনও সাধারণ অনুমানের উপর নির্ভর করে
- সনাক্তকরণযোগ্যতা প্রয়োজনীয়তা: প্রতিটি প্রতিক্রিয়া ভেরিয়েবলের অনন্য যন্ত্র ভেরিয়েবল প্রয়োজন
- বড় আকারের নেটওয়ার্ক: অতি বড় আকারের নেটওয়ার্কের গণনামূলক দক্ষতা আরও অপ্টিমাইজেশন প্রয়োজন
- অ-রৈখিক কার্যকারণ সম্পর্কে সম্প্রসারণ
- সম্ভাব্য বিভ্রান্তিকারী কারণ পরিচালনা
- বহু-অমিক্স ডেটা একীকরণ
- গ্রাফিক্যাল ব্যবহারকারী ইন্টারফেস উন্নয়ন
- শক্তিশালী উদ্ভাবনী: প্রথমবারের মতো দ্বিমুখী MR বিশ্লেষণ বাস্তবায়ন, গুরুত্বপূর্ণ ফাঁক পূরণ করে
- পদ্ধতি কঠোর: বেইজিয়ান কাঠামো তাত্ত্বিক ভিত্তি দৃঢ়, MCMC বাস্তবায়ন সঠিক
- উচ্চ ব্যবহারিকতা: একাধিক ডেটা ফরম্যাট সমর্থন করে, বিভিন্ন প্রয়োগ পরিস্থিতি পূরণ করে
- যথেষ্ট যাচাইকরণ: ব্যাপক অনুকরণ গবেষণা এবং বাস্তব ডেটা যাচাইকরণ
- সফটওয়্যার গুণমান: কোড খোলা উৎস, ডকুমেন্টেশন বিস্তারিত, ব্যবহার সহজ
- সীমিত তাত্ত্বিক বিশ্লেষণ: অভিসরণ এবং সনাক্তকরণযোগ্যতার তাত্ত্বিক গ্যারান্টি অনুপস্থিত
- সীমিত তুলনা পরীক্ষা: প্রধানত OneSampleMR-এর সাথে তুলনা, অন্যান্য নেটওয়ার্ক পদ্ধতির সাথে তুলনা অনুপস্থিত
- একক প্রয়োগ কেস: শুধুমাত্র জিন প্রকাশ ডেটা প্রয়োগ প্রদর্শন, অন্যান্য জৈব প্রয়োগ অনুপস্থিত
- একাডেমিক মূল্য: কার্যকারণ অনুমান ক্ষেত্রে গুরুত্বপূর্ণ সরঞ্জাম প্রদান করে
- ব্যবহারিক মূল্য: জেনেটিক্স, মহামারী বিজ্ঞান গবেষণায় ব্যাপক প্রয়োগ সম্ভাবনা
- পুনরুৎপাদনযোগ্যতা: কোড খোলা উৎস, ফলাফল পুনরুৎপাদনযোগ্য
- জেনেটিক্স গবেষণা: জিন নিয়ন্ত্রক নেটওয়ার্ক নির্মাণ
- মহামারী বিজ্ঞান: রোগ ঝুঁকি কারণ নেটওয়ার্ক বিশ্লেষণ
- সিস্টেম জীববিজ্ঞান: বহু-অমিক্স ডেটা একীকরণ বিশ্লেষণ
- নির্ভুল ওষুধ: ব্যক্তিগতকৃত চিকিৎসা লক্ষ্য সনাক্তকরণ
- Ni, Y., Ji, Y., & Müller, P. (2018). পারস্পরিক গ্রাফ মডেল একীভূত জিন নিয়ন্ত্রক নেটওয়ার্ক বিশ্লেষণের জন্য।
- GTEx কনসোর্টিয়াম। (2020). GTEx কনসোর্টিয়াম অ্যাটলাস মানব টিস্যু জুড়ে জেনেটিক নিয়ন্ত্রক প্রভাব। বিজ্ঞান, 369(6509), 1318-1330।
- Palmer, T., Spiller, W., & Sanderson, E. (2023). OneSampleMR: এক নমুনা মেন্ডেলিয়ান র্যান্ডমাইজেশন এবং যন্ত্র ভেরিয়েবল বিশ্লেষণ।
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের পদ্ধতিগত পেপার যা সফলভাবে বহু-পরিবর্তনশীল দ্বিমুখী মেন্ডেলিয়ান র্যান্ডমাইজেশনের এই গুরুত্বপূর্ণ সমস্যা সমাধান করেছে। সফটওয়্যার বাস্তবায়ন সম্পূর্ণ, যাচাইকরণ যথেষ্ট, কার্যকারণ অনুমান এবং জেনেটিক্স গবেষণার জন্য গুরুত্বপূর্ণ মূল্য রয়েছে। যদিও তাত্ত্বিক বিশ্লেষণ এবং প্রয়োগ পরিসরে উন্নতির সুযোগ রয়েছে, সামগ্রিক অবদান উল্লেখযোগ্য এবং সুপারিশযোগ্য।