2025-11-15T21:31:10.952177

MR.RGM: An R Package for Fitting Bayesian Multivariate Bidirectional Mendelian Randomization Networks

Sarkar, Ni
Motivation: Mendelian randomization (MR) infers causal relationships between exposures and outcomes using genetic variants as instrumental variables. Typically, MR considers only a pair of exposure and outcome at a time, limiting its capability of capturing the entire causal network. We overcome this limitation by developing 'MR.RGM' (Mendelian randomization via reciprocal graphical model), a fast R-package that implements the Bayesian reciprocal graphical model and enables practitioners to construct holistic causal networks with possibly cyclic/reciprocal causation and proper uncertainty quantifications, offering a comprehensive understanding of complex biological systems and their interconnections. We developed 'MR.RGM', an open-source R package that applies bidirectional MR using a network-based strategy, enabling the exploration of causal relationships among multiple variables in complex biological systems. 'MR.RGM' holds the promise of unveiling intricate interactions and advancing our understanding of genetic networks, disease risks, and phenotypic complexities.
academic

MR.RGM: বেইজিয়ান মাল্টিভেরিয়েট দ্বিমুখী মেন্ডেলিয়ান র্যান্ডমাইজেশন নেটওয়ার্ক ফিটিংয়ের জন্য একটি R প্যাকেজ

মৌলিক তথ্য

  • পেপার আইডি: 2403.03944
  • শিরোনাম: MR.RGM: বেইজিয়ান মাল্টিভেরিয়েট দ্বিমুখী মেন্ডেলিয়ান র্যান্ডমাইজেশন নেটওয়ার্ক ফিটিংয়ের জন্য একটি R প্যাকেজ
  • লেখক: বিতান সরকার, ইয়াং নি (টেক্সাস এ অ্যান্ড এম বিশ্ববিদ্যালয়)
  • শ্রেণীবিভাগ: stat.AP (পরিসংখ্যান প্রয়োগ)
  • প্রকাশিত জার্নাল: বায়োইনফরম্যাটিক্স
  • পেপার লিংক: https://arxiv.org/abs/2403.03944
  • কোড রিপোজিটরি: https://github.com/bitansa/MR.RGM

সারসংক্ষেপ

মেন্ডেলিয়ান র্যান্ডমাইজেশন (MR) জেনেটিক ভেরিয়েশনকে যন্ত্র ভেরিয়েবল হিসাবে ব্যবহার করে এক্সপোজার এবং ফলাফলের মধ্যে কার্যকারণ সম্পর্ক অনুমান করে। ঐতিহ্যবাহী MR পদ্ধতি একবারে শুধুমাত্র একটি এক্সপোজার এবং ফলাফল ভেরিয়েবলের জোড়া বিবেচনা করে, যা সম্পূর্ণ কার্যকারণ নেটওয়ার্ক ক্যাপচার করার ক্ষমতা সীমিত করে। এই পেপারটি 'MR.RGM' (পারস্পরিক গ্রাফ মডেলের মাধ্যমে মেন্ডেলিয়ান র্যান্ডমাইজেশন) বিকশিত করেছে, যা একটি দ্রুত R প্যাকেজ যা বেইজিয়ান পারস্পরিক গ্রাফ মডেল বাস্তবায়ন করে, গবেষকদের সম্ভাব্য চক্রাকার/পারস্পরিক কার্যকারণ সম্পর্ক সহ সামগ্রিক কার্যকারণ নেটওয়ার্ক তৈরি করতে সক্ষম করে এবং উপযুক্ত অনিশ্চয়তা পরিমাণকরণ প্রদান করে, যা জটিল জৈব সিস্টেম এবং তাদের পারস্পরিক সংযোগের ব্যাপক বোঝাপড়া সক্ষম করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

ঐতিহ্যবাহী মেন্ডেলিয়ান র্যান্ডমাইজেশন (MR) পদ্ধতি প্রধানত একক এক্সপোজার-ফলাফল জোড়ার কার্যকারণ অনুমানের উপর দৃষ্টি নিবদ্ধ করে, এই পদ্ধতিতে নিম্নলিখিত সীমাবদ্ধতা রয়েছে:

  1. নেটওয়ার্ক জটিলতা উপেক্ষা: একাধিক ভেরিয়েবলের মধ্যে জটিল কার্যকারণ নেটওয়ার্ক কাঠামো ক্যাপচার করতে পারে না
  2. দ্বিমুখী কার্যকারণ সম্পর্ক অনুপস্থিত: ভেরিয়েবলের মধ্যে পারস্পরিক বা চক্রাকার কার্যকারণ সম্পর্ক পরিচালনা করা কঠিন
  3. সামগ্রিক দৃষ্টিভঙ্গির অভাব: জৈব সিস্টেমের বৈশ্বিক কার্যকারণ বোঝাপড়া প্রদান করতে পারে না

গবেষণার গুরুত্ব

জটিল জৈব সিস্টেমে, জিন, প্রোটিন এবং ফেনোটাইপের মধ্যে প্রায়ই জটিল পারস্পরিক ক্রিয়া নেটওয়ার্ক বিদ্যমান থাকে। এই নেটওয়ার্কগুলি বোঝা গুরুত্বপূর্ণ:

  • রোগ ঝুঁকি মূল্যায়ন
  • চিকিৎসা লক্ষ্য সনাক্তকরণ
  • জৈব প্রক্রিয়া বিশ্লেষণ
  • নির্ভুল ওষুধ উন্নয়ন

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

বিদ্যমান R প্যাকেজগুলির ব্যাপক সমীক্ষার মাধ্যমে (mr.pivw, mr.raps, PPMR, OneSampleMR, MVMR সহ), লেখক আবিষ্কার করেছেন যে সমস্ত বিদ্যমান পদ্ধতি দ্বিমুখী MR বিশ্লেষণ সমর্থন করে না, যা সম্পূর্ণ কার্যকারণ নেটওয়ার্ক তৈরির একটি মূল ত্রুটি।

মূল অবদান

  1. দ্বিমুখী MR সমর্থনকারী প্রথম R প্যাকেজ: MR.RGM হল একমাত্র প্যাকেজ যা দ্বিমুখী কার্যকারণ সম্পর্ক পরিচালনা করতে পারে
  2. বেইজিয়ান নেটওয়ার্ক কাঠামো: পারস্পরিক গ্রাফ মডেলের উপর ভিত্তি করে অনিশ্চয়তা পরিমাণকরণ এবং নেটওয়ার্ক কাঠামো অনুমান বাস্তবায়ন
  3. একাধিক ডেটা ইনপুট ফরম্যাট: ব্যক্তিগত স্তরের ডেটা এবং দুটি সারসংক্ষেপ স্তরের ডেটা ফরম্যাট সমর্থন করে
  4. গণনামূলক দক্ষতা অপ্টিমাইজেশন: C++ ব্যাকএন্ড এবং উডবারি ম্যাট্রিক্স পরিচয় ব্যবহার করে গণনামূলক দক্ষতা বৃদ্ধি করে
  5. নেটওয়ার্ক মোটিফ বিশ্লেষণ: নির্দিষ্ট নেটওয়ার্ক কাঠামোর অনিশ্চয়তা পরিমাণকরণের জন্য NetworkMotif ফাংশন প্রদান করে

পদ্ধতি বিস্তারিত

গাণিতিক মডেল

মৌলিক মডেল

প্রতিক্রিয়া ভেরিয়েবল Yi=(Yi1,,Yip)TY_i = (Y_{i1}, \ldots, Y_{ip})^T এবং যন্ত্র ভেরিয়েবল Xi=(Xi1,,Xik)TX_i = (X_{i1}, \ldots, X_{ik})^T এর জন্য, মডেলটি সংজ্ঞায়িত করা হয়েছে:

Yi=AYi+BXi+Ei,EiN(0,Σ)Y_i = AY_i + BX_i + E_i, \quad E_i \sim N(0, \Sigma)

যেখানে:

  • ARp×pA \in \mathbb{R}^{p \times p}: প্রতিক্রিয়া ভেরিয়েবলের মধ্যে কার্যকারণ প্রভাব ম্যাট্রিক্স (কর্ণ শূন্য)
  • BRp×kB \in \mathbb{R}^{p \times k}: যন্ত্র ভেরিয়েবলের প্রতিক্রিয়া ভেরিয়েবলে প্রভাব ম্যাট্রিক্স
  • Σ=diag(σ1,,σp)\Sigma = \text{diag}(\sigma_1, \ldots, \sigma_p): ত্রুটি সহভেরিয়েন্স ম্যাট্রিক্স

সমতুল্য ফর্ম

মডেলটি পুনর্লিখিত করা যায়: YiNp{(IpA)1BXi,(IpA)1Σ(IpA)T}Y_i \sim N_p\{(I_p - A)^{-1}BX_i, (I_p - A)^{-1}\Sigma(I_p - A)^{-T}\}

পূর্ববর্তী সেটিং

স্পাইক এবং স্ল্যাব পূর্ববর্তী

ম্যাট্রিক্স AA এর উপাদানগুলির জন্য: aijγijN(0,τij)+(1γij)N(0,ν1×τij)a_{ij} \sim \gamma_{ij}N(0, \tau_{ij}) + (1-\gamma_{ij})N(0, \nu_1 \times \tau_{ij})γijBer(ρij),ρijBeta(aρ,bρ)\gamma_{ij} \sim \text{Ber}(\rho_{ij}), \quad \rho_{ij} \sim \text{Beta}(a_\rho, b_\rho)

থ্রেশহোল্ড পূর্ববর্তী

a~ijN(0,τij),aij=a~ijI(a~ij>tA)\tilde{a}_{ij} \sim N(0, \tau_{ij}), \quad a_{ij} = \tilde{a}_{ij}I(|\tilde{a}_{ij}| > t_A)

MCMC অনুমান

মেট্রোপলিস-হেস্টিংস অ্যালগরিদম এবং গিবস স্যাম্পলিংয়ের মিশ্র কৌশল ব্যবহার করে পশ্চাদ্বর্তী অনুমান, যার মধ্যে রয়েছে:

  1. প্রান্তিক সম্ভাবনা আপডেট (গিবস)
  2. প্রভাব সহগ আপডেট (M-H)
  3. ভেরিয়েন্স প্যারামিটার আপডেট (গিবস)
  4. থ্রেশহোল্ড প্যারামিটার আপডেট (M-H, শুধুমাত্র থ্রেশহোল্ড পূর্ববর্তী)

গণনামূলক অপ্টিমাইজেশন

উডবারি ম্যাট্রিক্স পরিচয়

গণনামূলক দক্ষতা বৃদ্ধির জন্য, নির্ধারক এবং বিপরীত ম্যাট্রিক্স গণনা করতে উডবারি পরিচয় ব্যবহার করুন:

det(IpA)=(1+(IpA)(j,i)1×(aijaij))det(IpA)\det(I_p - A^*) = (1 + (I_p - A)^{-1}_{(j,i)} \times (a_{ij} - a^*_{ij})) \det(I_p - A)

(IpA)1=(IpA)1aijaij1+(aijaij)(IpA)(j,i)1(IpA)(,i)1×(IpA)(j,)1(I_p - A^*)^{-1} = (I_p - A)^{-1} - \frac{a_{ij} - a^*_{ij}}{1 + (a_{ij} - a^*_{ij})(I_p - A)^{-1}_{(j,i)}} (I_p - A)^{-1}_{(\cdot,i)} \times (I_p - A)^{-1}_{(j,\cdot)}

সফটওয়্যার বাস্তবায়ন

মূল ফাংশন

RGM ফাংশন

  • ইনপুট ফরম্যাট:
    • ব্যক্তিগত স্তরের ডেটা: X (যন্ত্র ভেরিয়েবল ম্যাট্রিক্স), Y (প্রতিক্রিয়া ভেরিয়েবল ম্যাট্রিক্স)
    • সারসংক্ষেপ ডেটা 1: Syy, Syx, Sxx সহভেরিয়েন্স ম্যাট্রিক্স
    • সারসংক্ষেপ ডেটা 2: Sxx, বিটা, SigmaHat ম্যাট্রিক্স
  • প্রয়োজনীয় প্যারামিটার: D (বাইনারি সূচক ম্যাট্রিক্স), n (নমুনা আকার)
  • আউটপুট: কার্যকারণ প্রভাব অনুমান, নেটওয়ার্ক কাঠামো, পশ্চাদ্বর্তী সম্ভাবনা ইত্যাদি

NetworkMotif ফাংশন

  • কার্যকারিতা: নির্দিষ্ট নেটওয়ার্ক মোটিফের অনিশ্চয়তা পরিমাণকরণ
  • ইনপুট: লক্ষ্য নেটওয়ার্ক কাঠামো গামা, পশ্চাদ্বর্তী নমুনা GammaPst
  • আউটপুট: পশ্চাদ্বর্তী সম্ভাবনা

সনাক্তকরণযোগ্যতা শর্ত

মডেল সনাক্তকরণ নিশ্চিত করতে, প্রতিটি প্রতিক্রিয়া ভেরিয়েবলের কমপক্ষে একটি অনন্য যন্ত্র ভেরিয়েবল থাকা প্রয়োজন, অর্থাৎ D ম্যাট্রিক্সের প্রতিটি সারিতে কমপক্ষে একটি অনন্য 1 থাকা প্রয়োজন।

পরীক্ষামূলক সেটআপ

অনুকরণ ডিজাইন

  • মডেল: Y=AY+BX+EY = AY + BX + E
  • নমুনা আকার: 10k, 30k, 50k
  • নেটওয়ার্ক স্কেল: 5, 10 নোড
  • বিরলতা: 25%, 50%
  • প্রভাব আকার: ±0.1
  • ভেরিয়েন্স ব্যাখ্যা: 1%, 3%, 5%, 10%

মূল্যায়ন মেট্রিক্স

  • TPR (সত্য ইতিবাচক হার)
  • FPR (মিথ্যা ইতিবাচক হার)
  • FDR (মিথ্যা আবিষ্কার হার)
  • MCC (ম্যাথিউস সহসম্পর্ক সহগ)
  • AUC (ROC বক্ররেখার অধীন এলাকা)

তুলনা পদ্ধতি

প্রধানত OneSampleMR প্যাকেজের সাথে তুলনা, যা সর্বশেষ উন্নত MR সরঞ্জাম।

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

নেটওয়ার্ক কাঠামো পুনরুদ্ধার কর্মক্ষমতা

সমস্ত পরীক্ষার শর্তে, MR.RGM উল্লেখযোগ্যভাবে OneSampleMR থেকে ভাল:

নেটওয়ার্ক স্কেল 5, বিরলতা 50%:

  • স্পাইক এবং স্ল্যাব পূর্ববর্তী: AUC = 0.77-0.99, TPR = 0.50-0.99
  • OneSampleMR: AUC = 0.56-0.79, TPR = 0.08-0.84

নেটওয়ার্ক স্কেল 10, বিরলতা 25%:

  • স্পাইক এবং স্ল্যাব পূর্ববর্তী: AUC = 0.87-0.995, TPR = 0.69-0.99
  • OneSampleMR: AUC = 0.48-0.52, TPR = 0.07-0.39

গণনামূলক দক্ষতা

  • স্কেলেবিলিটি ভাল: নোড এবং যন্ত্র ভেরিয়েবল সংখ্যার সাথে সাব-লিনিয়ার বৃদ্ধি
  • বাস্তব চলার সময়: Apple M2 Pro-তে, 15টি জিন 31টি SNP-এর বিশ্লেষণ মাত্র 32.329 সেকেন্ড সময় নেয়

শক্তিশালীতা বিশ্লেষণ

বিভিন্ন ত্রুটি বিতরণের প্রতি সংবেদনশীলতা পরীক্ষা দেখায় যে MR.RGM সাধারণ ত্রুটি অনুমানের প্রতি অসংবেদনশীল:

  • সাধারণ বিতরণ: TPR=0.86, FPR=0.0133, MAD=0.0169
  • t বিতরণ (df=3): TPR=0.86, FPR=0.0200, MAD=0.0153
  • ল্যাপ্লেস বিতরণ: TPR=0.87, FPR=0.0333, MAD=0.0164

বাস্তব ডেটা প্রয়োগ

GTEx V7 ডেটাসেটে প্রয়োগ (332 নমুনা, 15 জিন) সফলভাবে জিন নিয়ন্ত্রক নেটওয়ার্ক তৈরি করেছে, পদ্ধতির ব্যবহারিকতা প্রদর্শন করে।

সম্পর্কিত কাজ

বিদ্যমান MR পদ্ধতি শ্রেণীবিভাগ

  1. এক-পরিবর্তনশীল পদ্ধতি: mr.pivw, OneSampleMR
  2. বহু-পরিবর্তনশীল পদ্ধতি: MVMR, MRPC, MendelianRandomization
  3. বেইজিয়ান পদ্ধতি: mrbayes, MrDAG
  4. নেটওয়ার্ক পদ্ধতি: MrDAG (শুধুমাত্র DAG সমর্থন করে)

এই পেপারের সুবিধা

MR.RGM হল একমাত্র সরঞ্জাম যা নিম্নলিখিত বৈশিষ্ট্যগুলির সমন্বয় সমর্থন করে:

  • বহু-পরিবর্তনশীল বিশ্লেষণ
  • দ্বিমুখী কার্যকারণ সম্পর্ক
  • অনিশ্চয়তা পরিমাণকরণ
  • একাধিক ডেটা ফরম্যাট সমর্থন

উপসংহার এবং আলোচনা

প্রধান উপসংহার

  1. MR.RGM সফলভাবে দ্বিমুখী MR বিশ্লেষণের ফাঁক পূরণ করেছে
  2. বেইজিয়ান কাঠামো কার্যকর অনিশ্চয়তা পরিমাণকরণ প্রদান করে
  3. পদ্ধতি অনুকরণ এবং বাস্তব ডেটা উভয়েই চমৎকার কর্মক্ষমতা প্রদর্শন করে
  4. গণনামূলক দক্ষতা ব্যবহারিক প্রয়োগ প্রয়োজনীয়তা পূরণ করে

সীমাবদ্ধতা

  1. সাধারণতা অনুমান: যদিও শক্তিশালীতা পরীক্ষা অসংবেদনশীলতা দেখায়, তত্ত্বগতভাবে এখনও সাধারণ অনুমানের উপর নির্ভর করে
  2. সনাক্তকরণযোগ্যতা প্রয়োজনীয়তা: প্রতিটি প্রতিক্রিয়া ভেরিয়েবলের অনন্য যন্ত্র ভেরিয়েবল প্রয়োজন
  3. বড় আকারের নেটওয়ার্ক: অতি বড় আকারের নেটওয়ার্কের গণনামূলক দক্ষতা আরও অপ্টিমাইজেশন প্রয়োজন

ভবিষ্যত দিকনির্দেশনা

  1. অ-রৈখিক কার্যকারণ সম্পর্কে সম্প্রসারণ
  2. সম্ভাব্য বিভ্রান্তিকারী কারণ পরিচালনা
  3. বহু-অমিক্স ডেটা একীকরণ
  4. গ্রাফিক্যাল ব্যবহারকারী ইন্টারফেস উন্নয়ন

গভীর মূল্যায়ন

শক্তি

  1. শক্তিশালী উদ্ভাবনী: প্রথমবারের মতো দ্বিমুখী MR বিশ্লেষণ বাস্তবায়ন, গুরুত্বপূর্ণ ফাঁক পূরণ করে
  2. পদ্ধতি কঠোর: বেইজিয়ান কাঠামো তাত্ত্বিক ভিত্তি দৃঢ়, MCMC বাস্তবায়ন সঠিক
  3. উচ্চ ব্যবহারিকতা: একাধিক ডেটা ফরম্যাট সমর্থন করে, বিভিন্ন প্রয়োগ পরিস্থিতি পূরণ করে
  4. যথেষ্ট যাচাইকরণ: ব্যাপক অনুকরণ গবেষণা এবং বাস্তব ডেটা যাচাইকরণ
  5. সফটওয়্যার গুণমান: কোড খোলা উৎস, ডকুমেন্টেশন বিস্তারিত, ব্যবহার সহজ

অপূর্ণতা

  1. সীমিত তাত্ত্বিক বিশ্লেষণ: অভিসরণ এবং সনাক্তকরণযোগ্যতার তাত্ত্বিক গ্যারান্টি অনুপস্থিত
  2. সীমিত তুলনা পরীক্ষা: প্রধানত OneSampleMR-এর সাথে তুলনা, অন্যান্য নেটওয়ার্ক পদ্ধতির সাথে তুলনা অনুপস্থিত
  3. একক প্রয়োগ কেস: শুধুমাত্র জিন প্রকাশ ডেটা প্রয়োগ প্রদর্শন, অন্যান্য জৈব প্রয়োগ অনুপস্থিত

প্রভাব

  1. একাডেমিক মূল্য: কার্যকারণ অনুমান ক্ষেত্রে গুরুত্বপূর্ণ সরঞ্জাম প্রদান করে
  2. ব্যবহারিক মূল্য: জেনেটিক্স, মহামারী বিজ্ঞান গবেষণায় ব্যাপক প্রয়োগ সম্ভাবনা
  3. পুনরুৎপাদনযোগ্যতা: কোড খোলা উৎস, ফলাফল পুনরুৎপাদনযোগ্য

প্রযোজ্য পরিস্থিতি

  1. জেনেটিক্স গবেষণা: জিন নিয়ন্ত্রক নেটওয়ার্ক নির্মাণ
  2. মহামারী বিজ্ঞান: রোগ ঝুঁকি কারণ নেটওয়ার্ক বিশ্লেষণ
  3. সিস্টেম জীববিজ্ঞান: বহু-অমিক্স ডেটা একীকরণ বিশ্লেষণ
  4. নির্ভুল ওষুধ: ব্যক্তিগতকৃত চিকিৎসা লক্ষ্য সনাক্তকরণ

সংদর্ভ

  1. Ni, Y., Ji, Y., & Müller, P. (2018). পারস্পরিক গ্রাফ মডেল একীভূত জিন নিয়ন্ত্রক নেটওয়ার্ক বিশ্লেষণের জন্য।
  2. GTEx কনসোর্টিয়াম। (2020). GTEx কনসোর্টিয়াম অ্যাটলাস মানব টিস্যু জুড়ে জেনেটিক নিয়ন্ত্রক প্রভাব। বিজ্ঞান, 369(6509), 1318-1330।
  3. Palmer, T., Spiller, W., & Sanderson, E. (2023). OneSampleMR: এক নমুনা মেন্ডেলিয়ান র্যান্ডমাইজেশন এবং যন্ত্র ভেরিয়েবল বিশ্লেষণ।

সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের পদ্ধতিগত পেপার যা সফলভাবে বহু-পরিবর্তনশীল দ্বিমুখী মেন্ডেলিয়ান র্যান্ডমাইজেশনের এই গুরুত্বপূর্ণ সমস্যা সমাধান করেছে। সফটওয়্যার বাস্তবায়ন সম্পূর্ণ, যাচাইকরণ যথেষ্ট, কার্যকারণ অনুমান এবং জেনেটিক্স গবেষণার জন্য গুরুত্বপূর্ণ মূল্য রয়েছে। যদিও তাত্ত্বিক বিশ্লেষণ এবং প্রয়োগ পরিসরে উন্নতির সুযোগ রয়েছে, সামগ্রিক অবদান উল্লেখযোগ্য এবং সুপারিশযোগ্য।