We present a new method for causal discovery in linear structural vector autoregressive models. We adapt an idea designed for independent observations to the case of time series while retaining its favorable properties, i.e., explicit error control for false causal discovery, at least asymptotically. We apply our method to several real-world bivariate time series datasets and discuss its findings which mostly agree with common understanding. The arrow of time in a model can be interpreted as background knowledge on possible causal mechanisms. Hence, our ideas could be extended to incorporating different background knowledge, even for independent observations.
- পেপার আইডি: 2403.03778
- শিরোনাম: কাঠামোগত ভেক্টর স্বয়ংরিয়সম্পর্কিত মডেলে পূর্বপুরুষ রিগ্রেশন
- লেখক: ক্রিস্টফ শুলথাইস, মার্কাস উলমার, পিটার বুহলম্যান (ETH জুরিখ)
- শ্রেণীবিভাগ: stat.ME (পরিসংখ্যান - পদ্ধতিবিদ্যা)
- প্রকাশনার সময়: ২০২৫ সালের ৩ জানুয়ারি (arXiv সংস্করণ)
- পেপার লিংক: https://arxiv.org/abs/2403.03778
এই পেপারটি রৈখিক কাঠামোগত ভেক্টর স্বয়ংরিয়সম্পর্কিত মডেলে কার্যকারণ আবিষ্কারের জন্য একটি নতুন পদ্ধতি প্রস্তাব করে। লেখকরা মূলত স্বাধীন পর্যবেক্ষণের জন্য ডিজাইন করা পূর্বপুরুষ রিগ্রেশন পদ্ধতিটি সময় শ্রেণীর ক্ষেত্রে প্রসারিত করেছেন, একই সাথে এর অনুকূল বৈশিষ্ট্যগুলি বজায় রেখেছেন, অর্থাৎ মিথ্যা কার্যকারণ আবিষ্কারের জন্য স্পষ্ট ত্রুটি নিয়ন্ত্রণ (অন্তত অ্যাসিম্পটোটিক অর্থে)। এই পদ্ধতিটি একাধিক বাস্তব-বিশ্বের দ্বিমাত্রিক সময় শ্রেণী ডেটাসেটে প্রয়োগ করা হয়েছে, ফলাফলগুলি বেশিরভাগ সাধারণ জ্ঞানের সাথে সামঞ্জস্যপূর্ণ। সময়ের তীর সম্ভাব্য কার্যকারণ প্রক্রিয়ার পটভূমি জ্ঞান হিসাবে ব্যাখ্যা করা যেতে পারে, তাই এই চিন্তাভাবনা বিভিন্ন পটভূমি জ্ঞান একত্রিত করার জন্য প্রসারিত করা যেতে পারে, এমনকি স্বাধীন পর্যবেক্ষণের ক্ষেত্রেও প্রযোজ্য।
- সমাধান করার সমস্যা: বাস্তব-বিশ্বের ডেটাসেটগুলি সাধারণত সময়গত কাঠামো রাখে, যা কার্যকারণ আবিষ্কারে ব্যাপকভাবে ব্যবহৃত স্বাধীন এবং সমানভাবে বিতরণকৃত অনুমানকে লঙ্ঘন করে। এই পেপারটি কাঠামোগত ভেক্টর স্বয়ংরিয়সম্পর্কিত (SVAR) মডেলে কার্যকারণ আবিষ্কারের সমস্যা সমাধানের লক্ষ্য রাখে।
- সমস্যার গুরুত্ব: সময় শ্রেণী ডেটা ব্যবহারিক প্রয়োগে অত্যন্ত সাধারণ, কিন্তু ঐতিহ্যবাহী কার্যকারণ আবিষ্কার পদ্ধতিগুলি প্রধানত স্বাধীন পর্যবেক্ষণের জন্য ডিজাইন করা হয়েছে। সময়গত নির্ভরতা যদিও অনুমান কঠিন করে তোলে, তবে এটি একটি সুবিধাও প্রদান করে—পূর্বাভাসকারী ভেরিয়েবলগুলি আগের সময় পয়েন্টে অন্যান্য ভেরিয়েবলগুলিকে কার্যকারণভাবে প্রভাবিত করতে পারে না।
- বিদ্যমান পদ্ধতির সীমাবদ্ধতা:
- LiNGAM এর মতো ঐতিহ্যবাহী পদ্ধতিগুলি প্রধানত স্বাধীন পর্যবেক্ষণের জন্য
- সময় শ্রেণীতে কার্যকারণ আবিষ্কারের জন্য স্পষ্ট ত্রুটি নিয়ন্ত্রণের অভাব
- বিদ্যমান SVAR সম্প্রসারণ পদ্ধতিগুলি তাত্ত্বিক গ্যারান্টির অভাব
- গবেষণা প্রেরণা: শুলথাইস এবং বুহলম্যান (২০২৩) এর পূর্বপুরুষ রিগ্রেশন পদ্ধতিটি বহুমাত্রিক সময় শ্রেণীতে প্রসারিত করা, সময়গত নির্ভরতা পরিচালনা করার সময় এর অ্যাসিম্পটোটিক গ্যারান্টি বজায় রাখা।
- পদ্ধতি সম্প্রসারণ: স্বাধীন পর্যবেক্ষণ থেকে রৈখিক SVAR মডেলে পূর্বপুরুষ রিগ্রেশন প্রসারিত করা, তাৎক্ষণিক এবং বিলম্বিত কার্যকারণ সম্পর্ক পরিচালনা করা
- ত্রুটি নিয়ন্ত্রণ: অ্যাসিম্পটোটিক টাইপ I ত্রুটি গ্যারান্টি প্রদান করা, মিথ্যা কার্যকারণ আবিষ্কারের জন্য স্পষ্ট নিয়ন্ত্রণ বাস্তবায়ন করা
- সমন্বয় সেট নির্বাচন: বিভিন্ন সময়গত বিলম্বের জন্য ত্রুটি নিয়ন্ত্রণ অর্জনের জন্য সঠিক সমন্বয় সেট নির্বাচন করা প্রদর্শন করা
- নেটওয়ার্ক অনুমান: তাৎক্ষণিক প্রভাব গ্রাফ এবং সংক্ষিপ্ত সময় গ্রাফ নির্মাণের জন্য অ্যালগরিদম প্রস্তাব করা
- অভিজ্ঞতামূলক যাচাইকরণ: বাস্তব-বিশ্বের ডেটাসেটে পদ্ধতির কার্যকারিতা যাচাই করা
বহুমাত্রিক সময় শ্রেণী xt,j (t = 1,...,T; j = 1,...,d) দেওয়া হলে, লক্ষ্য হল ভেরিয়েবলগুলির মধ্যে কার্যকারণ পূর্বপুরুষ সম্পর্ক চিহ্নিত করা, যার মধ্যে তাৎক্ষণিক প্রভাব (τ=0) এবং বিলম্বিত প্রভাব (τ>0) রয়েছে।
SVAR মডেল:
xt=∑τ=0pBτxt−τ+ϵt
যেখানে:
- B0 তাৎক্ষণিক প্রভাবের সাথে সামঞ্জস্যপূর্ণ, অ-চক্রীয় কাঠামো অনুমান করা হয়
- Bτ (τ>0) বিলম্বিত প্রভাব ম্যাট্রিক্স
- ϵt স্বাধীন উদ্ভাবন পদ
সমতুল্য ফর্ম:
xt=∑τ=1pB~τxt−τ+ξt
পূর্বপুরুষ রিগ্রেশন মূল ধারণা:
অরৈখিক ফাংশন f(·) এর জন্য, ন্যূনতম বর্গ রিগ্রেশন ব্যবহার করা:
f(ξt,jτ) বনাম ξt−τ
যেখানে ξt,jτ এবং ξt−τ হল আগের সময় পয়েন্ট অবদান প্রজেক্ট করার পরে অবশিষ্ট।
মূল উপপাদ্য ১: k ∉ AN_τ(j) এর জন্য (k হল j এর τ বিলম্বিত পূর্বপুরুষ নয়), আমাদের আছে:
βkf,j,τ=E[zt−τ,kf(ξt,jτ)]/E[zt−τ,k2]=0
- অবশিষ্ট নির্মাণ: আগের সময় পয়েন্টের প্রভাব অপসারণ করে প্রজেকশনের মাধ্যমে, সংকেত-থেকে-শব্দ অনুপাত উন্নত করা
- বিলম্ব সমন্বয়: বিভিন্ন বিলম্ব τ এর জন্য উপযুক্ত সমন্বয় সেট নির্মাণ করা
- অ্যাসিম্পটোটিক তত্ত্ব: কাছাকাছি-পর্যায়ক্রমিক নির্ভরতার ভিত্তিতে অ্যাসিম্পটোটিক সাধারণত্ব প্রতিষ্ঠা করা
- নেটওয়ার্ক অনুমান: পূর্বপুরুষ সম্পর্ক পুনরাবৃত্তিমূলকভাবে নির্মাণ করা, চক্র সনাক্তকরণ পরিচালনা করা
অনুকরণ ডেটা:
- ভেরিয়েবল সংখ্যা: d = 6, 10, 50
- SVAR অর্ডার: p = 1
- নমুনা আকার: 10² থেকে 10⁶
- ত্রুটি বিতরণ: t₇, সমান, Laplace, সাধারণ বিতরণের মিশ্রণ
- প্রান্ত ওজন: সমান বিতরণ, সংকেত-থেকে-শব্দ অনুপাত নিয়ন্ত্রণ করা
বাস্তব ডেটা:
- ওল্ড ফেইথফুল গিজার: অপেক্ষার সময় বনাম বিস্ফোরণ স্থায়িত্ব (299 পর্যবেক্ষণ)
- গ্যাস ফার্নেস: ইনপুট গ্যাস হার বনাম আউটপুট CO₂ ঘনত্ব (296 পর্যবেক্ষণ)
- দুগ্ধজাত পণ্যের মূল্য: মাখন বনাম চেডার পনির মূল্য (522 পর্যবেক্ষণ)
- পারিবারিক-বুদ্ধিমান ত্রুটির হার (FWER): মিথ্যা আবিষ্কারের পারিবারিক ত্রুটির হার
- শক্তি: প্রকৃত কার্যকারণ সম্পর্কের সনাক্তকরণ হার
- p-মান: অ্যাসিম্পটোটিক সাধারণত্বের উপর ভিত্তি করে অনুমান পরীক্ষা
- LiNGAM অ্যালগরিদম (Hyvärinen et al., 2010)
- বিভিন্ন নমুনা আকার এবং লুকানো ভেরিয়েবল সেটিংসের অধীনে কর্মক্ষমতা তুলনা
- অরৈখিক ফাংশন: f(x) = sign(x)|x|³
- বহুত্ব সংশোধন: Bonferroni-Holm পদ্ধতি
- তাৎপর্য স্তর: α = 0.05
অনুকরণ পরীক্ষা:
- অ-পূর্বপুরুষ ভেরিয়েবলগুলির জন্য, গড় পরম z পরিসংখ্যান তাত্ত্বিক শূন্য অনুমান বিতরণের গড়ের কাছাকাছি
- সমস্ত নমুনা আকারে টাইপ I ত্রুটি নিয়ন্ত্রিত হয়
- নমুনা আকার বৃদ্ধির সাথে সাথে সনাক্তকরণ শক্তি বৃদ্ধি পায়
- বিলম্বিত পূর্বপুরুষের সনাক্তকরণ তাৎক্ষণিক পূর্বপুরুষের চেয়ে সহজ (শক্তিশালী সংকেত)
নেটওয়ার্ক অনুমান:
- তাৎক্ষণিক প্রভাব গ্রাফ এবং সংক্ষিপ্ত সময় গ্রাফ উভয়ই পূর্বপুরুষ-অ-পূর্বপুরুষ বিভাজন অর্জন করে
- পুনরাবৃত্তিমূলক নির্মাণ একক পরীক্ষায় সনাক্ত করা কঠিন প্রভাব সনাক্ত করতে সহায়তা করে
- বড় নমুনায় প্রায় নিখুঁত কর্মক্ষমতা
লুকানো ভেরিয়েবল প্রভাব:
- অনুমান লঙ্ঘন করার সময় পূর্বনির্ধারিত স্তরের ত্রুটি নিয়ন্ত্রণ হারায়
- তবুও পূর্বপুরুষ এবং অ-পূর্বপুরুষের মধ্যে প্রভাব আকার বিভাজন বজায় রাখে
- p-মান র্যাঙ্কিং এখনও প্রকৃত পূর্বপুরুষ নির্দেশ করতে পারে
বিভিন্ন পূর্বপুরুষ প্রকার:
- সরাসরি বিলম্বিত প্রভাব (B~4,k=0): শক্তিশালী সংকেত
- তাৎক্ষণিক পূর্বপুরুষ: মধ্যম সংকেত
- তাৎক্ষণিক প্রভাবের মাধ্যমে মধ্যস্থতাকৃত বিলম্বিত পূর্বপুরুষ: দুর্বলতম সংকেত
ওল্ড ফেইথফুল গিজার:
- মূল ডেটা: উল্লেখযোগ্য তাৎক্ষণিক প্রভাব সনাক্ত করা হয়নি
- সময় সমন্বয়ের পরে: বিস্ফোরণ স্থায়িত্ব → অপেক্ষার সময়ের তাৎক্ষণিক প্রভাব সনাক্ত করা (p=5×10⁻⁴)
- ডোমেইন জ্ঞানের সাথে সামঞ্জস্যপূর্ণ
গ্যাস ফার্নেস:
- কোন তাৎক্ষণিক প্রভাব নেই
- ইনপুট গ্যাস হার → আউটপুট CO₂ ঘনত্বের বিলম্বিত প্রভাব সনাক্ত করা (p=4×10⁻²⁰)
দুগ্ধজাত পণ্যের মূল্য:
- মাখন → চেডার পনির মূল্যের বিলম্বিত প্রভাব সনাক্ত করা (p=5×10⁻¹⁵)
- বিপরীত প্রভাব সনাক্ত করা হয়নি, লুকানো মিশ্রণকারী অনুমান বাদ দেওয়া
- পদ্ধতি সীমিত নমুনায় ভালভাবে কাজ করে
- সময়গত কাঠামো দ্বারা প্রদত্ত পূর্বজ্ঞান কার্যকারণ অনুমানে সহায়তা করে
- পুনরাবৃত্তিমূলক নির্মাণ নেটওয়ার্ক অনুমান কর্মক্ষমতা উল্লেখযোগ্যভাবে উন্নত করে
- মডেল অনুমান লঙ্ঘনের প্রতি নির্দিষ্ট স্থিতিস্থাপকতা রয়েছে
- LiNGAM সিরিজ: Shimizu et al. (2006) এর রৈখিক অ-গাউসিয়ান অ-চক্রীয় মডেল এবং এর সময় শ্রেণী সম্প্রসারণ
- কাঠামোগত কার্যকারণ মডেল: Peters et al. (2013) এর সীমাবদ্ধ কাঠামোগত সমীকরণ মডেল
- পূর্বপুরুষ রিগ্রেশন: Schultheiss & Bühlmann (2023) এর স্বাধীন পর্যবেক্ষণ পদ্ধতি
- সময় শ্রেণী সেটিংসে পূর্বপুরুষ রিগ্রেশন প্রসারিত করা
- LiNGAM এর SVAR সম্প্রসারণের সাথে সনাক্তকরণ ক্ষমতায় অনুরূপ, কিন্তু ত্রুটি নিয়ন্ত্রণ প্রদান করা
- ঐতিহ্যবাহী পদ্ধতির তুলনায়, গণনামূলক দক্ষতা বেশি
- LiNGAM বনাম: ব্যাখ্যাযোগ্য ত্রুটি নিয়ন্ত্রণ প্রদান করা, কিন্তু শক্তি সামান্য কম
- ঐতিহ্যবাহী পদ্ধতি বনাম: সময়গত কাঠামো ব্যবহার করা, নির্দিষ্ট সনাক্তকরণ সমস্যা এড়ানো
- অন্যান্য SVAR পদ্ধতি বনাম: শক্তিশালী তাত্ত্বিক গ্যারান্টি, সহজ বাস্তবায়ন
- পূর্বপুরুষ রিগ্রেশন SVAR মডেলে সফলভাবে প্রসারিত করা
- অ্যাসিম্পটোটিক টাইপ I ত্রুটি নিয়ন্ত্রণের চমৎকার বৈশিষ্ট্য বজায় রাখা
- অনুকরণ এবং বাস্তব ডেটায় পদ্ধতির কার্যকারিতা যাচাই করা
- সময় শ্রেণী কার্যকারণ আবিষ্কারের জন্য নতুন তাত্ত্বিক কাঠামো প্রদান করা
- মডেল অনুমান: রৈখিক সম্পর্ক এবং স্বাধীন উদ্ভাবন পদ প্রয়োজন
- তাৎক্ষণিক অ-চক্রীয়তা: তাৎক্ষণিক প্রভাব অ-চক্রীয় অনুমান, সম্ভবত অবাস্তব
- গাউসিয়ান শব্দ: সংলগ্ন ভেরিয়েবলের গাউসিয়ান শব্দের প্রতি সংবেদনশীল
- লুকানো ভেরিয়েবল: অপর্যবেক্ষিত ভেরিয়েবল উপস্থিত থাকলে ত্রুটি নিয়ন্ত্রণ হারায়
- পটভূমি জ্ঞান একীকরণ: আরও সাধারণ পটভূমি জ্ঞান সেটিংসে প্রসারিত করা
- অরৈখিক সম্প্রসারণ: অরৈখিক কার্যকারণ সম্পর্ক পরিচালনা করা
- উচ্চ-মাত্রিক অপ্টিমাইজেশন: উচ্চ-মাত্রিক সময় শ্রেণীর গণনামূলক দক্ষতা উন্নত করা
- স্থিতিস্থাপকতা বৃদ্ধি: মডেল অনুমান লঙ্ঘনের প্রতি স্থিতিস্থাপক পদ্ধতি
- তাত্ত্বিক কঠোরতা: সম্পূর্ণ অ্যাসিম্পটোটিক তাত্ত্বিক বিশ্লেষণ এবং প্রমাণ প্রদান করা
- পদ্ধতি উদ্ভাবন: কার্যকারণ অনুমানের জন্য সময়গত কাঠামো কৌশলগতভাবে ব্যবহার করা
- ব্যবহারিক শক্তি: সহজ গণনা, বাস্তবায়ন সহজ
- যাচাইকরণ ব্যাপক: অনুকরণ এবং বাস্তব ডেটা যাচাইকরণ সম্পূর্ণ
- লেখা স্পষ্ট: যুক্তি স্পষ্ট, গাণিতিক অভিব্যক্তি নির্ভুল
- অনুমান কঠোর: রৈখিক এবং স্বাধীনতা অনুমান প্রযোজ্যতার পরিসীমা সীমিত করে
- শক্তি সমস্যা: নির্দিষ্ট পরিস্থিতিতে LiNGAM এর চেয়ে শক্তি কম
- বাস্তব ডেটা সীমিত: শুধুমাত্র দ্বিমাত্রিক সময় শ্রেণীতে যাচাই করা
- উচ্চ-মাত্রিক চ্যালেঞ্জ: বড় আকারের নেটওয়ার্কের বহুত্ব সংশোধন অত্যন্ত রক্ষণশীল
- তাত্ত্বিক অবদান: সময় শ্রেণী কার্যকারণ আবিষ্কারের জন্য নতুন তাত্ত্বিক কাঠামো প্রদান করা
- পদ্ধতিগত মূল্য: পূর্বপুরুষ রিগ্রেশনের গুরুত্বপূর্ণ সম্প্রসারণ
- ব্যবহারিক মূল্য: বাস্তব সময় শ্রেণী বিশ্লেষণের জন্য সরঞ্জাম প্রদান করা
- পুনরুৎপাদনযোগ্যতা: কোড প্রকাশ্য, ফলাফল পুনরুৎপাদনযোগ্য
- অর্থনৈতিক সময় শ্রেণী: ম্যাক্রোঅর্থনৈতিক ভেরিয়েবলের মধ্যে কার্যকারণ সম্পর্ক বিশ্লেষণ
- জৈব চিকিৎসা: শারীরিক সংকেতের মধ্যে কার্যকারণ অনুমান
- প্রকৌশল সিস্টেম: নিয়ন্ত্রণ সিস্টেমে কার্যকারণ সম্পর্ক সনাক্তকরণ
- সামাজিক বিজ্ঞান: সামাজিক ঘটনার গতিশীল কার্যকারণ বিশ্লেষণ
- Schultheiss, C. and Bühlmann, P. (2023). Ancestor regression in linear structural equation models. Biometrika, 110(4):1117–1124.
- Shimizu, S., Hoyer, P. O., Hyvärinen, A., Kerminen, A., and Jordan, M. (2006). A linear non-gaussian acyclic model for causal discovery. Journal of Machine Learning Research, 7(10).
- Peters, J., Janzing, D., and Schölkopf, B. (2013). Causal inference on time series using restricted structural equation models. Advances in neural information processing systems, 26.
- Hyvärinen, A., Zhang, K., Shimizu, S., and Hoyer, P. O. (2010). Estimation of a structural vector autoregression model using non-gaussianity. Journal of Machine Learning Research, 11(5).
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের পদ্ধতিগত পেপার, যা তাত্ত্বিক এবং ব্যবহারিক স্তরে গুরুত্বপূর্ণ অবদান রাখে। লেখকরা সফলভাবে একটি গুরুত্বপূর্ণ কার্যকারণ আবিষ্কার পদ্ধতি সময় শ্রেণী সেটিংসে প্রসারিত করেছেন, মূল পদ্ধতির চমৎকার বৈশিষ্ট্য বজায় রেখেছেন। কিছু সীমাবদ্ধতা থাকলেও, এটি সময় শ্রেণী কার্যকারণ অনুমান ক্ষেত্রে মূল্যবান সরঞ্জাম এবং তাত্ত্বিক ভিত্তি প্রদান করে।