We present a geometric formulation of automatic differentiation (AD) using jet bundles and Weil algebras. Reverse-mode AD emerges as cotangent-pullback, while Taylor-mode corresponds to evaluation in a Weil algebra. From these principles, we derive concise statements on correctness, stability, and complexity: a functorial identity for reverse-mode, algebraic exactness of higher-order derivatives, and explicit bounds on truncation error. We further show that tensorized Weil algebras permit one-pass computation of all mixed derivatives with cost linear in the algebra dimension, avoiding the combinatorial blow-up of nested JVP/VJP schedules. This framework interprets AD theory through the lens of differential geometry and offers a foundation for developing structure-preserving differentiation methods in deep learning and scientific computing. Code and examples are available at https://git.nilu.no/geometric-ad/jet-weil-ad.
- পত্র আইডি: 2510.14342
- শিরোনাম: জেট ফাংটর এবং ওয়েইল বীজগণিত স্বয়ংক্রিয় পার্থক্যকরণে: একটি জ্যামিতিক বিশ্লেষণ
- লেখক: অমন্দিপ সাংঘা (দ্য ক্লাইমেট এবং এনভায়রনমেন্টাল রিসার্চ ইনস্টিটিউট NILU, নরওয়ে)
- শ্রেণীবিভাগ: cs.LG math.DG stat.ML
- প্রকাশনার সময়: ২০২৫ সালের ১৬ অক্টোবর
- পত্র লিঙ্ক: https://arxiv.org/abs/2510.14342
এই পত্রটি জেট বান্ডেল (jet bundles) এবং ওয়েইল বীজগণিতের উপর ভিত্তি করে স্বয়ংক্রিয় পার্থক্যকরণ (AD) এর একটি জ্যামিতিক প্রণয়ন প্রস্তাব করে। বিপরীত মোড AD কোট্যাঞ্জেন্ট পুলব্যাক (cotangent-pullback) হিসাবে প্রকাশিত হয়, যখন টেইলর মোড ওয়েইল বীজগণিতে মূল্যায়নের সাথে সামঞ্জস্যপূর্ণ। এই নীতিগুলির উপর ভিত্তি করে, লেখক সঠিকতা, স্থিতিশীলতা এবং জটিলতা সম্পর্কে সংক্ষিপ্ত বিবৃতি প্রকাশ করেন: বিপরীত মোডের ফাংটর পরিচয়, উচ্চ-ক্রম ডেরিভেটিভের বীজগণিত নির্ভুলতা এবং ট্রাঙ্কেশন ত্রুটির স্পষ্ট সীমানা। লেখক আরও প্রমাণ করেন যে টেনসরাইজড ওয়েইল বীজগণিত বীজগণিত মাত্রার সাথে রৈখিক খরচে সমস্ত মিশ্র ডেরিভেটিভ একবারে গণনা করার অনুমতি দেয়, নেস্টেড JVP/VJP সময়সূচীর সমন্বয়মূলক বিস্ফোরণ এড়ায়। এই কাঠামোটি ডিফারেনশিয়াল জ্যামিতির দৃষ্টিভঙ্গি থেকে AD তত্ত্ব ব্যাখ্যা করে, গভীর শিক্ষা এবং বৈজ্ঞানিক গণনায় কাঠামো-সংরক্ষণকারী পার্থক্য পদ্ধতির উন্নয়নের জন্য ভিত্তি প্রদান করে।
স্বয়ংক্রিয় পার্থক্যকরণ (Automatic Differentiation, AD) আধুনিক মেশিন লার্নিং এবং বৈজ্ঞানিক গণনার একটি মৌলিক প্রযুক্তি, কিন্তু বিদ্যমান AD তত্ত্ব একটি একীভূত জ্যামিতিক তাত্ত্বিক কাঠামোর অভাব রয়েছে, যা নিম্নলিখিত সমস্যা সৃষ্টি করে:
- তাত্ত্বিক বিচ্ছিন্নতা: বিপরীত মোড AD (ব্যাকপ্রপাগেশন) এবং উচ্চ-ক্রম AD এর তাত্ত্বিক ভিত্তি বিভিন্ন গাণিতিক কাঠামোতে বিক্ষিপ্ত
- জটিলতার বিস্ফোরণ: উচ্চ-ক্রম মিশ্র ডেরিভেটিভ গণনা সমন্বয়মূলক জটিলতার বিস্ফোরণের সম্মুখীন হয়
- অপরিবর্তনীয়তার অভাব: বিদ্যমান পদ্ধতি স্থিতিশীলতা বিশ্লেষণকে প্রভাবিত করে, স্থানাঙ্ক-স্বাধীন জ্যামিতিক ব্যাখ্যার অভাব রয়েছে
এই গবেষণার গুরুত্বপূর্ণ অর্থ রয়েছে:
- তাত্ত্বিক একীকরণ: AD এর জন্য একটি একীভূত ডিফারেনশিয়াল জ্যামিতি তাত্ত্বিক ভিত্তি প্রদান করে
- গণনামূলক দক্ষতা: উচ্চ-ক্রম ডেরিভেটিভ গণনার দক্ষতা সমস্যা সমাধান করে
- প্রয়োগের সম্ভাবনা: গভীর শিক্ষায় জ্যামিতি-সচেতন পদ্ধতির জন্য তাত্ত্বিক সমর্থন প্রদান করে
- ঐতিহ্যবাহী AD পদ্ধতি: স্থানাঙ্ক প্রতিনিধিত্বের উপর নির্ভর করে, জ্যামিতিক অপরিবর্তনীয়তার অভাব রয়েছে
- উচ্চ-ক্রম ডেরিভেটিভ গণনা: নেস্টেড JVP/VJP পদ্ধতি সূচকীয় জটিলতা উপস্থাপন করে
- স্থিতিশীলতা বিশ্লেষণ: সিস্টেমেটিক ত্রুটি প্রচার তত্ত্বের অভাব রয়েছে
- ব্যাকপ্রপাগেশনের জ্যামিতিক তত্ত্ব প্রতিষ্ঠা করেছে: বিপরীত মোড AD কোট্যাঞ্জেন্ট পুলব্যাক অপারেশনের সমতুল্য প্রমাণ করে, স্থানাঙ্ক-স্বাধীন প্রণয়ন প্রদান করে
- ওয়েইল বীজগণিত কাঠামো প্রস্তাব করেছে: টেইলর মোড AD কে ওয়েইল বীজগণিতে নির্ভুল মূল্যায়ন হিসাবে প্রণয়ন করে, বীজগণিত নির্ভুলতা নিশ্চিত করে
- টেনসরাইজড ওয়েইল বীজগণিত পদ্ধতি উন্নত করেছে: সমস্ত মিশ্র ডেরিভেটিভের একবার গণনা বাস্তবায়ন করে, বীজগণিত মাত্রার সাথে রৈখিক জটিলতা
- সম্পূর্ণ তাত্ত্বিক বিশ্লেষণ প্রদান করেছে: সঠিকতা প্রমাণ, স্থিতিশীলতা সীমানা এবং জটিলতা বিশ্লেষণ সহ
মসৃণ ম্যাপিং f:M→N (যেখানে M,N মসৃণ ম্যানিফোল্ড) এবং স্কেলার ফাংশন ℓ:N→R দেওয়া হলে, লক্ষ্য হল:
- যৌগিক ফাংশন ℓ∘f এর গ্রেডিয়েন্ট গণনা করা
- f এর উচ্চ-ক্রম ডেরিভেটিভ গণনা করা
- জ্যামিতিকভাবে অপরিবর্তনীয় উপায়ে উপরোক্ত গণনা বাস্তবায়ন করা
উপপাদ্য ১ (কোট্যাঞ্জেন্ট পুলব্যাক হিসাবে ব্যাকপ্রপাগেশন): মসৃণ ম্যাপিং f:M→N এবং ℓ:N→R এর জন্য, আমাদের কাছে রয়েছে:
∇x(ℓ∘f)=(dfx)∗(dℓf(x))
সমতুল্যভাবে, জেট স্তরে: (j1f)∗(j1ℓ)=j1(ℓ∘f)
এই উপপাদ্যটি ব্যাকপ্রপাগেশনকে কোট্যাঞ্জেন্ট স্পেসে পুলব্যাক অপারেশন হিসাবে পুনর্নির্ধারণ করে, যার নিম্নলিখিত জ্যামিতিক অর্থ রয়েছে:
- স্থানাঙ্ক-স্বাধীনতা: ফলাফল নির্দিষ্ট স্থানাঙ্ক সিস্টেম নির্বাচনের উপর নির্ভর করে না
- ফাংটর বৈশিষ্ট্য: (d(g∘f)x)∗=(dfx)∗∘(dgf(x))∗ সন্তুষ্ট করে
- স্বাভাবিকতা: মসৃণ পুনঃপ্যারামিটারাইজেশনের সাথে সামঞ্জস্যপূর্ণ
উপপাদ্য ২ (ওয়েইল মোড মূল্যায়নের নির্ভুলতা): W যদি mk+1=0 সন্তুষ্ট করে এমন একটি ওয়েইল বীজগণিত হয়, তাহলে উন্নত ম্যাপিং TWf:TWU→TWRm f এর সমস্ত k-ক্রম ডেরিভেটিভকে ট্রাঙ্কেটেড টেইলর সম্প্রসারণের সহগ হিসাবে x এ নির্ভুলভাবে গণনা করে।
ওয়েইল বীজগণিতের নির্মাণ:
- W=R[ε]/(εk+1) বা টেনসর পণ্য ফর্মের আকার
- নিলপোটেন্সি εk+1=0 স্বয়ংক্রিয়ভাবে ট্রাঙ্কেশন বাস্তবায়ন করে
- বীজগণিত অপারেশন সরাসরি ডেরিভেটিভ প্রচার নিয়মের সাথে সামঞ্জস্যপূর্ণ
উপপাদ্য ৩ (টেনসরাইজড ওয়েইল বীজগণিতের জটিলতা): টেনসরাইজড ওয়েইল বীজগণিত বিবেচনা করুন:
W≅⨂j=1pR[εj]/(εjρj+1),dimW=∏j=1p(ρj+1)
W-বিন্দু xW:=x+∑j=1pεjv(j) এ f এর একক মূল্যায়ন সমস্ত মিশ্র দিকনির্দেশক ডেরিভেটিভ উৎপাদন করে, সময় জটিলতা O(dimW⋅Q), যেখানে Q হল মূল প্রোগ্রামের স্কেলার অপারেশন।
- জ্যামিতিক একীকরণ: প্রথমবারের মতো AD এর সমস্ত মোড ডিফারেনশিয়াল জ্যামিতি কাঠামোর অধীনে একীভূত করা হয়েছে
- বীজগণিত নির্ভুলতা: নিলপোটেন্সির মাধ্যমে ট্রাঙ্কেশনের বীজগণিত নির্ভুলতা অর্জন করে, সংখ্যাগত ত্রুটি এড়ায়
- রৈখিক জটিলতা: টেনসরাইজড পদ্ধতি ঐতিহ্যবাহী নেস্টেড পদ্ধতির সমন্বয়মূলক বিস্ফোরণ এড়ায়
- বিপরীত টেপের প্রয়োজন নেই: ওয়েইল মোড শুধুমাত্র সহগ অ্যারে সংরক্ষণ করতে হবে, গণনা গ্রাফ সংরক্ষণের প্রয়োজন নেই
লেখক প্রধানত তাত্ত্বিক বিশ্লেষণের মাধ্যমে পদ্ধতির কার্যকারিতা যাচাই করেন, যার মধ্যে রয়েছে:
- সঠিকতা যাচাইকরণ: ফাংটর বৈশিষ্ট্যের মাধ্যমে প্রমাণ
- স্থিতিশীলতা বিশ্লেষণ: স্পষ্ট ত্রুটি সীমানা প্রদান করে
- জটিলতা বিশ্লেষণ: ঐতিহ্যবাহী পদ্ধতির সাথে তাত্ত্বিক তুলনা
লেম্মা ১ (বিপরীত স্ক্যানের পশ্চাদ্বর্তী স্থিতিশীলতা): প্রাথমিক {ϕi}i=1L সহ একটি সরল প্রোগ্রামের জন্য, যদি প্রতিটি সহায়ক ϕi∗ সন্তুষ্ট করে:
∥ϕi∗(v)∥≤Li∥v∥,∥ϕ^i∗(v)−ϕi∗(v)∥≤δi∥ϕi∗(v)∥
তাহলে গণনা করা পুলব্যাক সন্তুষ্ট করে:
∥f^∗(yˉ)∥≤(∏i=1L(1+δi)Li)∥yˉ∥
| পদ্ধতি | সময় জটিলতা | স্থান জটিলতা | টেপ প্রয়োজন |
|---|
| নেস্টেড JVP/VJP | O((kp+k)⋅Q) | O(L) (টেপ) | হ্যাঁ |
| টেনসরাইজড ওয়েইল | O(∏j=1p(ρj+1)⋅Q) | O(dimW) | না |
অনুসিদ্ধান্ত ১: ধরুন f∈Ck+1(Br(x),Rm) এবং এর ডেরিভেটিভ ∥Dℓf(z)∥≤Mℓ সন্তুষ্ট করে, তাহলে টেইলর সহগ সন্তুষ্ট করে:
∥fα(x)∥≤α!M∣α∣
ধাপ দৈর্ঘ্য ρ<r এর জন্য, অবশিষ্ট অংশ মান Cauchy অনুমান সন্তুষ্ট করে:
∥Rk+1(z)∥≤(k+1)!Mk+1ρk+1
যদিও পত্রটি প্রধানত তাত্ত্বিক বিশ্লেষণে ফোকাস করে, এটি মূল কর্মক্ষমতা অন্তর্দৃষ্টি প্রদান করে:
- মেমরি দক্ষতা: ওয়েইল মোড বিপরীত টেপ সংরক্ষণ এড়ায়
- সমান্তরাল-বান্ধব: সহগ অপারেশন প্রাকৃতিকভাবে ভেক্টরাইজেশন সমর্থন করে
- সংখ্যাগত স্থিতিশীলতা: ট্রাঙ্কেশন ত্রুটি স্পষ্টভাবে নিয়ন্ত্রণ করা যায়
- ক্যাটাগরি তত্ত্ব দৃষ্টিভঙ্গি: Elliott (2018), Fong এবং অন্যরা (2019) AD এর ফাংটর প্রণয়ন প্রস্তাব করেছেন
- জ্যামিতিক AD তত্ত্ব: Betancourt (2018) AD তে জেট জ্যামিতির অন্বেষণ করেছেন
- উচ্চ-ক্রম AD অ্যালগরিদম: Giles (2008), Fike এবং Alonso (2012) সংখ্যাগত স্থিতিশীলতা বিশ্লেষণ করেছেন
- তাত্ত্বিক সম্পূর্ণতা: প্রথমবারের মতো AD এর সম্পূর্ণ জ্যামিতিক তাত্ত্বিক কাঠামো প্রদান করে
- ব্যবহারিকতা: টেনসরাইজড ওয়েইল বীজগণিত পদ্ধতি প্রকৃত প্রয়োগ মূল্য রয়েছে
- একীকরণ: বিপরীত, সামনের এবং উচ্চ-ক্রম AD একই কাঠামোর অধীনে একীভূত করে
- জ্যামিতিক একীকরণ: AD এর সমস্ত মোড ডিফারেনশিয়াল জ্যামিতি কাঠামোর অধীনে একীভূতভাবে বোঝা যায়
- গণনামূলক সুবিধা: টেনসরাইজড ওয়েইল বীজগণিত উচ্চ-ক্রম ডেরিভেটিভ গণনার জন্য একটি দক্ষ পদ্ধতি প্রদান করে
- তাত্ত্বিক সম্পূর্ণতা: সঠিকতা, স্থিতিশীলতা এবং জটিলতার সম্পূর্ণ তাত্ত্বিক বিশ্লেষণ প্রদান করে
- বাস্তবায়ন জটিলতা: ওয়েইল বীজগণিতের প্রকৃত বাস্তবায়ন সাবধানে ডিজাইন করা ডেটা কাঠামোর প্রয়োজন
- প্রয়োগের পরিধি: প্রধানত ঘন মিশ্র ডেরিভেটিভের প্রয়োজন এমন পরিস্থিতিতে প্রযোজ্য
- সংখ্যাগত নির্ভুলতা: উচ্চ-ক্রম গণনা সংখ্যাগত নির্ভুলতা সমস্যার সম্মুখীন হতে পারে
- ম্যানিফোল্ডে অন্তর্নিহিত AD: সাধারণ রিম্যানিয়ান ম্যানিফোল্ডে সম্প্রসারণ
- PDE-সীমাবদ্ধ অপ্টিমাইজেশন: পরিবর্তনশীল এবং PDE-সীমাবদ্ধ সমস্যায় প্রয়োগ
- উচ্চ-ক্রম টেনসর সংকোচন: সহগ অ্যারের সংকোচন কৌশল উন্নয়ন
- প্রাথমিক নিয়ম উন্নয়ন: রৈখিক বীজগণিত এবং বিশেষ ফাংশনকে ওয়েইল বীজগণিতে সিস্টেমেটিকভাবে উন্নীত করা
- তাত্ত্বিক উদ্ভাবন শক্তিশালী: প্রথমবারের মতো AD এর সম্পূর্ণ জ্যামিতিক তাত্ত্বিক কাঠামো প্রতিষ্ঠা করে
- গাণিতিক কঠোরতা: সমস্ত উপপাদ্যের সম্পূর্ণ গাণিতিক প্রমাণ রয়েছে
- ব্যবহারিক মূল্য উচ্চ: টেনসরাইজড ওয়েইল বীজগণিত পদ্ধতি প্রকৃত গণনা সমস্যা সমাধান করে
- প্রকাশ স্পষ্ট: জটিল গাণিতিক ধারণা তুলনামূলকভাবে স্পষ্টভাবে ব্যাখ্যা করা হয়েছে
- পরীক্ষামূলক যাচাইকরণের অভাব: প্রধানত তাত্ত্বিক কাজ, প্রকৃত অ্যালগরিদম বাস্তবায়ন এবং কর্মক্ষমতা পরীক্ষার অভাব
- প্রয়োগ পরিস্থিতি সীমাবদ্ধ: প্রধানত উচ্চ-ক্রম ডেরিভেটিভ প্রয়োজন এমন নির্দিষ্ট পরিস্থিতিতে প্রযোজ্য
- বাস্তবায়ন বিবরণ অপর্যাপ্ত: প্রকৃত সিস্টেম বাস্তবায়নের জন্য নির্দেশনা সীমিত
- একাডেমিক মূল্য: AD তত্ত্বের জন্য নতুন গাণিতিক ভিত্তি প্রদান করে
- প্রয়োগ সম্ভাবনা: বৈজ্ঞানিক গণনা এবং জ্যামিতিক গভীর শিক্ষায় গুরুত্বপূর্ণ প্রয়োগ সম্ভাবনা
- অনুপ্রেরণামূলক: সম্পর্কিত ক্ষেত্র গবেষণার জন্য নতুন চিন্তাভাবনা প্রদান করে
- বৈজ্ঞানিক গণনা: উচ্চ নির্ভুলতা উচ্চ-ক্রম ডেরিভেটিভ প্রয়োজন এমন পদার্থবিজ্ঞান সিমুলেশন
- অপ্টিমাইজেশন অ্যালগরিদম: দ্বিতীয় ক্রম অপ্টিমাইজেশন পদ্ধতির দক্ষ বাস্তবায়ন
- জ্যামিতিক গভীর শিক্ষা: ম্যানিফোল্ডে নিউরাল নেটওয়ার্ক প্রশিক্ষণ
- মেটা-লার্নিং: উচ্চ-ক্রম গ্রেডিয়েন্ট প্রয়োজন এমন স্ব-অভিযোজনশীল অ্যালগরিদম
পত্রটি ১৮টি গুরুত্বপূর্ণ সাহিত্য উদ্ধৃত করে, যার মধ্যে প্রধানত রয়েছে:
- Elliott (2018): AD এর ফাংশনাল প্রণয়ন
- Fong এবং অন্যরা (2019): ব্যাকপ্রপাগেশনের ক্যাটাগরি তত্ত্ব দৃষ্টিভঙ্গি
- Betancourt (2018): উচ্চ-ক্রম AD এর জ্যামিতিক তত্ত্ব
- Baydin এবং অন্যরা (2018): AD সমীক্ষা
- Kolář এবং অন্যরা (1993): ডিফারেনশিয়াল জ্যামিতিতে প্রাকৃতিক অপারেশন
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের তাত্ত্বিক পত্র যা স্বয়ংক্রিয় পার্থক্যকরণের জন্য একটি নতুন জ্যামিতিক তাত্ত্বিক কাঠামো প্রদান করে। যদিও পরীক্ষামূলক যাচাইকরণের অভাব রয়েছে, তবে এর তাত্ত্বিক অবদান উল্লেখযোগ্য এবং সম্পর্কিত ক্ষেত্রের উন্নয়নের জন্য গুরুত্বপূর্ণ গাণিতিক ভিত্তি প্রদান করে। এই কাজের প্রধান মূল্য তাত্ত্বিক একীকরণ এবং পদ্ধতি উদ্ভাবনে নিহিত, AD তত্ত্ব উন্নয়ন প্রচারের জন্য গুরুত্বপূর্ণ অর্থ রাখে।