ফ্রেশে মান ডেটার একটি গুরুত্বপূর্ণ পরিসংখ্যানগত সারাংশ এবং কেন্দ্রীয়তার পরিমাপ, যা পার্সিস্টেন্ট হোমোলজিতে পার্সিস্টেন্স ডায়াগ্রামের জন্য সংজ্ঞায়িত এবং অধ্যয়ন করা হয়েছে। তবে, পার্সিস্টেন্স ডায়াগ্রাম স্থানের জটিল জ্যামিতিক কাঠামো মানে যে প্রদত্ত পার্সিস্টেন্স ডায়াগ্রাম সেটের ফ্রেশে মান অপরিহার্যভাবে অনন্য নয়, যা অভিজ্ঞতামূলক মানের সাপেক্ষে জনসংখ্যার মানের তাত্ত্বিক গ্যারান্টি বাধা দেয়। এই পেপারটি এমন পার্সিস্টেন্স ডায়াগ্রাম সেটের জন্য ভেরিয়েন্স অভিব্যক্তি প্রাপ্ত করে যা গ্রুপিং নামক পার্সিস্টেন্ট পয়েন্টগুলির মধ্যে একাধিক ম্যাচিং প্রদর্শন করে। অধিকন্তু, গ্রুপিংয়ের একটি শর্ত প্রস্তাব করা হয়েছে, যাকে সমতলতা বলা হয়; এটি প্রমাণ করা হয়েছে যে সমতল গ্রুপিং প্রদর্শনকারী পার্সিস্টেন্স ডায়াগ্রাম সেট একটি অনন্য ফ্রেশে মান উৎপন্ন করে। সাধারণ গ্রুপিংয়ের জন্য সীমিত নমুনা সংগ্রহ ফলাফল প্রাপ্ত করা হয়েছে, যখন গ্রুপিং সমতল হয় তখন ফ্রেশে মানের সংগ্রহ পাওয়া যায়। তারপর সম্প্রতি প্রস্তাবিত আলেক্সান্দ্রভ জ্যামিতিতে ফ্রেশে মানের সাধারণ কাঠামোতে সমতল গ্রুপিং ব্যাখ্যা করা হয়েছে। অবশেষে, ম্যানিফোল্ড-মূল্যবান ডেটার জন্য, পার্সিস্টেন্স ডায়াগ্রাম ছাঁটাই করে সমতল গ্রুপিং তৈরি করা যায় তা প্রদর্শন করা হয়েছে।
১. পার্সিস্টেন্ট হোমোলজির পরিসংখ্যানগত বিশ্লেষণের প্রয়োজনীয়তা: পার্সিস্টেন্ট হোমোলজি টপোলজিক্যাল ডেটা বিশ্লেষণের একটি গুরুত্বপূর্ণ পদ্ধতি হিসাবে, এর প্রধান আউটপুট হল পার্সিস্টেন্স ডায়াগ্রাম। এই পদ্ধতিটি বিভিন্ন বৈজ্ঞানিক ক্ষেত্রে ব্যাপক প্রয়োগের সাথে, পার্সিস্টেন্স ডায়াগ্রামের পরিসংখ্যানগত বৈশিষ্ট্যের গবেষণা একটি মূল সমস্যা হয়ে উঠেছে।
२. ফ্রেশে মানের গুরুত্ব: ফ্রেশে মান সাধারণ পাটিগণিত মানকে সাধারণ মেট্রিক স্থানে প্রসারিত করার একটি গুরুত্বপূর্ণ পরিসংখ্যান, পার্সিস্টেন্স ডায়াগ্রাম স্থানে সংজ্ঞায়িত এবং অধ্যয়ন করা হয়েছে, এবং পার্সিস্টেন্স ডায়াগ্রাম সেটের কেন্দ্রীয়তা পরিমাপের একটি মূল সরঞ্জাম।
३. অনন্যতা সমস্যার চ্যালেঞ্জ: পার্সিস্টেন্স ডায়াগ্রাম স্থান এর অ-নেতিবাচক বক্রতার জটিল জ্যামিতিক কাঠামোর কারণে, ফ্রেশে মান সাধারণত অনন্য নয়, যা তাত্ত্বিক বিশ্লেষণ এবং ব্যবহারিক প্রয়োগকে গুরুতরভাবে সীমাবদ্ধ করে।
१. অনন্যতা শর্তের অভাব: বিদ্যমান গবেষণা সংগ্রহ ফলাফল স্থাপনের জন্য ফ্রেশে মানের অনন্যতা অনুমান করে, কিন্তু কখন অনন্য তা নির্ধারণ করার জন্য শর্তের অভাব রয়েছে।
२. অপর্যাপ্ত তাত্ত্বিক গ্যারান্টি: প্রকৃত ডেটা থেকে গণনা করা অভিজ্ঞতামূলক ফ্রেশে মানের জন্য তাত্ত্বিক গ্যারান্টি প্রদান করা যায় না।
३. গণনার জটিলতা: অ-অনন্যতার কারণে, বিদ্যমান অ্যালগরিদম স্থানীয় সর্বোত্তম সমাধানে রূপান্তরিত হতে পারে।
এই পেপারটি জ্যামিতিক বিশ্লেষণের মাধ্যমে ফ্রেশে মানের অনন্যতা নিশ্চিত করার শর্ত খুঁজে বের করার লক্ষ্য রাখে, যাতে পার্সিস্টেন্স ডায়াগ্রামের পরিসংখ্যানগত বিশ্লেষণের জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করা যায় এবং সংশ্লিষ্ট সংগ্রহ তত্ত্ব স্থাপন করা যায়।
१. সমতল গ্রুপিং ধারণা প্রস্তাব: পার্সিস্টেন্স ডায়াগ্রাম সেটের "সমতল গ্রুপিং" (flat grouping) জ্যামিতিক শর্ত সংজ্ঞায়িত করা হয়েছে, যা ফ্রেশে মানের অনন্যতা নিশ্চিত করার একটি যথেষ্ট শর্ত।
२. ভেরিয়েন্স অভিব্যক্তি প্রাপ্ত করা: সাধারণ গ্রুপিংয়ের জন্য নির্ভুল ভেরিয়েন্স অভিব্যক্তি (উপপাদ্য ८) প্রাপ্ত করা হয়েছে, যা ভেরিয়েন্সে তির্যক অবদানের প্রভাব প্রকাশ করে।
३. অনন্যতা উপপাদ্য প্রমাণ: এটি প্রমাণ করা হয়েছে যে সমতল গ্রুপিং সহ পার্সিস্টেন্স ডায়াগ্রাম সেট একটি অনন্য ফ্রেশে মান রয়েছে (উপপাদ্য १०)।
४. সংগ্রহ তত্ত্ব স্থাপন: সাধারণ গ্রুপিংয়ের জন্য সীমিত নমুনা সংগ্রহ হার (উপপাদ্য ११) প্রাপ্ত করা হয়েছে, বিশেষত সমতল গ্রুপিংয়ের ফ্রেশে মানের জন্য সংগ্রহ গ্যারান্টি প্রদান করা হয়েছে।
५. আলেক্সান্দ্রভ জ্যামিতি ব্যাখ্যা: আলেক্সান্দ্রভ স্থান তত্ত্ব কাঠামোর অধীনে সমতল গ্রুপিং পুনর্ব্যাখ্যা করা হয়েছে, জ্যামিতিক অন্তর্দৃষ্টি এবং তাত্ত্বিক অন্তর্দৃষ্টি প্রদান করা হয়েছে।
६. ব্যবহারিক প্রয়োগ পদ্ধতি: পার্সিস্টেন্স ডায়াগ্রাম ছাঁটাই করে সমতল গ্রুপিং তৈরি করা যায় তা প্রদর্শন করা হয়েছে, ম্যানিফোল্ড ডেটার পার্সিস্টেন্ট হোমোলজি অনুমানের জন্য একটি ব্যবহারিক পদ্ধতি প্রদান করা হয়েছে।
প্রদত্ত পার্সিস্টেন্স ডায়াগ্রাম সেট দেওয়া হয়েছে, এর ফ্রেশে মানের অনন্যতা শর্ত অধ্যয়ন করা হয়েছে। ফ্রেশে ফাংশন সংজ্ঞায়িত করা হয়েছে: যেখানে হল ২-ওয়াসারস্টেইন দূরত্ব।
সংজ্ঞা ४: গ্রুপিং হল একটি আকারের ম্যাট্রিক্স, যার উপাদানগুলি থেকে অ-তির্যক পয়েন্ট এবং তির্যক এর অনুলিপি। প্রতিটি সারি একটি নির্বাচন (selection) বলা হয়।
গ্রুপিং মূলত পার্সিস্টেন্স ডায়াগ্রামের মধ্যে পয়েন্টের একাধিক ম্যাচিং প্রতিনিধিত্ব, যা দুটি পার্সিস্টেন্স ডায়াগ্রামের মধ্যে দ্বিমুখী ম্যাচিং ধারণা সাধারণীকরণ করে।
উপপাদ্য ८: গ্রুপিং এর জন্য, এর ভেরিয়েন্স হল:
যেখানে হল -তম সারিতে অ-তির্যক পয়েন্টের সংখ্যা। প্রথম পদ পয়েন্টের মধ্যে দূরত্ব অবদান প্রতিফলিত করে, দ্বিতীয় পদ তির্যকের বিশেষ ভূমিকা প্রকাশ করে।
সংজ্ঞা ९: গ্রুপিং সমতল, যদি বিদ্যমান থাকে যেমন:
সমতল গ্রুপিং শর্ত তিনটি জ্যামিতিক সীমাবদ্ধতা চতুরভাবে ভারসাম্য রাখে:
এই ডিজাইন সর্বোত্তম ম্যাচিংয়ের অনন্যতা নিশ্চিত করে।
পার্সিস্টেন্স ডায়াগ্রাম পয়েন্টগুলিকে তির্যকের সমান্তরাল এবং লম্ব উপাদানে বিয়োজন করে, তির্যক প্রভাব অন্তর্ভুক্ত করে ভেরিয়েন্স অভিব্যক্তি নির্ভুলভাবে গণনা করা হয়েছে, যা প্রযুক্তিগতভাবে একটি গুরুত্বপূর্ণ অগ্রগতি।
অ-নেতিবাচক বক্রতা আলেক্সান্দ্রভ স্থানের জ্যামিতিক বৈশিষ্ট্য ব্যবহার করা হয়েছে, বিশেষত হিলবার্ট সাব-কোন এবং আলিঙ্গন ফাংশন (hugging function) এর ধারণা, সমতল গ্রুপিংয়ের জন্য গভীর জ্যামিতিক ব্যাখ্যা প্রদান করা হয়েছে।
१. বৃত্তাকার ডেটা: ০.५ ব্যাসার্ধের বৃত্ত, १००० টি সমানভাবে নমুনা করা পয়েন্ট २. টোরাস ডেটা: ০.८ বাহ্যিক ব্যাসার্ধ, ०.३ অভ্যন্তরীণ ব্যাসার্ধের টোরাস, १०००० টি সমানভাবে নমুনা করা পয়েন্ট
বুটস্ট্র্যাপ পদ্ধতি ব্যবহার করা হয়েছে:
ম্যানিফোল্ডের বিচ্ছেদ ধ্রুবক এর উপর ভিত্তি করে, ছাঁটাই থ্রেশহোল্ড নির্ধারণ করা হয়েছে, তির্যক থেকে খুব কাছাকাছি পয়েন্টগুলি সরানো হয়েছে, অবশিষ্ট পয়েন্টগুলি সমতল গ্রুপিং গঠন নিশ্চিত করা হয়েছে।
१. ছাঁটাইয়ের কার্যকারিতা: উপযুক্ত ছাঁটাই করে সমতল গ্রুপিং সফলভাবে তৈরি করা যায় २. অনুমানের গুণমান: ছাঁটাই করা ফ্রেশে মান মূল পার্সিস্টেন্স ডায়াগ্রামের প্রধান টপোলজিক্যাল বৈশিষ্ট্য ভালভাবে অনুমান করতে পারে ३. গণনার স্থিতিশীলতা: সমতল গ্রুপিং ফ্রেশে মানের অনন্যতা নিশ্চিত করে, অ্যালগরিদম বিভিন্ন স্থানীয় সর্বোত্তম সমাধানে রূপান্তরিত হওয়ার সমস্যা এড়ায়
१. ফ্রেশে মান তত্ত্ব: মিলেইকো এবং অন্যরা (२०११) প্রথমে পার্সিস্টেন্স ডায়াগ্রামের ফ্রেশে মান সংজ্ঞায়িত করেছেন, টার্নার এবং অন্যরা (२०१४) অনন্যতা অনুমান করে সংগ্রহ ফলাফল স্থাপন করেছেন २. গণনা অ্যালগরিদম: টার্নার এবং অন্যরা (२०१४) লোভী অ্যালগরিদম প্রস্তাব করেছেন, ল্যাকম্ব এবং অন্যরা (२०१८) সর্বোত্তম পরিবহনের উপর ভিত্তি করে অ্যালগরিদম বিকশিত করেছেন ३. সম্ভাব্যতা পদ্ধতি: মুঞ্চ এবং অন্যরা (२०१५) সময়-পরিবর্তনশীল পার্সিস্টেন্স ডায়াগ্রাম পরিচালনার জন্য সম্ভাব্য ফ্রেশে মান প্রবর্তন করেছেন
१. সাধারণ তত্ত্ব: লে গুইক এবং অন্যরা (२०२२) আলেক্সান্দ্রভ স্থানে অভিজ্ঞতামূলক ফ্রেশে মানের সাধারণ সংগ্রহ তত্ত্ব স্থাপন করেছেন २. প্রয়োগের উদাহরণ: এই তত্ত্ব গাউসীয় বিতরণ কেন্দ্রবিন্দু, টেমপ্লেট বিকৃতি মডেল এবং অন্যান্য অনেক ক্ষেত্রে সফলভাবে প্রয়োগ করা হয়েছে ३. জ্যামিতিক বৈশিষ্ট্য: টার্নার এবং অন্যরা (२०१४) প্রমাণ করেছেন যে অ-নেতিবাচক বক্রতার আলেক্সান্দ্রভ স্থান
বিদ্যমান কাজের তুলনায়, এই পেপারটি প্রথমবারের মতো পার্সিস্টেন্স ডায়াগ্রামের ফ্রেশে মানের অনন্যতার জন্য জ্যামিতিক শর্ত প্রদান করেছে, তাত্ত্বিক ফাঁক পূরণ করেছে এবং আলেক্সান্দ্রভ জ্যামিতি কাঠামোর অধীনে নতুন বোঝাপড়া প্রদান করেছে।
१. তাত্ত্বিক অবদান: সমতল গ্রুপিং পার্সিস্টেন্স ডায়াগ্রামের ফ্রেশে মানের অনন্যতার জন্য যাচাইযোগ্য জ্যামিতিক শর্ত প্রদান করে २. সংগ্রহ তত্ত্ব: সীমিত নমুনা সংগ্রহ হার সহ সংগ্রহ ফলাফল স্থাপন করা হয়েছে ३. ব্যবহারিক পদ্ধতি: ছাঁটাই কৌশল ব্যবহারিক প্রয়োগের জন্য সমতল গ্রুপিং তৈরির একটি সম্ভাব্য উপায় প্রদান করে
१. শর্তের সীমাবদ্ধতা: সমতল গ্রুপিং শর্ত অপেক্ষাকৃত কঠোর, সমস্ত পার্সিস্টেন্স ডায়াগ্রাম সেটের জন্য উপযুক্ত নাও হতে পারে २. ছাঁটাইয়ের ক্ষতি: ছাঁটাই প্রক্রিয়া গুরুত্বপূর্ণ টপোলজিক্যাল তথ্য হারাতে পারে ३. প্যারামিটার নির্বাচন: ছাঁটাই থ্রেশহোল্ডের নির্বাচন পূর্ব জ্ঞান বা অনুমানমূলক পদ্ধতির প্রয়োজন
१. অভিযোজিত ছাঁটাই: পরিসংখ্যানগত আত্মবিশ্বাস ব্যবধানের উপর ভিত্তি করে অভিযোজিত ছাঁটাই পদ্ধতি বিকাশ করা, সংকেত সংরক্ষণ এবং সমতলতা নির্মাণের মধ্যে ভারসাম্য রাখা २. মধ্যমা গবেষণা: পার্সিস্টেন্স ডায়াগ্রামের ফ্রেশে মধ্যমা তত্ত্ব সম্প্রসারণ, স্থানের জ্যামিতিক বৈশিষ্ট্য অধ্যয়ন প্রয়োজন ३. সাধারণীকৃত c-ফ্রেশে মান: পার্সিস্টেন্স ডায়াগ্রাম স্থানে আরও সাধারণ c-ফ্রেশে মান তত্ত্ব গবেষণা
१. তাত্ত্বিক উদ্ভাবনী: পার্সিস্টেন্স ডায়াগ্রামের ফ্রেশে মানের অনন্যতা সমস্যার জন্য প্রথমবারের মতো সম্পূর্ণ জ্যামিতিক সমাধান প্রদান করা হয়েছে २. গাণিতিক কঠোরতা: প্রমাণ সম্পূর্ণ এবং কঠোর, ভেরিয়েন্স অভিব্যক্তি প্রাপ্তি বিস্তারিত, জ্যামিতিক অন্তর্দৃষ্টি স্পষ্ট ३. ব্যবহারিক মূল্য: ছাঁটাই পদ্ধতি বড় আকারের ডেটার পার্সিস্টেন্ট হোমোলজি বিশ্লেষণের জন্য তাত্ত্বিক সমর্থিত অনুমান অ্যালগরিদম প্রদান করে ४. আন্তঃশৃঙ্খলা একীকরণ: টপোলজিক্যাল ডেটা বিশ্লেষণ, মেট্রিক জ্যামিতি এবং পরিসংখ্যানের তাত্ত্বিক সরঞ্জাম সফলভাবে একত্রিত করা হয়েছে
१. প্রয়োগের পরিসীমা সীমাবদ্ধতা: সমতল গ্রুপিং শর্ত অপেক্ষাকৃত কঠোর, বাস্তব ডেটায় পূরণ করা কঠিন হতে পারে २. ছাঁটাই কৌশল সরলীকরণ: বর্তমান ছাঁটাই পদ্ধতি অপেক্ষাকৃত মোটা, আরও সূক্ষ্ম সংকেত সংরক্ষণ কৌশলের প্রয়োজন হতে পারে ३. গণনা জটিলতা: নথিতে সমতলতা যাচাইকরণ এবং ছাঁটাই প্যারামিটার নির্বাচনের গণনা জটিলতা বিস্তারিতভাবে বিশ্লেষণ করা হয়নি
१. তাত্ত্বিক প্রভাব: পার্সিস্টেন্ট হোমোলজি পরিসংখ্যান তত্ত্বের জন্য একটি গুরুত্বপূর্ণ ভিত্তি স্থাপন করে, সম্পর্কিত তাত্ত্বিক উন্নয়ন চালিত করার প্রত্যাশা করা হয় २. প্রয়োগের সম্ভাবনা: বড় আকারের টপোলজিক্যাল ডেটা বিশ্লেষণের জন্য তাত্ত্বিক গ্যারান্টি সহ পদ্ধতি প্রদান করে, ব্যাপক প্রয়োগ সম্ভাবনা রয়েছে ३. পদ্ধতিগত অবদান: জ্যামিতিক শর্ত এবং পরিসংখ্যানগত বৈশিষ্ট্য একত্রিত করার গবেষণা প্যারাডাইম অন্যান্য মেট্রিক স্থানে সাধারণীকরণ করা যায়
१. ম্যানিফোল্ড শিক্ষা: ম্যানিফোল্ড নমুনা ডেটার টপোলজিক্যাল বৈশিষ্ট্য নিষ্কাশন এবং বিশ্লেষণের জন্য উপযুক্ত २. সময়-সিরিজ টপোলজিক্যাল বিশ্লেষণ: সময়-পরিবর্তনশীল টপোলজিক্যাল কাঠামোর পরিসংখ্যানগত মডেলিংয়ের জন্য ব্যবহার করা যায় ३. বড় আকারের টপোলজিক্যাল গণনা: সীমিত গণনা সম্পদের পরিস্থিতিতে পার্সিস্টেন্ট হোমোলজি অনুমানের জন্য তাত্ত্বিক নির্দেশনা প্রদান করে
१. Turner, K., Mileyko, Y., Mukherjee, S., & Harer, J. (२०१४). Fréchet means for distributions of persistence diagrams. Discrete & Computational Geometry, ५२(१), ४४-७०.
२. Le Gouic, T., Paris, Q., Rigollet, P., & Stromme, A. J. (२०२२). Fast convergence of empirical barycenters in alexandrov spaces and the wasserstein space. Journal of the European Mathematical Society, २५(६), २२२९-२२५०.
३. Mileyko, Y., Mukherjee, S., & Harer, J. (२०११). Probability measures on the space of persistence diagrams. Inverse Problems, २७(१२), १२४००७.
४. Munch, E., Turner, K., Bendich, P., Mukherjee, S., Mattingly, J., & Harer, J. (२०१५). Probabilistic Fréchet means for time varying persistence diagrams. Electronic Journal of Statistics, ९(१), ११७३-१२०४.
টীকা: এই পেপারটি টপোলজিক্যাল ডেটা বিশ্লেষণ এবং মেট্রিক জ্যামিতির আন্তঃশৃঙ্খলা ক্ষেত্রে একটি গুরুত্বপূর্ণ তাত্ত্বিক অবদান, পার্সিস্টেন্ট হোমোলজির পরিসংখ্যানগত প্রয়োগের জন্য একটি দৃঢ় গাণিতিক ভিত্তি প্রদান করে। এর প্রস্তাবিত সমতল গ্রুপিং ধারণা এবং সংশ্লিষ্ট তাত্ত্বিক কাঠামো এই ক্ষেত্রে গভীর প্রভাব ফেলার প্রত্যাশা করা হয়।