Fast Trigonometric Functions using the RLIBM Approach
Park, Nagarakatte
This paper describes our experience developing polynomial approximations for trigonometric functions that produce correctly rounded results for multiple representations and rounding modes using the RLIBM approach. A key challenge with trigonometric functions concerns range reduction with "pi", which reduces a given input in the domain of a 32-bit float to a small domain. Any rounding error in the value of "pi" is amplified during range reduction, which can result in wrong results. We describe our experience implementing fast range reduction techniques that maintain a large number of bits of "pi" both with floating-point and integer computations. The resulting implementations for trigonometric functions are fast and produce correctly rounded results for all inputs for multiple representations up to 32-bits with a single implementation.
এই পেপারটি RLIBM পদ্ধতি ব্যবহার করে ত্রিকোণমিতিক ফাংশন বহুপদী অনুমান বিকাশের অভিজ্ঞতা বর্ণনা করে, যা বিভিন্ন প্রতিনিধিত্ব এবং রাউন্ডিং মোডের জন্য সঠিকভাবে রাউন্ড করা ফলাফল তৈরি করতে পারে। ত্রিকোণমিতিক ফাংশনের মূল চ্যালেঞ্জ হল π জড়িত পরিসীমা হ্রাস, যা 32-বিট ফ্লোটিং পয়েন্ট ডোমেনে ইনপুটকে ছোট ডোমেনে হ্রাস করে। π মানের যেকোনো রাউন্ডিং ত্রুটি পরিসীমা হ্রাস প্রক্রিয়ায় প্রসারিত হয়, যা ভুল ফলাফলের দিকে পরিচালিত করতে পারে। লেখকরা দ্রুত পরিসীমা হ্রাস কৌশল বাস্তবায়নের অভিজ্ঞতা বর্ণনা করেন, যা ফ্লোটিং পয়েন্ট এবং পূর্ণসংখ্যা গণনা উভয়েই π এর বিশাল সংখ্যক বিট বজায় রাখে। চূড়ান্ত ত্রিকোণমিতিক ফাংশন বাস্তবায়ন দ্রুত এবং সমস্ত ইনপুটের জন্য সঠিকভাবে রাউন্ড করা ফলাফল উৎপাদন করে, 32-বিট পর্যন্ত বিভিন্ন প্রতিনিধিত্ব সমর্থন করে এবং শুধুমাত্র একটি একক বাস্তবায়ন প্রয়োজন।
সঠিক রাউন্ডিং এর চ্যালেঞ্জ: বৈজ্ঞানিক গণনা গণিত লাইব্রেরি দ্বারা প্রদত্ত মৌলিক ফাংশন ব্যাপকভাবে ব্যবহার করে, কিন্তু সমস্ত ইনপুটের জন্য সঠিকভাবে রাউন্ড করা ফলাফল উৎপাদন অত্যন্ত কঠিন ("টেবিলমেকারের দ্বিধা"), এবং প্রধান গণিত লাইব্রেরি সমস্ত ইনপুটের জন্য সঠিক ফলাফল উৎপাদন করতে পারে না।
পোর্টেবিলিটি এবং পুনরুৎপাদনযোগ্যতা সমস্যা: সঠিক রাউন্ডিং এর অভাব গণিত লাইব্রেরি অ্যাপ্লিকেশনগুলিকে বিভিন্ন মেশিনে সম্পূর্ণ ভিন্ন ফলাফল উৎপাদন করতে দেয়, যা পোর্টেবিলিটি এবং পুনরুৎপাদনযোগ্যতাকে প্রভাবিত করে।
বিভিন্ন প্রতিনিধিত্ব ফর্ম্যাটের প্রয়োজনীয়তা: কাস্টম ফর্ম্যাট (যেমন bfloat16, tensorfloat32, FP8) বৃদ্ধির সাথে, একটি রেফারেন্স লাইব্রেরির প্রয়োজন যা বিভিন্ন প্রতিনিধিত্ব এবং রাউন্ডিং মোডের জন্য সঠিক ফলাফল প্রদান করতে পারে।
মিনিম্যাক্স বহুপদী অনুমান: ঐতিহ্যবাহী পদ্ধতি সমস্ত ইনপুটের সর্বাধিক ত্রুটি কমিয়ে আনে এমন বহুপদী অনুমান তৈরি করে, কিন্তু যখন প্রকৃত মূল্যের আউটপুট রাউন্ডিং সীমানার খুব কাছাকাছি থাকে, স্বাধীনতার ডিগ্রি উল্লেখযোগ্যভাবে হ্রাস পায়।
কর্মক্ষমতা এবং সঠিকতা ট্রেড-অফ: বিদ্যমান লাইব্রেরি কর্মক্ষমতা (যেমন Payne-Hanek বাস্তবায়ন) বা সঠিকতা (যেমন GCC এর libm) এর ক্ষেত্রে আপস করে।
দক্ষ পরিসীমা হ্রাস কৌশল: ফ্লোটিং পয়েন্ট এবং পূর্ণসংখ্যা গণনা একত্রিত করে একটি দক্ষ পরিসীমা হ্রাস অ্যালগরিদম বিকাশ করা হয়েছে, যা সঠিক ফলাফল উৎপাদনের জন্য π এর পর্যাপ্ত বিট বজায় রাখতে পারে।
বহু-প্রতিনিধিত্ব একক বাস্তবায়ন: একটি একক বহুপদী অনুমান বাস্তবায়ন করা হয়েছে, যা 10-বিট থেকে 32-বিট এর বিভিন্ন প্রতিনিধিত্ব এবং সমস্ত মান রাউন্ডিং মোডের জন্য সঠিকভাবে রাউন্ড করা ফলাফল উৎপাদন করতে পারে।
কর্মক্ষমতা অপ্টিমাইজেশন: পূর্ণসংখ্যা-ভিত্তিক পরিসীমা হ্রাস ফ্লোটিং পয়েন্ট কৌশলের তুলনায় 19% কর্মক্ষমতা উন্নতি প্রদান করে, সামগ্রিক প্রধান লাইব্রেরির চেয়ে দ্রুত বা সমতুল্য কর্মক্ষমতা।
সম্পূর্ণ ত্রিকোণমিতিক ফাংশন লাইব্রেরি: sin, cos, tan ফাংশনের জন্য দ্রুত এবং সঠিক বাস্তবায়ন প্রদান করা হয়েছে।
RLIBM পদ্ধতির মূল অন্তর্দৃষ্টি হল সঠিকভাবে রাউন্ড করা ফলাফল সরাসরি অনুমান করা, ফাংশনের প্রকৃত মূল্যের পরিবর্তে। প্রদত্ত ইনপুটের জন্য সঠিকভাবে রাউন্ড করা ফলাফলের জন্য, একটি প্রকৃত মূল্য ব্যবধান রয়েছে, যার মধ্যে যেকোনো মূল্য সঠিক ফলাফলে রাউন্ড করবে। এটি মিনিম্যাক্স পদ্ধতির চেয়ে বৃহত্তর স্বাধীনতা প্রদান করে (সমস্ত ইনপুটের জন্য 1 ULP)।
বিভিন্ন প্রতিনিধিত্ব সমর্থন করার জন্য, RLIBM প্রকল্প (n+2)-বিট প্রতিনিধিত্বের বহুপদী অনুমান তৈরি করার প্রস্তাব দেয়, round-to-odd রাউন্ডিং মোড ব্যবহার করে। এই পদ্ধতির সুবিধা হল:
round-to-odd ফলাফল লক্ষ্য প্রতিনিধিত্বে সরাসরি রাউন্ড করার জন্য প্রয়োজনীয় সমস্ত তথ্য সংরক্ষণ করে
পরবর্তী রাউন্ডিং নিম্ন বিট-প্রস্থ প্রতিনিধিত্বে সঠিক ফলাফল উৎপাদন করতে পারে
এই পেপারটি সংখ্যাসূচক বিশ্লেষণ, ফ্লোটিং পয়েন্ট গণনা এবং সঠিক রাউন্ডিং ক্ষেত্রের গুরুত্বপূর্ণ সাহিত্য উদ্ধৃত করে, যার মধ্যে রয়েছে:
Muller এর মৌলিক ফাংশন রেফারেন্স বই
MPFR উচ্চ-নির্ভুলতা লাইব্রেরি
Payne-Hanek পরিসীমা হ্রাস অ্যালগরিদম
IEEE-754 ফ্লোটিং পয়েন্ট মান সম্পর্কিত গবেষণা
এই পেপারটি সংখ্যাসূচক গণনা ক্ষেত্রে গুরুত্বপূর্ণ অবদান রেখেছে, তত্ত্ব পদ্ধতিকে ব্যবহারিক উচ্চ-কর্মক্ষমতা বাস্তবায়নে সফলভাবে রূপান্তরিত করেছে, এবং বৈজ্ঞানিক গণনায় সঠিক রাউন্ডিং সমস্যার জন্য কার্যকর সমাধান প্রদান করেছে।