Coordination services and protocols are critical components of distributed systems and are essential for providing consistency, fault tolerance, and scalability. However, due to the lack of standard benchmarking and evaluation tools for distributed coordination services, coordination service developers/researchers either use a NoSQL standard benchmark and omit evaluating consistency, distribution, and fault tolerance; or create their own ad-hoc microbenchmarks and skip comparability with other services. In this study, we analyze and compare the evaluation mechanisms for known and widely used consensus algorithms, distributed coordination services, and distributed applications built on top of these services. We identify the most important requirements of distributed coordination service benchmarking, such as the metrics and parameters for the evaluation of the performance, scalability, availability, and consistency of these systems. Finally, we discuss why the existing benchmarks fail to address the complex requirements of distributed coordination system evaluation.
- পেপার আইডি: 2403.09445
- শিরোনাম: How to Evaluate Distributed Coordination Systems? -- A Survey and Analysis
- লেখক: বেকির তুর্কান (আইবিএম গবেষণা), এলভিস রডরিগেজ (বাফেলো বিশ্ববিদ্যালয়), তেভফিক কোসার (বাফেলো বিশ্ববিদ্যালয়), আলেক্সি চারাপকো (নিউ হ্যাম্পশায়ার বিশ্ববিদ্যালয়), আইলিদানি আইলিজিয়াং (মাইক্রোসফট), মুরাত ডেমিরবাস (মঙ্গোডিবি)
- শ্রেণীবিভাগ: cs.DC (বিতরণকৃত কম্পিউটিং)
- প্রকাশনার সময়: arXiv প্রি-প্রিন্ট, সর্বশেষ আপডেট ২০২৫ সালের অক্টোবর ২৭ তারিখে
- পেপার লিঙ্ক: https://arxiv.org/abs/2403.09445
বিতরণকৃত সমন্বয় সেবা এবং প্রোটোকল বিতরণকৃত সিস্টেমের মূল উপাদান, যা সামঞ্জস্য, ত্রুটি সহনশীলতা এবং স্কেলেবিলিটি প্রদানের জন্য অপরিহার্য। তবে, মানসম্পন্ন বেঞ্চমার্কিং এবং মূল্যায়ন সরঞ্জামের অভাবের কারণে, বিতরণকৃত সমন্বয় সেবার বিকাশকারী এবং গবেষকরা হয় NoSQL মানসম্পন্ন বেঞ্চমার্ক ব্যবহার করেন কিন্তু সামঞ্জস্য, বিতরণ এবং ত্রুটি সহনশীলতা মূল্যায়ন উপেক্ষা করেন; অথবা তাদের নিজস্ব অস্থায়ী মাইক্রো-বেঞ্চমার্ক তৈরি করেন কিন্তু অন্যান্য সেবার সাথে তুলনা করতে পারেন না। এই গবেষণা পরিচিত এবং ব্যাপকভাবে ব্যবহৃত ঐক্যমত অ্যালগরিদম, বিতরণকৃত সমন্বয় সেবা এবং এই সেবাগুলির উপর ভিত্তি করে নির্মিত বিতরণকৃত অ্যাপ্লিকেশনগুলির মূল্যায়ন প্রক্রিয়াগুলি বিশ্লেষণ এবং তুলনা করে। লেখকরা বিতরণকৃত সমন্বয় সেবা বেঞ্চমার্কিংয়ের সবচেয়ে গুরুত্বপূর্ণ প্রয়োজনীয়তা চিহ্নিত করেছেন, যেমন কর্মক্ষমতা, স্কেলেবিলিটি, প্রাপ্যতা এবং সামঞ্জস্য মূল্যায়নের মেট্রিক্স এবং পরামিতি। অবশেষে, তারা আলোচনা করেছেন কেন বিদ্যমান বেঞ্চমার্কগুলি বিতরণকৃত সমন্বয় সিস্টেম মূল্যায়নের জটিল প্রয়োজনীয়তা পূরণ করতে পারে না।
বিতরণকৃত সমন্বয় সিস্টেম (ঐক্যমত অ্যালগরিদম, সমন্বয় সেবা এবং বিতরণকৃত অ্যাপ্লিকেশন সহ) মানসম্পন্ন মূল্যায়ন বেঞ্চমার্কের অভাব রয়েছে, যা নিম্নলিখিত ফলাফল দেয়:
- অসম্পূর্ণ মূল্যায়ন: বিকাশকারীরা হয় NoSQL বেঞ্চমার্ক (যেমন YCSB) ব্যবহার করেন কিন্তু সামঞ্জস্য, বিতরণ এবং ত্রুটি সহনশীলতা উপেক্ষা করেন
- দুর্বল তুলনীয়তা: প্রতিটি সিস্টেম কাস্টম মাইক্রো-বেঞ্চমার্ক ব্যবহার করে, বিভিন্ন মেট্রিক্স এবং কৌশল গ্রহণ করে, ন্যায্য তুলনা অসম্ভব করে তোলে
- মূল্যায়ন বিভাজন: কর্মক্ষমতা, স্কেলেবিলিটা, প্রাপ্যতা এবং সামঞ্জস্য সামগ্রিকভাবে মূল্যায়নের জন্য কোন একীভূত কাঠামো নেই
- ব্যবহারিক চাহিদা: ক্লাউড কম্পিউটিং এবং বিগ ডেটা অ্যাপ্লিকেশন (সার্চ ইঞ্জিন, সোশ্যাল নেটওয়ার্ক, ভিডিও স্ট্রিমিং, IoT) সবই বিতরণকৃত সমন্বয়ের উপর নির্ভর করে
- প্রযুক্তিগত বিবর্তন: Paxos থেকে Raft পর্যন্ত, এবং WPaxos, SwiftPaxos ইত্যাদি WAN-অপ্টিমাইজড ভেরিয়েন্টগুলি ক্রমাগত উদ্ভূত হচ্ছে
- ব্যাপক প্রয়োগ: Google Spanner, Apache Kafka, Twitter Manhattan ইত্যাদি গুরুত্বপূর্ণ সিস্টেম সবই সমন্বয় সেবার উপর নির্ভর করে
- মূল্যায়ন জটিলতা: বিতরণকৃত সমন্বয় সিস্টেমগুলি কর্মক্ষমতা, সামঞ্জস্য, ত্রুটি সহনশীলতা এবং ভৌগোলিক বিতরণ সহ একাধিক মাত্রা বিবেচনা করা প্রয়োজন
বিদ্যমান বেঞ্চমার্কিং সরঞ্জামগুলির অপর্যাপ্ততা:
- YCSB: একক ক্লায়েন্ট প্রক্রিয়া, ডেটা অ্যাক্সেস ওভারল্যাপ, অ্যাক্সেস স্থানীয়তা ইত্যাদি মূল পরামিতি সমর্থন করে না
- TPC-C: প্রধানত লেনদেন প্রক্রিয়াকরণের জন্য, সমন্বয় সেবার নির্দিষ্ট চাহিদার জন্য উপযুক্ত নয়
- Jepsen: সরঞ্জামের অভ্যন্তরীণ বিষয়ে গভীর বোঝাপড়া প্রয়োজন, ব্ল্যাকবক্স পরীক্ষা নয়, গ্রহণ করা কঠিন
- WAN সমর্থনের অভাব: বেশিরভাগ সরঞ্জাম ভৌগোলিক বিতরণকৃত পরিস্থিতির মূল্যায়ন সমর্থন করে না
এই পেপারটি ৩০+ বিতরণকৃত সমন্বয় সিস্টেমের মূল্যায়ন অনুশীলনের সিস্টেমেটিক সমীক্ষার মাধ্যমে লক্ষ্য রাখে:
- বর্তমান মূল্যায়ন অনুশীলনের সাধারণত্ব এবং পার্থক্য চিহ্নিত করা
- বিতরণকৃত সমন্বয় সিস্টেম মূল্যায়নের মূল প্রয়োজনীয়তা নির্ধারণ করা
- বিদ্যমান বেঞ্চমার্কিং সরঞ্জামগুলির ত্রুটিগুলি বিশ্লেষণ করা
- ভবিষ্যতে মানসম্পন্ন বেঞ্চমার্কিং সরঞ্জাম বিকাশের জন্য নির্দেশনা প্রদান করা
১. সিস্টেমেটিক সমীক্ষা: ৩০+ বিতরণকৃত সমন্বয় সিস্টেমের মূল্যায়ন অনুশীলন বিশ্লেষণ করেছে (১৩টি ঐক্যমত অ্যালগরিদম, ১০টি সমন্বয় সেবা, ৭টি বিতরণকৃত অ্যাপ্লিকেশন সহ)
२. টপোলজি শ্রেণীবিভাগ: ৬টি পরীক্ষামূলক টপোলজি কাঠামো চিহ্নিত এবং সংজ্ঞায়িত করেছে (সমতল, তারকা, বহু-তারকা, স্তরযুক্ত, গ্রিড, কেন্দ্রীয় লগ), সিস্টেম আর্কিটেকচার বোঝার জন্য কাঠামো প্রদান করে
३. মেট্রিক্স এবং পরামিতি ব্যবস্থা:
- ৪টি মূল মূল্যায়ন মেট্রিক্স সিস্টেমেটিকভাবে সংকলন করেছে: কর্মক্ষমতা, স্কেলেবিলিটা, প্রাপ্যতা, সামঞ্জস্য
- মূল কর্মভার পরামিতি চিহ্নিত করেছে: পড়া-লেখার অনুপাত, ডেটা অ্যাক্সেস ওভারল্যাপ, অ্যাক্সেস স্থানীয়তা, বস্তু সংখ্যা এবং আকার ইত্যাদি
४. বেঞ্চমার্কিং প্রয়োজনীয়তা: বিতরণকৃত সমন্বয় সিস্টেম বেঞ্চমার্কিংয়ের ৭টি মূল প্রয়োজনীয়তা প্রস্তাব করেছে:
- নমনীয়তা এবং জটিলতা
- WAN সিস্টেম সমর্থন
- বেঞ্চমার্ক স্কেলেবিলিটা
- সহজ গ্রহণযোগ্যতা
- ব্ল্যাকবক্স পরীক্ষার ক্ষমতা
- সামঞ্জস্য যাচাইকরণ ক্ষমতা
- ত্রুটি ইনজেকশন ক্ষমতা
५. ব্যবধান বিশ্লেষণ: ১০+ বিদ্যমান বেঞ্চমার্কিং সরঞ্জামগুলির (YCSB, TPC-C, Jepsen, Elle ইত্যাদি) ক্ষমতা এবং অপর্যাপ্ততা সিস্টেমেটিকভাবে বিশ্লেষণ করেছে
६. ব্যবহারিক নির্দেশনা: গবেষকদের এবং প্রকৌশলীদের জন্য বিতরণকৃত সমন্বয় সিস্টেম মূল্যায়নের সেরা অনুশীলন এবং সতর্কতা প্রদান করেছে
এই পেপারটি নতুন প্রযুক্তিগত পদ্ধতি প্রস্তাব করে না, বরং সিস্টেমেটিক সমীক্ষা এবং বিশ্লেষণ পরিচালনা করে, কাজগুলি অন্তর্ভুক্ত করে:
- ইনপুট: ৩০+ বিতরণকৃত সমন্বয় সিস্টেমের পেপার এবং মূল্যায়ন উপকরণ
- প্রক্রিয়াকরণ: মূল্যায়ন টপোলজি, মেট্রিক্স, পরামিতি, সরঞ্জাম ইত্যাদি তথ্য নিষ্কাশন করা
- আউটপুট: মূল্যায়ন অনুশীলনের সিস্টেমেটিক সারসংক্ষেপ, প্রয়োজনীয়তা বিশ্লেষণ এবং সরঞ্জাম ক্ষমতা তুলনা
লেখকরা প্রাসঙ্গিকতা, সময়োপযোগীতা এবং প্রভাব অনুযায়ী তিনটি শ্রেণীর সিস্টেম নির্বাচন করেছেন:
শ্রেণী I: ঐক্যমত অ্যালগরিদম (১৩টি)
- Paxos ভেরিয়েন্ট: Mencius, FPaxos, Multi-Paxos, Hybrid-Paxos, E-Paxos, M2 Paxos, WPaxos, SwiftPaxos, Omni-Paxos
- অন্যান্য প্রোটোকল: Raft, Bizur, ZAB, Hydra
শ্রেণী II: সমন্বয় সেবা (১০টি)
- ZooKeeper, Tango, Calvin, WanKeeper, ZooNet, Boki, FlexLog, SplitFT, Fabric, Narwhal
শ্রেণী III: বিতরণকৃত অ্যাপ্লিকেশন (৭টি)
- Spanner, DistributedLog, PNUTS, COPS, CockroachDB, OceanBase, ScalarDB
লেখকরা quorum তৈরির পদ্ধতি এবং অনুরোধ প্রক্রিয়াকরণের পদ্ধতি অনুযায়ী ৬টি টপোলজি সংজ্ঞায়িত করেছেন:
| টপোলজি ধরন | বৈশিষ্ট্য | প্রতিনিধি সিস্টেম |
|---|
| সমতল টপোলজি | একাধিক নেতা বা নেতাহীন, সমসাময়িক আপডেট অনুমতি | Mencius, E-Paxos |
| তারকা টপোলজি | একক নেতা প্রোটোকল | ZooKeeper, Raft, Hybrid-Paxos |
| বহু-তারকা টপোলজি | একাধিক quorum, প্রতিটি তারকা, নেতাদের মধ্যে সমতল যোগাযোগ | ZooNet, M2 Paxos, Spanner |
| স্তরযুক্ত টপোলজি | বহু-তারকা কিন্তু নেতাদের মধ্যে স্তরবিন্যাস | WanKeeper |
| গ্রিড টপোলজি | কর্মক্ষমতা অপ্টিমাইজ করতে গ্রিড quorum ব্যবহার | FPaxos, WPaxos |
| কেন্দ্রীয় লগ টপোলজি | সম্পাদন ক্রম রেকর্ড করতে ভাগ করা স্থায়ী লগ | Tango, Boki, Calvin |
প্রতিটি সিস্টেমের পেপার থেকে নিষ্কাশন করা হয়েছে:
- পরীক্ষামূলক সেটআপ: অঞ্চল সংখ্যা, সার্ভার সংখ্যা, ক্লায়েন্ট সংখ্যা, পরীক্ষা প্ল্যাটফর্ম, বেঞ্চমার্কিং সরঞ্জাম
- মূল্যায়ন মেট্রিক্স: থ্রুপুট, লেটেন্সি, স্কেলেবিলিটা, প্রাপ্যতা, সামঞ্জস্য
- কর্মভার পরামিতি: পড়া-লেখার অনুপাত, বস্তু সংখ্যা/আকার, ডেটা অ্যাক্সেস ওভারল্যাপ, অ্যাক্সেস স্থানীয়তা
লেখকরা ৩০টি সিস্টেমের পরীক্ষামূলক সেটআপ বিশ্লেষণ করেছেন, প্রধান অনুসন্ধান:
ভৌগোলিক বিতরণ:
- একক অঞ্চল স্থাপনা: বেশিরভাগ সিস্টেম (যেমন Raft, Multi-Paxos, ZooKeeper)
- বহু-অঞ্চল স্থাপনা: WAN-অপ্টিমাইজড সিস্টেম (যেমন WPaxos ৫ অঞ্চল ১৫ সার্ভার, SwiftPaxos ১৩ অঞ্চল)
- প্রকৃত ক্লাউড পরিবেশ: Amazon EC2, Google Compute Engine, Alibaba ECS
- নিয়ন্ত্রিত পরিবেশ: Emulab, DETER (নেটওয়ার্ক লেটেন্সি নিয়ন্ত্রণযোগ্য)
ক্লাস্টার আকার:
- ছোট স্কেল: ৩-১৩ সার্ভার (বেশিরভাগ ঐক্যমত অ্যালগরিদম)
- মধ্যম স্কেল: ১৫-১০০ সার্ভার (সমন্বয় সেবা)
- বড় স্কেল: OceanBase ১৫৫৭ সার্ভার, ৩৬০,০০০ ক্লায়েন্ট/সার্ভার পর্যন্ত পৌঁছায়
ক্লায়েন্ট কনফিগারেশন:
- একক ক্লায়েন্ট: Bizur, Omni-Paxos
- মাল্টি-থ্রেড ক্লায়েন্ট: Multi-Paxos (১-২০ থ্রেড)
- বিতরণকৃত ক্লায়েন্ট: E-Paxos (৫০ ক্লায়েন্ট), PNUTS (৩০০ ক্লায়েন্ট)
টেবিল ২ এর পরিসংখ্যান অনুযায়ী:
| মেট্রিক শ্রেণী | মূল্যায়ন সিস্টেম সংখ্যা | কভারেজ |
|---|
| কর্মক্ষমতা-থ্রুপুট | ২৮/৩০ | ৯৩% |
| কর্মক্ষমতা-লেটেন্সি | २७/३० | ९०% |
| স্কেলেবিলিটা-সার্ভার | १४/३० | ४७% |
| স্কেলেবিলিটা-ক্লায়েন্ট | ८/३० | २७% |
| প্রাপ্যতা-ত্রুটি | १४/३० | ४७% |
| প্রাপ্যতা-বিভাজন | ५/३० | १७% |
| সামঞ্জস্য | ८/३० | २७% |
মূল অনুসন্ধান:
- কর্মক্ষমতা মূল্যায়ন প্রায় সর্বজনীন, কিন্তু সামঞ্জস্য মূল্যায়ন গুরুতরভাবে অপর্যাপ্ত
- নেটওয়ার্ক বিভাজন পরীক্ষা নোড ব্যর্থতা পরীক্ষার চেয়ে অনেক কম
- স্কেলেবিলিটা মূল্যায়ন সাধারণত শুধুমাত্র সার্ভার সংখ্যার উপর ফোকাস করে, অঞ্চল সম্প্রসারণ উপেক্ষা করে
টেবিল ३ এর বিশ্লেষণ অনুযায়ী:
- ১০০% লেখা অপারেশন: Multi-Paxos, E-Paxos, Hybrid-Paxos (সংঘর্ষপূর্ণ কমান্ড ফোকাস)
- ০-१००% পরিবর্তন: ZooKeeper, WanKeeper (বিভিন্ন পরিস্থিতি প্রদর্শন)
- নির্দিষ্ট অনুপাত: COPS (५०% লেখা), PNUTS (१०% লেখা)
- অনির্দিষ্ট: Raft, FPaxos ইত্যাদি একাধিক সিস্টেম
সমস্যা: বিভিন্ন পড়া-লেখার অনুপাতে কর্মক্ষমতার পার্থক্য বিশাল, কিন্তু অনেক সিস্টেম শুধুমাত্র একক কনফিগারেশন পরীক্ষা করে
- १००% ওভারল্যাপ: Mencius, E-Paxos, Hybrid-Paxos (সবচেয়ে খারাপ পরিস্থিতি)
- ०-१००% পরিবর্তন: WanKeeper, Boki, FlexLog
- মূল্যায়ন করা হয়নি: বেশিরভাগ একক-নেতা সিস্টেম (কারণ কর্মক্ষমতায় প্রভাব ছোট)
মূল অন্তর্দৃষ্টি: বহু-নেতা সিস্টেম কর্মক্ষমতা অ্যাক্সেস ওভারল্যাপের উপর গুরুতরভাবে নির্ভর করে, কিন্তু মূল্যায়ন প্রায়ই উপেক্ষা করা হয়
- মূল্যায়ন সিস্টেম: M2 Paxos (०-१००%), WPaxos (७०-९०%), COPS (०-१००%)
- মূল্যায়ন করা হয়নি: বেশিরভাগ সিস্টেম
- গুরুত্ব: মালিকানা প্রক্রিয়া ব্যবহারকারী সিস্টেমে বিশাল প্রভাব
- নির্দিষ্ট সিস্টেম: Mencius (१६-१०२४), M2 Paxos (१-१०००), Omni-Paxos (५००-५०K)
- বেশিরভাগ অনির্দিষ্ট: সংঘর্ষের হার বোঝা সীমাবদ্ধ করে
- ছোট বস্তু: ६B-१KB (CPU-নিবিড় কর্মভার)
- বড় বস্তু: १KB-८KB (নেটওয়ার্ক-নিবিড় কর্মভার)
- পরিবর্তনশীল পরিসীমা: Mencius (६B-४KB), SplitFT (१२८B-८KB)
কর্মভার স্কেলেবিলিটা:
- Hybrid-Paxos, E-Paxos: সমসাময়িক ক্লায়েন্ট সংখ্যা বৃদ্ধি
- WPaxos: ক্লায়েন্ট রেট সীমাবদ্ধতা সামঞ্জস্য
- বেশিরভাগ সিস্টেম: স্যাচুরেশন পয়েন্ট পর্যন্ত পরীক্ষা
সিস্টেম স্কেলেবিলিটা:
- অনুভূমিক সম্প্রসারণ: ZooKeeper (३-१३ প্রতিলিপি), Calvin (४-१०० প্রতিলিপি)
- অঞ্চল সম্প্রসারণ: E-Paxos এবং Mencius (३-७ অঞ্চল)
- উল্লম্ব সম্প্রসারণ: M2 Paxos (CPU কর্মক্ষমতা পরিবর্তন)
সমস্যা: স্কেলেবিলিটা পরীক্ষার কোন একীভূত পদ্ধতি নেই, বিভিন্ন সিস্টেম তুলনা করা কঠিন
বর্তমান অনুশীলন:
- পরীক্ষা সরঞ্জাম: Bizur Serialla ব্যবহার করে, Multi-Paxos চেকসাম পরীক্ষা ব্যবহার করে
- Jepsen পরীক্ষা: ZooKeeper, CockroachDB (রৈখিক যাচাইকরণ)
- Elle পরীক্ষা: ScalarDB (কঠোর ক্রমিক যাচাইকরণ)
- স্টেলনেস পরিমাপ: ZooNet, PNUTS, BG (কিন্তু শক্তিশালী সামঞ্জস্য প্রমাণ করতে পারে না)
মূল সমস্যা:
- বেশিরভাগ সিস্টেম "শক্তিশালী সামঞ্জস্য" দাবি করে কিন্তু সংজ্ঞা অস্পষ্ট
- সিস্টেমেটিক সামঞ্জস্য যাচাইকরণ পদ্ধতির অভাব
- স্টেলনেস পরিমাপ রৈখিক বা ক্রমিক যাচাই করতে অপর্যাপ্ত
টেবিল ४ অনুযায়ী:
ব্যর্থতার ধরন:
- নোড ক্র্যাশ: সবচেয়ে সাধারণ (१४/३० সিস্টেম)
- নেটওয়ার্ক বিভাজন: কম সাধারণ (५/३० সিস্টেম)
- অন্যান্য ব্যর্থতা: ঘড়ি ড্রিফট, মেমরি দুর্নীতি ইত্যাদি প্রায় পরীক্ষা করা হয় না
ব্যর্থতার সংখ্যা:
- একক নোড ব্যর্থতা: বেশিরভাগ সিস্টেম
- বহু-নোড ব্যর্থতা: ZooKeeper (२ follower), Omni-Paxos (१-२ নোড)
পরীক্ষা পদ্ধতি:
- ব্যর্থতার সময় থ্রুপুট অবনতি পরিমাপ
- Spanner: সম্পূর্ণ অঞ্চল ক্র্যাশ কিন্তু Paxos গ্রুপ এখনও উপলব্ধ
- Hybrid-Paxos: প্রাপ্যতা উন্নতি পরীক্ষা করতে প্রতিলিপি সংখ্যা বৃদ্ধি
NoSQL ডাটাবেস বেঞ্চমার্ক:
- YCSB (२०१०): সবচেয়ে জনপ্রিয় NoSQL বেঞ্চমার্ক, কিন্তু বিতরণকৃত ক্লায়েন্ট এবং WAN পরিস্থিতি সমর্থন করে না
- YCSB+T (२०१४): লেনদেন সমর্থন যোগ করে, কিন্তু এখনও একক প্রক্রিয়া
- YCSB++ (२०११): বিতরণকৃত ক্লায়েন্ট সমর্থন করে, কিন্তু ZooKeeper সিঙ্ক্রোনাইজেশনের উপর নির্ভর করে, WAN এর জন্য উপযুক্ত নয়
অ্যাপ্লিকেশন-নির্দিষ্ট বেঞ্চমার্ক:
- BG (२०१३): সোশ্যাল নেটওয়ার্ক কর্মভার, কিন্তু সংঘর্ষ এড়াতে লক ব্যবহার করে
- TPC-C (१९९२): লেনদেন প্রক্রিয়াকরণ মান, কিন্তু সমন্বয় সেবার জন্য নয়
- HiBench (२०१०): Hadoop বেঞ্চমার্ক, সমন্বয় সিস্টেমের জন্য উপযুক্ত নয়
বিগ ডেটা বেঞ্চমার্ক:
- BigDataBench (२०१४): একাধিক বিগ ডেটা কর্মভার কভার করে
- কিন্তু সবই সমন্বয় সেবার নির্দিষ্ট চাহিদার জন্য উপযুক্ত নয় (সামঞ্জস্য, ত্রুটি সহনশীলতা, ভৌগোলিক বিতরণ)
Jepsen (२०१३-বর্তমান):
- শক্তিশালী সামঞ্জস্য পরীক্ষা কাঠামো
- রৈখিক লঙ্ঘন সনাক্ত করতে পারে
- কিন্তু সরঞ্জামের গভীর বোঝাপড়া প্রয়োজন, ব্ল্যাকবক্স পরীক্ষা নয়
Elle (२०२०):
- Jepsen এর উপর ভিত্তি করে, আরও দক্ষ বিচ্ছিন্নতা স্তর সনাক্তকরণ
- লেনদেন নির্ভরতা গ্রাফ তৈরি করে লঙ্ঘন চক্র চিহ্নিত করে
- এখনও কাস্টমাইজড কর্মভার প্রয়োজন
অন্যান্য পরীক্ষা সরঞ্জাম:
- Serialla: Bizur দ্বারা ব্যবহৃত কঠোর ক্রমিক যাচাইকরণ
- UPB (२०१३): প্রাপ্যতা বেঞ্চমার্ক, কিন্তু YCSB এর উপর ভিত্তি করে
ক্লাউড সেবা মূল্যায়ন:
- স্থিতিস্থাপকতা মূল্যায়ন, কম্পিউটিং ক্ষমতা, খরচ-কার্যকারিতা বিশ্লেষণ
- কিন্তু সমন্বয় সেবার জন্য নয়
ফাইল সিস্টেম এবং ডেটা গুদাম:
- বিতরণকৃত ফাইল সিস্টেম বেঞ্চমার্কিং
- ডেটা গুদাম প্রশ্ন কর্মক্ষমতা মূল্যায়ন
- সমন্বয় সিস্টেমের চাহিদা থেকে আলাদা
সমন্বয় সেবা সংক্ষিপ্ত:
- অ্যালগরিদম তুলনা (Paxos ভেরিয়েন্ট)
- সেবা বৈশিষ্ট্য বিশ্লেষণ
- এই পেপারের অনন্যতা: মূল্যায়ন অনুশীলন এবং বেঞ্চমার্কিং চাহিদার প্রথম সিস্টেমেটিক বিশ্লেষণ
१. মূল্যায়ন অনুশীলন বিভাজন: ३० সিস্টেমের মধ্যে, শুধুমাত্র ७টি মানসম্পন্ন বেঞ্চমার্ক ব্যবহার করে (YCSB, TPC-C, Jepsen), বেশিরভাগ কাস্টম মাইক্রো-বেঞ্চমার্ক ব্যবহার করে
२. মেট্রিক কভারেজ অসামঞ্জস্যপূর্ণ:
- কর্মক্ষমতা মূল্যায়ন সর্বজনীন (९३% সিস্টেম)
- সামঞ্জস্য মূল্যায়ন অপর্যাপ্ত (२७% সিস্টেম)
- নেটওয়ার্ক বিভাজন পরীক্ষা বিরল (१७% সিস্টেম)
३. পরামিতি ব্যবহার অসামঞ্জস্যপূর্ণ:
- মূল পরামিতি (অ্যাক্সেস স্থানীয়তা, ডেটা অ্যাক্সেস ওভারল্যাপ) প্রায়ই উপেক্ষা করা হয়
- পরামিতি কনফিগারেশনের কোন মানসম্পন্ন
- বিভিন্ন সিস্টেম ন্যায্য তুলনা করা কঠিন
४. বিদ্যমান বেঞ্চমার্ক অপর্যাপ্ত:
- YCSB: বিতরণকৃত ক্লায়েন্ট, WAN পরিস্থিতি, অ্যাক্সেস স্থানীয়তা সমর্থন করে না
- TPC-C: সমন্বয় সেবার জন্য নয়
- Jepsen: ব্ল্যাকবক্স নয়, গ্রহণ করা কঠিন
- কোন সরঞ্জাম সব চাহিদা পূরণ করে না
५. ७টি বেঞ্চমার্কিং চাহিদা:
- নমনীয়তা এবং জটিলতা (বহু-মাত্রা পরামিতি টিউনিং সমর্থন)
- WAN সিস্টেম সমর্থন (ভৌগোলিক বিতরণ, অসমান লেটেন্সি)
- স্কেলেবিলিটা (বিতরণকৃত লোড জেনারেশন)
- সহজ গ্রহণযোগ্যতা (ব্ল্যাকবক্স পরীক্ষা, ভাষা-স্বাধীন)
- কর্মক্ষমতা বেঞ্চমার্ক (থ্রুপুট, লেটেন্সি, টেইল লেটেন্সি)
- সামঞ্জস্য যাচাইকরণ (রৈখিক, ক্রমিক)
- ত্রুটি ইনজেকশন (ক্র্যাশ, বিভাজন, ঘড়ি ড্রিফট)
१. নমুনা কভারেজ: যদিও ३० সিস্টেম কভার করে, কিছু উদীয়মান সিস্টেম বা নির্দিষ্ট ডোমেনের সমন্বয় সেবা মিস হতে পারে
२. সময়োপযোগীতা: বিতরণকৃত সিস্টেম দ্রুত বিকশিত হয়, নতুন মূল্যায়ন অনুশীলন এবং সরঞ্জাম ক্রমাগত উদ্ভূত হয়
३. গভীর বিশ্লেষণ: প্রতিটি সিস্টেমের মূল্যায়ন অনুশীলন বিশ্লেষণ প্রকাশিত পেপারের উপর ভিত্তি করে, সব বাস্তবায়ন বিবরণ পেতে পারে না
४. বেঞ্চমার্ক সরঞ্জাম বাস্তবায়ন: এই পেপার চাহিদা চিহ্নিত করে কিন্তু সম্পূর্ণ বেঞ্চমার্কিং সরঞ্জাম বাস্তবায়ন করে না
५. সামঞ্জস্য মডেল: বিভিন্ন সিস্টেম দাবি করা "শক্তিশালী সামঞ্জস্য" সংজ্ঞা আলাদা, একীভূত মূল্যায়ন মান কঠিন
१. মানসম্পন্ন বেঞ্চমার্ক সরঞ্জাম বিকাশ:
- বিতরণকৃত ক্লায়েন্ট এবং WAN পরিস্থিতি সমর্থন
- নমনীয় পরামিতি কনফিগারেশন প্রদান
- সামঞ্জস্য যাচাইকরণ ক্ষমতা একীভূত
- একাধিক ত্রুটি ইনজেকশন সমর্থন
२. মূল্যায়ন মান প্রতিষ্ঠা:
- ন্যূনতম প্রয়োজনীয় মূল্যায়ন মেট্রিক সেট সংজ্ঞায়িত
- কর্মভার পরামিতি কনফিগারেশন মানসম্পন্ন
- সামঞ্জস্য যাচাইকরণ প্রোটোকল প্রণয়ন
३. সমীক্ষা পরিসীমা সম্প্রসারণ:
- আরও উদীয়মান সমন্বয় প্রোটোকল অন্তর্ভুক্ত (যেমন DAG-ভিত্তিক ঐক্যমত)
- ব্লকচেইন ঐক্যমত অ্যালগরিদমের মূল্যায়ন অনুশীলন বিশ্লেষণ
- প্রান্ত কম্পিউটিং পরিস্থিতির সমন্বয় চাহিদা গবেষণা
४. অভিজ্ঞতামূলক গবেষণা:
- মানসম্পন্ন বেঞ্চমার্ক ব্যবহার করে বিদ্যমান সিস্টেম পুনরায় মূল্যায়ন
- বিভিন্ন পরামিতির কর্মক্ষমতায় প্রভাব পরিমাণ করা
- দাবি করা সামঞ্জস্য গ্যারান্টি যাচাই
५. স্বয়ংক্রিয় পরীক্ষা:
- স্বয়ংক্রিয় সামঞ্জস্য যাচাইকরণ সরঞ্জাম বিকাশ
- ক্রমাগত একীকরণ/ক্রমাগত স্থাপনা (CI/CD) একীভূত
- রিগ্রেশন পরীক্ষা সমর্থন
- বিস্তৃতা: ३० সিস্টেম কভার করে, २० বছরের গবেষণা ইতিহাস জুড়ে (Paxos १९९८ - সর্বশেষ সিস্টেম २०२४)
- গভীরতা: পরীক্ষামূলক সেটআপ, টপোলজি, মেট্রিক্স, পরামিতি বিস্তারিত বিশ্লেষণ
- স্পষ্ট শ্রেণীবিভাগ: তিন-স্তরের শ্রেণীবিভাগ (অ্যালগরিদম-সেবা-অ্যাপ্লিকেশন) + ছয় ধরনের টপোলজি
- নির্দেশনা তাৎপর্য: বিকাশকারীদের মূল্যায়ন সেরা অনুশীলন প্রদান
- চাহিদা স্পষ্ট: ७টি বেঞ্চমার্কিং চাহিদা কার্যকর
- সমস্যা-ভিত্তিক: বিদ্যমান সরঞ্জামের নির্দিষ্ট অপর্যাপ্ততা নির্দেশ করে
- ३টি ব্যাপক টেবিল: টেবিল १ (পরীক্ষামূলক সেটআপ), টেবিল २ (মেট্রিক্স ব্যবহার), টেবিল ३ (কর্মভার পরামিতি)
- পরিমাণগত বিশ্লেষণ: মেট্রিক্স কভারেজ হার, পরামিতি ব্যবহার ফ্রিকোয়েন্সি
- ভিজ্যুয়ালাইজেশন: ६ ধরনের টপোলজির স্পষ্ট চিত্র
- নির্দিষ্ট সিস্টেম বা বেঞ্চমার্ক সরঞ্জামের পক্ষপাত নেই
- প্রতিটি সরঞ্জামের সুবিধা এবং অসুবিধা ন্যায্যভাবে বিশ্লেষণ করে
- তথ্য-ভিত্তিক মূল্যায়ন, বিষয়গত রায় নয়
- ८५টি রেফারেন্স উদ্ধৃত করে
- পদ্ধতিবিদ্যা স্পষ্ট (নির্বাচন মানদণ্ড, বিশ্লেষণ কাঠামো)
- পর্যাপ্ত ডেটা দ্বারা সমর্থিত উপসংহার
- বিভিন্ন মূল্যায়ন পদ্ধতির কর্মক্ষমতা পার্থক্য ডেটা প্রদান করে না
- পরামিতি পছন্দ ফলাফলের প্রভাব পরিমাণ করা হয়নি
- পরিসংখ্যানগত বিশ্লেষণ অনুপস্থিত (যেমন সম্পর্ক, তাৎপর্য পরীক্ষা)
- চাহিদা পূরণকারী বেঞ্চমার্ক সরঞ্জাম বাস্তবায়ন করেনি
- প্রস্তাবিত চাহিদা সম্ভাব্যতা পরীক্ষা দ্বারা যাচাই করা হয়নি
- প্রোটোটাইপ সিস্টেমের মূল্যায়ন অনুপস্থিত
- বিভিন্ন সামঞ্জস্য মডেলের পার্থক্য আলোচনা যথেষ্ট গভীর নয়
- নির্দিষ্ট সামঞ্জস্য যাচাইকরণ পদ্ধতি প্রদান করা হয়নি
- সামঞ্জস্য পরীক্ষার জটিলতা বিশ্লেষণ অনুপস্থিত
- WAN গুরুত্ব জোর দেওয়া হয়েছে কিন্তু নির্দিষ্ট বিশ্লেষণ অপর্যাপ্ত
- বিভিন্ন ভৌগোলিক বিতরণ প্যাটার্নের প্রভাব বিস্তারিত আলোচনা করা হয়নি
- ক্রস-ক্লাউড, ক্রস-মহাদেশ স্থাপনার বিশেষ চ্যালেঞ্জ অনুপস্থিত
- ব্লকচেইন ঐক্যমত অ্যালগরিদম মূল্যায়ন অনুশীলন অন্তর্ভুক্ত নয়
- প্রান্ত কম্পিউটিং পরিস্থিতির সমন্বয় চাহিদা আলোচনা করা হয়নি
- মেশিন লার্নিং সিস্টেমে সমন্বয় মূল্যায়ন অন্তর্ভুক্ত নয়
- বিস্তারিত পরীক্ষা পুনরুৎপাদন গাইড প্রদান করা হয়নি
- ওপেন-সোর্স ডেটাসেট বা মূল্যায়ন স্ক্রিপ্ট অনুপস্থিত
- মূল্যায়ন পুনরুৎপাদনযোগ্যতা নিশ্চিত করার উপায় আলোচনা করা হয়নি
- শূন্যস্থান পূরণ: বিতরণকৃত সমন্বয় সিস্টেম মূল্যায়ন অনুশীলনের প্রথম সিস্টেমেটিক সমীক্ষা
- তাত্ত্বিক মূল্য: মূল্যায়ন কাঠামো এবং চাহিদা ব্যবস্থা প্রতিষ্ঠা
- উদ্ধৃতি সম্ভাবনা: এই ক্ষেত্রে মূল্যায়ন পদ্ধতির রেফারেন্স সাহিত্য হতে পারে
- প্রকৌশল নির্দেশনা: বিকাশকারীদের উপযুক্ত মূল্যায়ন পদ্ধতি নির্বাচনে সহায়তা
- বেঞ্চমার্ক বিকাশ: নতুন বেঞ্চমার্ক সরঞ্জামের জন্য চাহিদা স্পেসিফিকেশন
- মানসম্পন্নকরণ প্রচার: মূল্যায়ন মান প্রতিষ্ঠা প্রচার করতে পারে
- বাস্তবায়ন অনুপস্থিত: সরাসরি ব্যবহারযোগ্য সরঞ্জাম প্রদান করা হয়নি
- যাচাইকরণ অপর্যাপ্ত: চাহিদার সম্ভাব্যতা অভিজ্ঞতামূলক যাচাইকরণ প্রয়োজন
- আপডেট প্রয়োজন: দ্রুত বিকশিত ক্ষেত্রে ক্রমাগত আপডেট প্রয়োজন
- সরাসরি প্রযোজ্য: বিতরণকৃত সমন্বয় সিস্টেমের গবেষকদের এবং প্রকৌশলীদের
- পরোক্ষ প্রযোজ্য: বিতরণকৃত ডাটাবেস, ব্লকচেইন, ক্লাউড কম্পিউটিং সিস্টেম বিকাশকারী
- শিক্ষা মূল্য: বিতরণকৃত সিস্টেম কোর্সের রেফারেন্স উপকরণ হিসাবে ব্যবহার করা যায়
- নতুন প্রোটোকল বিকাশ: মূল্যায়ন পরিকল্পনা ডিজাইনের সময় চাহিদা চেকলিস্ট রেফার করা
- সিস্টেম তুলনা: উপযুক্ত মেট্রিক্স এবং পরামিতি নির্বাচন করে ন্যায্য তুলনা পরিচালনা
- পেপার লেখা: মানসম্পন্ন মূল্যায়ন অনুশীলন উদ্ধৃত করে বিশ্বাসযোগ্যতা বৃদ্ধি
- সিস্টেম নির্বাচন: বিভিন্ন সিস্টেমের মূল্যায়ন ফলাফল এবং সীমাবদ্ধতা বোঝা
- কর্মক্ষমতা টিউনিং: কর্মক্ষমতা প্রভাবিত করে এমন মূল পরামিতি চিহ্নিত করা
- ব্যর্থতা পরীক্ষা: ব্যাপক প্রাপ্যতা পরীক্ষা পরিকল্পনা ডিজাইন
- কোর্স শিক্ষণ: বিতরণকৃত সিস্টেম মূল্যায়ন পদ্ধতিবিদ্যা পরিচয় করান
- প্রকল্প অনুশীলন: শিক্ষার্থীদের পরীক্ষা এবং মূল্যায়ন পরিকল্পনা ডিজাইনে নির্দেশনা
- সাহিত্য পর্যালোচনা: এই ক্ষেত্রের গবেষণা অবস্থা বোঝা
- বেঞ্চমার্ক বিকাশ: চাহিদা স্পেসিফিকেশন ডকুমেন্ট হিসাবে
- শিল্প মান: মূল্যায়ন মান প্রণয়ন প্রচার
- সম্মতি পরীক্ষা: সমন্বয় সেবার সম্মতি পরীক্ষা ডিজাইন
१. Lamport, L. (१९९८). The part-time parliament. ACM TOCS - Paxos মূল পেপার
२. Ongaro, D. & Ousterhout, J. (२०१४). In search of an understandable consensus algorithm. USENIX ATC - Raft অ্যালগরিদম
३. Hunt, P. et al. (२०१०). ZooKeeper: Wait-free coordination for internet-scale systems. USENIX ATC
४. Balakrishnan, M. et al. (२०१३). Tango: Distributed data structures over a shared log. SOSP
५. Cooper, B.F. et al. (२०१०). Benchmarking cloud serving systems with YCSB. SoCC
६. Kingsbury, K. (२०२४). Jepsen tests - সামঞ্জস্য পরীক্ষা কাঠামো
७. Kingsbury, K. & Alvaro, P. (२०२०). Elle: Inferring Isolation Anomalies from Experimental Observations
८. Ailijiang, A. et al. (२०१७). Multileader WAN Paxos: Ruling the archipelago with fast consensus - WPaxos
९. Mao, Y. et al. (२००८). Mencius: Building efficient replicated state machines for WANs. OSDI
१०. Corbett, J.C. et al. (२०१३). Spanner: Google's globally distributed database. ACM TOCS
সারসংক্ষেপ: এই পেপারটি বিতরণকৃত সমন্বয় সিস্টেম মূল্যায়ন ক্ষেত্রের একটি গুরুত্বপূর্ণ সংক্ষিপ্ত কাজ, যা বর্তমান মূল্যায়ন অনুশীলনের বিভাজন সমস্যা সিস্টেমেটিকভাবে প্রকাশ করে এবং মানসম্পন্ন বেঞ্চমার্কিং চাহিদা প্রস্তাব করে। যদিও প্রকৃত সরঞ্জাম বাস্তবায়ন অনুপস্থিত, এটি ভবিষ্যত গবেষণা এবং প্রকৌশল অনুশীলনের জন্য স্পষ্ট দিকনির্দেশনা প্রদান করে। বিতরণকৃত সিস্টেম গবেষকদের এবং প্রকৌশলীদের জন্য, এটি এই ক্ষেত্রের মূল্যায়ন পদ্ধতিবিদ্যা বোঝার জন্য একটি অপরিহার্য সাহিত্য।