Readability and Understandability of Snippets Recommended by General-purpose Web Search Engines: a Comparative Study
Dantas, Maia
Developers often search for reusable code snippets on general-purpose web search engines like Google, Yahoo! or Microsoft Bing. But some of these code snippets may have poor quality in terms of readability or understandability. In this paper, we propose an empirical analysis to analyze the readability and understandability score from snippets extracted from the web using three independent variables: ranking, general-purpose web search engine, and recommended site. We collected the top-5 recommended sites and their respective code snippet recommendations using Google, Yahoo!, and Bing for 9,480 queries, and evaluate their readability and understandability scores. We found that some recommended sites have significantly better readability and understandability scores than others. The better-ranked code snippet is not necessarily more readable or understandable than a lower-ranked code snippet for all general-purpose web search engines. Moreover, considering the readability score, Google has better-ranked code snippets compared to Yahoo! or Microsoft Bing
academic
সাধারণ-উদ্দেশ্যমূলক ওয়েব সার্চ ইঞ্জিন দ্বারা সুপারিশকৃত স্নিপেটগুলির পাঠযোগ্যতা এবং বোধগম্যতা: একটি তুলনামূলক অধ্যয়ন
ডেভেলপাররা প্রায়শই Google, Yahoo! বা Microsoft Bing-এর মতো সাধারণ সার্চ ইঞ্জিনে পুনর্ব্যবহারযোগ্য কোড স্নিপেট খোঁজেন। তবে এই কোড স্নিপেটগুলি পাঠযোগ্যতা বা বোধগম্যতার দিক থেকে নিম্নমানের হতে পারে। এই পেপারটি একটি অভিজ্ঞতামূলক বিশ্লেষণ উপস্থাপন করে যা তিনটি স্বাধীন চলক (র্যাঙ্কিং, সাধারণ সার্চ ইঞ্জিন এবং সুপারিশকৃত ওয়েবসাইট) ব্যবহার করে ওয়েব থেকে আহরিত কোড স্নিপেটের পাঠযোগ্যতা এবং বোধগম্যতা স্কোর বিশ্লেষণ করে। গবেষণা Google, Yahoo! এবং Bing থেকে 9,480টি প্রশ্নের শীর্ষ 5টি সুপারিশকৃত ওয়েবসাইট এবং তাদের সংশ্লিষ্ট কোড স্নিপেট সুপারিশ সংগ্রহ করেছে এবং তাদের পাঠযোগ্যতা এবং বোধগম্যতা স্কোর মূল্যায়ন করেছে। গবেষণা দেখায় যে নির্দিষ্ট সুপারিশকৃত ওয়েবসাইটগুলি পাঠযোগ্যতা এবং বোধগম্যতা স্কোরের ক্ষেত্রে অন্যদের চেয়ে উল্লেখযোগ্যভাবে ভাল। উচ্চতর র্যাঙ্কিং সহ কোড স্নিপেটগুলি সমস্ত সাধারণ সার্চ ইঞ্জিনে অগত্যা নিম্ন র্যাঙ্কিং সহ স্নিপেটগুলির চেয়ে বেশি পাঠযোগ্য বা বোধগম্য নয়। অধিকন্তু, পাঠযোগ্যতা স্কোরের ক্ষেত্রে, Google Yahoo! বা Microsoft Bing-এর চেয়ে আরও ভাল কোড স্নিপেট র্যাঙ্কিং করে।
মূল সমস্যা: সাধারণ সার্চ ইঞ্জিন দ্বারা সুপারিশকৃত কোড স্নিপেটগুলি পাঠযোগ্যতা এবং বোধগম্যতার ক্ষেত্রে গুণমানের পার্থক্য প্রদর্শন করে, এবং উচ্চতর র্যাঙ্কিং সহ কোড স্নিপেটগুলি অগত্যা উচ্চতর মানের নয়
বাস্তব চাহিদা: ডেভেলপাররা ব্যাপকভাবে কোড উদাহরণ খুঁজতে সাধারণ সার্চ ইঞ্জিন ব্যবহার করে, তবে এই কোড স্নিপেটগুলির গুণমানের সিস্টেমেটিক মূল্যায়নের অভাব রয়েছে
সার্চ ইঞ্জিনের সীমাবদ্ধতা: Google-এর 200-এরও বেশি র্যাঙ্কিং ফ্যাক্টর থাকলেও, উচ্চতর র্যাঙ্কিং সহ পৃষ্ঠাগুলি নিম্নমানের কোড উদাহরণ অন্তর্ভুক্ত করতে পারে
কোড স্নিপেট পুনর্ব্যবহার প্রোগ্রামিং কাজের সময় হ্রাস করতে এবং উন্নয়ন প্রক্রিয়া ত্বরান্বিত করতে পারে
Google সার্চ ইঞ্জিন বাজারের 90% এরও বেশি দখল করে, তবে অন্যান্য সার্চ ইঞ্জিনের কোড গুণমান র্যাঙ্কিং পরিস্থিতি অজানা
পাঠযোগ্যতা এবং বোধগম্যতার মধ্যে পারস্পরিক সম্পর্ক বোঝার প্রয়োজন: পাঠযোগ্যতা সিনট্যাক্স বোঝার সাথে সম্পর্কিত, বোধগম্যতা শব্দার্থিক দিকের সাথে সম্পর্কিত
পেপারটি Hora-এর গবেষণা কেস উদ্ধৃত করে: Google-এ "File.mkdirs examples" অনুসন্ধান করার সময়, Tutorialspoint-এর কোড স্নিপেট যদিও পাঠযোগ্যতা এবং পুনর্ব্যবহারযোগ্যতা সূচকে দুর্বল, তবে প্রশ্নের সাথে সমান প্রাকৃতিক ভাষা ব্যাখ্যা অন্তর্ভুক্ত করার কারণে উচ্চতর র্যাঙ্কিং পায়।
প্রথম সিস্টেমেটিক তুলনামূলক গবেষণা: Google, Yahoo! এবং Microsoft Bing তিনটি প্রধান সার্চ ইঞ্জিন দ্বারা সুপারিশকৃত কোড স্নিপেটের পাঠযোগ্যতা এবং বোধগম্যতার বৃহৎ-স্কেল তুলনামূলক বিশ্লেষণ
বৃহৎ-স্কেল ডেটাসেট নির্মাণ: 9,480টি প্রশ্নের 47,400টি ওয়েব লিঙ্ক সংগ্রহ করেছে, 5,355টি ভিন্ন ওয়েবসাইট কভার করে
বহু-মাত্রিক বিশ্লেষণ কাঠামো: র্যাঙ্কিং, সার্চ ইঞ্জিন এবং সুপারিশকৃত ওয়েবসাইট তিনটি স্বাধীন চলকের উপর ভিত্তি করে একটি বিশ্লেষণ পদ্ধতি প্রস্তাব করেছে
অভিজ্ঞতামূলক আবিষ্কার: দুটি গুরুত্বপূর্ণ অনুমান প্রমাণ করেছে: উচ্চতর র্যাঙ্কিং সহ কোড স্নিপেটগুলি অগত্যা উচ্চতর পাঠযোগ্যতা/বোধগম্যতা নেই; বিভিন্ন সুপারিশকৃত ওয়েবসাইটের কোড গুণমানে উল্লেখযোগ্য পার্থক্য রয়েছে
বোধগম্যতা পরিমাপ মানদণ্ডকরণ: জ্ঞানীয় জটিলতাকে 0,1 ব্যবধানে রূপান্তরের জন্য একটি মানদণ্ডকৃত পদ্ধতি প্রস্তাব করেছে
পেপারটি 23টি সম্পর্কিত সাহিত্য উদ্ধৃত করেছে, প্রধানত অন্তর্ভুক্ত:
কোড পাঠযোগ্যতা এবং বোধগম্যতা পরিমাপ পদ্ধতি
কোড অনুসন্ধান এবং সুপারিশ সিস্টেম গবেষণা
StackOverflow কোড গুণমান বিশ্লেষণ
সার্চ ইঞ্জিন র্যাঙ্কিং মেকানিজম গবেষণা
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের অভিজ্ঞতামূলক সফটওয়্যার ইঞ্জিনিয়ারিং গবেষণা পেপার যা কোড অনুসন্ধান গুণমান মূল্যায়নের গবেষণা শূন্যতা পূরণ করে, উল্লেখযোগ্য তাত্ত্বিক মূল্য এবং ব্যবহারিক তাৎপর্য রয়েছে। গবেষণা পদ্ধতি বৈজ্ঞানিকভাবে কঠোর, ডেটা স্কেল পর্যাপ্ত, সিদ্ধান্তের বিশ্বাসযোগ্যতা উচ্চ, ডেভেলপার এবং গবেষকদের জন্য মূল্যবান অন্তর্দৃষ্টি প্রদান করে।