The Web has drastically simplified our access to knowledge and learning, and fact-checking online resources has become a part of our daily routine. Studying online knowledge consumption is thus critical for understanding human behavior and informing the design of future platforms. In this Chapter, we approach this subject by describing the navigation patterns of the readers of Wikipedia, the world's largest platform for open knowledge. We provide a comprehensive overview of what is known about the three steps that characterize navigation on Wikipedia: (1) how readers reach the platform, (2) how readers navigate the platform, and (3) how readers leave the platform. Finally, we discuss open problems and opportunities for future research in this field.
- পেপার আইডি: 2501.00939
- শিরোনাম: Navigating Knowledge: Patterns and Insights from Wikipedia Consumption
- লেখক: Tiziano Piccardi (স্ট্যানফোর্ড বিশ্ববিদ্যালয়), Robert West (EPFL)
- শ্রেণীবিভাগ: cs.CY (কম্পিউটার এবং সমাজ), cs.DL (ডিজিটাল লাইব্রেরি), cs.HC (মানব-কম্পিউটার ইন্টারঅ্যাকশন)
- প্রকাশনা ফর্ম্যাট: কম্পিউটেশনাল সোশ্যাল সায়েন্সের হ্যান্ডবুক অধ্যায় (Edward Elgar Publishing Ltd, 2025)
- পেপার লিঙ্ক: https://arxiv.org/abs/2501.00939
ওয়েব প্রযুক্তি আমাদের জ্ঞান অর্জন এবং শিক্ষার পথকে ব্যাপকভাবে সরল করেছে, এবং অনলাইন সম্পদের তথ্য যাচাইকরণ দৈনন্দিন জীবনের একটি অংশ হয়ে উঠেছে। অনলাইন জ্ঞান ব্যবহার সম্পর্কে গবেষণা মানব আচরণ বোঝার এবং ভবিষ্যত প্ল্যাটফর্ম ডিজাইন পরিচালনার জন্য অত্যন্ত গুরুত্বপূর্ণ। এই অধ্যায়টি বিশ্বের বৃহত্তম উন্মুক্ত জ্ঞান প্ল্যাটফর্ম উইকিপিডিয়ার পাঠকদের নেভিগেশন প্যাটার্ন বর্ণনা করে এই বিষয়টি অন্বেষণ করে, উইকিপিডিয়া নেভিগেশনের তিনটি মূল পর্যায়ের একটি ব্যাপক সংক্ষিপ্ত বিবরণ প্রদান করে: (1) পাঠকরা কীভাবে প্ল্যাটফর্মে পৌঁছান, (2) পাঠকরা কীভাবে প্ল্যাটফর্মের মধ্যে নেভিগেট করেন, (3) পাঠকরা কীভাবে প্ল্যাটফর্ম ছেড়ে যান, এবং এই ক্ষেত্রের খোলা প্রশ্ন এবং ভবিষ্যত গবেষণার সুযোগ নিয়ে আলোচনা করে।
এই গবেষণার লক্ষ্য মানুষের অনলাইন জ্ঞান ব্যবহার আচরণ গভীরভাবে বোঝা, বিশেষ করে উইকিপিডিয়ায় ব্যবহারকারীদের নেভিগেশন প্যাটার্নে মনোনিবেশ করা। এই গবেষণা গুরুত্বপূর্ণ কারণ:
- মানব প্রকৃতির তথ্য অনুসন্ধান চাহিদা: মানুষকে "তথ্য খোঁজক" (informavores) হিসাবে বিবেচনা করা হয়, জ্ঞান অনুসন্ধান মানব আচরণের একটি মূল প্রক্রিয়া
- ডিজিটাল যুগে জ্ঞান অর্জনের রূপান্তর: প্রাচীন বিশ্বকোষ থেকে আধুনিক অনলাইন প্ল্যাটফর্ম পর্যন্ত, জ্ঞান অর্জনের পদ্ধতি মৌলিক পরিবর্তন ঘটেছে
- প্ল্যাটফর্ম ডিজাইনের নির্দেশনা প্রয়োজন: ব্যবহারকারীর আচরণ বোঝা আরও কার্যকর তথ্য পরিবেশ ডিজাইনে সহায়তা করতে পারে
- মৌলিক বিজ্ঞান মূল্য: জীববিজ্ঞানী, মনোবিজ্ঞানী, নৃতাত্ত্বিক এবং অন্যদের জন্য মানব কার্যকারিতার মৌলিক অন্তর্দৃষ্টি প্রদান করে
- প্রয়োগ বিজ্ঞান মূল্য: আরও কার্যকর সরঞ্জাম এবং তথ্য পরিবেশ ডিজাইনে সহায়তা করে, যাতে মানুষ তথ্যের বন্যায় প্রাসঙ্গিক জ্ঞান সহজে খুঁজে পেতে পারে
- সমীক্ষা এবং চিন্তা-প্রক্রিয়া গবেষণা: জ্ঞানীয় পক্ষপাত দ্বারা সহজেই প্রভাবিত হয়, মানব অন্তর্দৃষ্টি ক্ষমতা সীমিত
- পরীক্ষাগার পরীক্ষা: ছোট নমুনা এবং পক্ষপাত (যেমন বিশ্ববিদ্যালয়ের শিক্ষার্থী গোষ্ঠী), পরিসংখ্যানগত শক্তি এবং প্রতিনিধিত্ব অভাব
- ডেটা অ্যাক্সেস সীমাবদ্ধতা: মূল সার্ভার লগ সংবেদনশীল তথ্যে বিশেষাধিকার অ্যাক্সেস প্রয়োজন
- উইকিপিডিয়া ব্যবহারকারী আচরণের একটি ব্যাপক বৈশিষ্ট্য কাঠামো প্রদান করেছে: "আগমন-নেভিগেশন-প্রস্থান" তিন-পর্যায়ের চারপাশে সিস্টেমেটিক বিশ্লেষণ নির্মাণ করা
- বহু-স্তরের ব্যবহারকারী নেভিগেশন প্যাটার্ন প্রকাশ করেছে: প্রাকৃতিক নেভিগেশন এবং লক্ষ্য-ভিত্তিক নেভিগেশনের বিস্তারিত বৈশিষ্ট্য সহ
- সময় এবং বিষয়-সম্পর্কিত ব্যবহার নিয়ম আবিষ্কার করেছে: দৈনিক ছন্দ এবং বিষয় পছন্দ পড়ার আচরণে প্রভাব প্রদর্শন করে
- ওয়েব গেটওয়ে হিসাবে উইকিপিডিয়ার অর্থনৈতিক মূল্য পরিমাপ করেছে: বাহ্যিক লিঙ্ক ট্রাফিকের অর্থনৈতিক মূল্য মাসিক 700-1300 মিলিয়ন ডলার অনুমান করে
- বহু-ডেটা উৎস যাচাইকরণের গবেষণা পদ্ধতি প্রতিষ্ঠা করেছে: সার্ভার লগ, ক্লিকস্ট্রিম ডেটা এবং নেভিগেশন গেম ডেটা একত্রিত করে
- সার্ভার লগ: সময়মুদ্রা, ভৌগোলিক অবস্থান, ব্যবহারকারী শনাক্তকারী ইত্যাদি বিস্তারিত তথ্য সহ
- জনসাধারণের ক্লিকস্ট্রিম ডেটা: উইকিমিডিয়া ফাউন্ডেশন দ্বারা মাসিক প্রকাশিত নিবন্ধ রূপান্তর গণনা
- নেভিগেশন গেম ডেটা: Wikispeedia এবং TheWikiGame এর মাধ্যমে সংগৃহীত লক্ষ্য-ভিত্তিক নেভিগেশন ট্র্যাজেক্টরি
- গোপনীয়তা সুরক্ষা: ব্যবহারকারীর গোপনীয়তা রক্ষার জন্য একত্রিত এবং ফিল্টার করা ক্লিকস্ট্রিম ডেটা ব্যবহার করা
- সেশন সংজ্ঞা: ব্যবহারকারী সেশন সংজ্ঞায়িত করার জন্য দুটি পদ্ধতি গ্রহণ করা
- পড়ার ক্রম: 1 ঘন্টার কম সময় ব্যবধানের ক্রমাগত পৃষ্ঠা লোড
- নেভিগেশন গাছ: HTTP রেফারার তথ্যের উপর ভিত্তি করে সংযুক্ত পৃষ্ঠা পরিদর্শন গাছ কাঠামো
- আগমন পর্যায়: ট্রাফিক উৎস, সময় প্যাটার্ন, ডিভাইস প্রকার বিশ্লেষণ
- নেভিগেশন পর্যায়: অভ্যন্তরীণ লিঙ্ক জাম্প, সেশন দৈর্ঘ্য, বিষয় বিবর্তন গবেষণা
- প্রস্থান পর্যায়: বাহ্যিক লিঙ্ক ক্লিক, উদ্ধৃতি ইন্টারঅ্যাকশন, অর্থনৈতিক মূল্য মূল্যায়ন
- বহু-মাত্রিক বৈশিষ্ট্য বিশ্লেষণ: সময়, ভৌগোলিক, বিষয়, ডিভাইস ইত্যাদি একাধিক মাত্রা একত্রিত করা
- মেশিন লার্নিং মডেল প্রয়োগ: ব্যবহারকারী আচরণ প্যাটার্ন পূর্বাভাস দিতে লজিস্টিক রিগ্রেশন ব্যবহার করা
- শব্দার্থিক দূরত্ব গণনা: WikiPDA ইত্যাদি পদ্ধতির মাধ্যমে নিবন্ধের মধ্যে শব্দার্থিক সাদৃশ্য গণনা করা
- ইংরেজি উইকিপিডিয়া: 6 মিলিয়নেরও বেশি নিবন্ধ, 60 মিলিয়ন বাহ্যিক লিঙ্ক
- সময়ের ব্যাপ্তি: 2019 সহ একাধিক সময়কালের ডেটার উপর ভিত্তি করে
- ব্যবহারকারী স্কেল: প্রতি মাসে লক্ষ লক্ষ ব্যবহারকারীর নেভিগেশন ট্র্যাজেক্টরি
- ক্লিক-থ্রু রেট (CTR): বাহ্যিক লিঙ্কের ক্লিক থ্রু রেট
- সেশন দৈর্ঘ্য: ব্যবহারকারীর একক পরিদর্শনে পৃষ্ঠার সংখ্যা
- রূপান্তর সম্ভাবনা: পৃষ্ঠার মধ্যে রূপান্তরের সম্ভাবনা বিতরণ
- শব্দার্থিক দূরত্ব: নিবন্ধের মধ্যে বিষয় সম্পর্কিত পরিমাপ
- র্যান্ডম ওয়াক মডেল: ব্যবহারকারী নেভিগেশন আচরণের জন্য মানদণ্ড তুলনা হিসাবে
- ডিভাইস প্রকার তুলনা: ডেস্কটপ বনাম মোবাইল আচরণের পার্থক্য
- ক্রস-ভাষা তুলনা: বিভিন্ন ভাষা সংস্করণ উইকিপিডিয়ার আচরণ প্যাটার্ন
- সার্চ ইঞ্জিন আধিপত্য: বাহ্যিক ট্রাফিকের 78% সার্চ ইঞ্জিন থেকে আসে, প্রধানত গুগল
- সোশ্যাল মিডিয়া অবদান: বাহ্যিক ট্রাফিকের 1.5% সোশ্যাল প্ল্যাটফর্ম থেকে আসে (Facebook 15.6%, Reddit 9.6%)
- অনির্দিষ্ট উৎস: প্রায় 20% অনুরোধের কোনো স্পষ্ট উৎস নেই, ব্রাউজার ইতিহাস, বুকমার্ক ইত্যাদি থেকে আসতে পারে
- দৈনিক ছন্দ: ব্যবহারকারী পরিদর্শন স্পষ্ট দিন-রাত পর্যায়ক্রমিকতা প্রদর্শন করে
- কর্মসময় পছন্দ: কর্মসময়ে আরও বেশি শিক্ষা এবং STEM বিষয় ব্যবহার, সন্ধ্যায় বিনোদন বিষয়বস্তুর দিকে ঝোঁক
- আন্তঃ-দেশীয় পার্থক্য: বিভিন্ন দেশের পরিদর্শন প্যাটার্ন সামাজিক সাংস্কৃতিক পটভূমির পার্থক্য প্রতিফলিত করে
- সংক্ষিপ্ত সেশন প্রধান: নেভিগেশন সেশনের 78% শুধুমাত্র একটি পৃষ্ঠা লোড অন্তর্ভুক্ত করে
- দ্রুত রূপান্তর: পৃষ্ঠার মধ্যে রূপান্তরের মধ্যম সময় 74 সেকেন্ড
- বাহ্যিক নেভিগেশন ঘন ঘন: পৃষ্ঠা রূপান্তরের 35% বাহ্যিক নেভিগেশনের মাধ্যমে বাস্তবায়িত হয়
- শব্দার্থিক সামঞ্জস্য: ব্যবহারকারীরা অনুরূপ বিষয়ের মধ্যে নেভিগেট করতে প্রবণ, কিন্তু র্যান্ডম ওয়াকের চেয়ে শুরু বিষয় থেকে আরও ধীরে ধীরে বিচ্যুত হয়
- তথ্য বাক্স লিঙ্ক সবচেয়ে সক্রিয়: প্রতি 110 বার প্রদর্শনে 1 বার ক্লিক
- উদ্ধৃতি ইন্টারঅ্যাকশন কম: প্রতি 3000 বার প্রদর্শনে 1 বারের কম ক্লিক
- মোবাইল অংশগ্রহণ কম: ডেস্কটপ উদ্ধৃতি ক্লিক হার মোবাইলের 4 গুণেরও বেশি
- ডিভাইস প্রকার: ডেস্কটপ ব্যবহারকারীরা দীর্ঘ সেশনের দিকে ঝোঁক রাখে
- শুরু বিষয়: বিনোদন নিবন্ধ থেকে শুরু করা সেশন দীর্ঘ, STEM নিবন্ধ ব্যবহারকারীরা প্রথম পৃষ্ঠায় থামার সম্ভাবনা বেশি
- নিবন্ধ গুণমান: নিম্ন মানের নিবন্ধ নেভিগেশন শেষ করার সম্ভাবনা বেশি
- গুণমান হ্রাস প্রবণতা: নেভিগেশন প্রক্রিয়ায় নিবন্ধ গুণমান হ্রাস প্রবণতা দেখায়
- জনপ্রিয়তা পরিবর্তন: ব্যবহারকারীরা জনপ্রিয় নিবন্ধ থেকে ধীরে ধীরে কুলুঙ্গি বিষয়বস্তুর দিকে যায়
- শব্দার্থিক বিস্তার: বিষয় ধীরে ধীরে বিচ্যুত কিন্তু আপেক্ষিক সামঞ্জস্য বজায় রাখে
- বাহ্যিক ট্রাফিক মূল্য: তথ্য বাক্স লিঙ্ক বাহ্যিক ওয়েবসাইটে আনা ট্রাফিক মূল্য মাসিক 700-1300 মিলিয়ন ডলার
- উচ্চ মূল্যের ক্ষেত্র: ব্যবসা এবং জীবনী নিবন্ধ সর্বোচ্চ মূল্যায়িত ট্রাফিক উৎপন্ন করে
- সার্চ ইঞ্জিন বিকল্প: উইকিপিডিয়া সার্চ ইঞ্জিন পূরণ করতে পারে না এমন নেভিগেশন চাহিদার সমাধান প্রদান করে
- তথ্য খোঁজার তত্ত্ব: মানুষ তথ্য গন্ধ অনুসরণ করে প্রয়োজনীয় বিষয়বস্তু খুঁজে পায়
- জ্ঞানীয় লোড তত্ত্ব: ব্যবহারকারীরা জ্ঞানীয় খরচ কম পথ নির্বাচন করতে প্রবণ
- ঐতিহ্যবাহী ওয়েব আচরণ গবেষণা: পুনরায় পরিদর্শন প্যাটার্ন, ব্রাউজিং পথ বিশ্লেষণ
- সার্চ ইঞ্জিন নির্ভরতা: উইকিপিডিয়া এবং গুগলের পারস্পরিক নির্ভরতা সম্পর্ক
- সম্পাদনা বনাম পড়ার আচরণ: উৎপাদন এবং ব্যবহারের মধ্যে ব্যবধান
- বহু-ভাষা তুলনা গবেষণা: বিভিন্ন ভাষা সংস্করণের ব্যবহার প্যাটার্ন পার্থক্য
- উইকিপিডিয়া বৈচিত্র্যময় চাহিদা পূরণ করে: প্ল্যাটফর্ম বিনোদন থেকে একাডেমিক গবেষণা পর্যন্ত বিভিন্ন তথ্য চাহিদা পরিবেশন করে
- গুণমান নেভিগেশন সিদ্ধান্ত চালিত করে: নিবন্ধ গুণমান ব্যবহারকারী নেভিগেশন অব্যাহত রাখার উপর প্রভাবিত করার মূল কারণ
- সামাজিক বিষয়বস্তু আরও মনোযোগ আকর্ষণ করে: ব্যবহারকারীরা ব্যক্তি জীবনী এবং সামাজিক ঘটনা সম্পর্কিত বিষয়বস্তুতে আরও বেশি মনোযোগ দেয়
- প্ল্যাটফর্ম গেটওয়ে মূল্য উল্লেখযোগ্য: উইকিপিডিয়া ওয়েব ইকোসিস্টেমের একটি গুরুত্বপূর্ণ প্রবেশদ্বার হিসাবে বিশাল অর্থনৈতিক মূল্য রাখে
- ভাষা সংস্করণ সীমাবদ্ধতা: প্রধানত ইংরেজি উইকিপিডিয়ায় ফোকাস, অন্যান্য ভাষা সংস্করণ গবেষণা সীমিত
- ডেটা অ্যাক্সেস সীমাবদ্ধতা: সম্পূর্ণ ব্যবহারকারী আচরণ বিশ্লেষণ এখনও বিশেষাধিকার ডেটা অ্যাক্সেস প্রয়োজন
- কারণ সম্পর্ক অনুমান: পর্যবেক্ষণমূলক ডেটা স্পষ্ট কারণ সম্পর্ক প্রতিষ্ঠা করা কঠিন
- গতিশীল পরিবর্তন: ব্যবহারকারী আচরণ প্যাটার্ন সময় এবং প্রযুক্তি উন্নয়নের সাথে পরিবর্তিত হতে পারে
- ক্রস-ভাষা আচরণ তুলনা: বহু-ভাষা সংস্করণের তুলনা গবেষণায় সম্প্রসারণ
- ব্যক্তিগতকৃত সুপারিশ সিস্টেম: ব্যবহারকারী আচরণ প্যাটার্নের উপর ভিত্তি করে সুপারিশ অ্যালগরিদম ডিজাইন করা
- সম্পাদনা আচরণ একীকরণ: সম্পাদনা এবং পড়ার আচরণের সমন্বিত বিশ্লেষণ
- AI-সহায়ক নেভিগেশন: স্মার্ট নেভিগেশন সহায়তা সরঞ্জাম উন্নয়ন
- গবেষণা পরিধি ব্যাপক: উইকিপিডিয়া ব্যবহারকারী আচরণের 360-ডিগ্রি সম্পূর্ণ বিশ্লেষণ প্রদান করে
- পদ্ধতি কঠোর: বহু-ডেটা উৎস যাচাইকরণ ফলাফলের নির্ভরযোগ্যতা নিশ্চিত করে
- ব্যবহারিক মূল্য উচ্চ: প্ল্যাটফর্ম ডিজাইন এবং তথ্য স্থাপত্যে সরাসরি নির্দেশনা প্রদান করে
- আন্তঃ-শৃঙ্খলা তাৎপর্য: গণনা বিজ্ঞান, জ্ঞানীয় বিজ্ঞান এবং সামাজিক বিজ্ঞান সংযুক্ত করে
- ডেটা স্কেল বিশাল: প্রকৃত বড়-স্কেল ব্যবহারকারী আচরণ ডেটার উপর ভিত্তি করে
- তাত্ত্বিক কাঠামো অপেক্ষাকৃত দুর্বল: পর্যবেক্ষণ করা ঘটনা ব্যাখ্যা করার জন্য একীভূত তাত্ত্বিক মডেল অভাব
- ব্যক্তিগত পার্থক্য মনোযোগ অপর্যাপ্ত: প্রধানত গোষ্ঠী প্যাটার্নে ফোকাস, ব্যক্তিগত পার্থক্য বিশ্লেষণ সীমিত
- গতিশীল বিবর্তন বিশ্লেষণ অনুপস্থিত: দীর্ঘমেয়াদী প্রবণতা এবং আচরণ বিবর্তন বিশ্লেষণ অভাব
- পরীক্ষামূলক যাচাইকরণ অপর্যাপ্ত: প্রধানত পর্যবেক্ষণমূলক ডেটার উপর ভিত্তি করে, নিয়ন্ত্রিত পরীক্ষা যাচাইকরণ অভাব
- একাডেমিক অবদান: কম্পিউটেশনাল সামাজিক বিজ্ঞান ক্ষেত্রে গুরুত্বপূর্ণ অভিজ্ঞতামূলক ভিত্তি প্রদান করে
- শিল্প প্রয়োগ: জ্ঞান ব্যবস্থাপনা প্ল্যাটফর্ম এবং সার্চ ইঞ্জিন ডিজাইনে নির্দেশনা প্রদান করে
- নীতি প্রভাব: ডিজিটাল প্ল্যাটফর্ম শাসন এবং তথ্য সাক্ষরতা শিক্ষার জন্য প্রমাণ প্রদান করে
- পদ্ধতি উদ্ভাবন: বড়-স্কেল ব্যবহারকারী আচরণ বিশ্লেষণের মান প্যারাডাইম প্রতিষ্ঠা করে
- শিক্ষা প্ল্যাটফর্ম ডিজাইন: অনলাইন শিক্ষা প্ল্যাটফর্মের তথ্য স্থাপত্য অপ্টিমাইজ করা
- সার্চ ইঞ্জিন অপ্টিমাইজেশন: অনুসন্ধান ফলাফল র্যাঙ্কিং এবং জ্ঞান গ্রাফ নির্মাণ উন্নত করা
- বিষয়বস্তু সুপারিশ সিস্টেম: ব্যবহারকারী নেভিগেশন প্যাটার্নের উপর ভিত্তি করে ব্যক্তিগতকৃত সুপারিশ ডিজাইন করা
- ব্যবহারকারী অভিজ্ঞতা গবেষণা: ওয়েব প্ল্যাটফর্মের ব্যবহারকারী অভিজ্ঞতা অপ্টিমাইজেশনের জন্য ডেটা সমর্থন প্রদান করা
এই পেপারটি সমৃদ্ধ সম্পর্কিত গবেষণা উদ্ধৃত করে, যার মধ্যে রয়েছে:
- Bush, V. (1945). As we may think - তথ্য ব্যবস্থাপনা ডিভাইস Memex এর অগ্রগামী ধারণা
- West, R. & Leskovec, J. (2012). Human Wayfinding in Information Networks - লক্ষ্য-ভিত্তিক নেভিগেশন আচরণ গবেষণা
- Singer, P. et al. (2017). Why we read Wikipedia - ব্যবহারকারী প্রেরণা সমীক্ষা গবেষণা
- এবং লেখক দলের সিরিজ গবেষণা ফলাফল, একটি সম্পূর্ণ গবেষণা সিস্টেম গঠন করে
সামগ্রিক মূল্যায়ন: এটি একটি গুরুত্বপূর্ণ একাডেমিক এবং ব্যবহারিক মূল্যের একটি সারসংক্ষেপ গবেষণা, উইকিপিডিয়া ব্যবহারকারী আচরণ সিস্টেমেটিক বিশ্লেষণের মাধ্যমে মানুষের অনলাইন জ্ঞান ব্যবহারের গভীর অন্তর্দৃষ্টি প্রদান করে। গবেষণা পদ্ধতি কঠোর, ডেটা স্কেল বিশাল, সিদ্ধান্ত প্রভাবশালী, এবং সম্পর্কিত ক্ষেত্রের পরবর্তী গবেষণার জন্য একটি দৃঢ় ভিত্তি স্থাপন করে।