VayuChat: An LLM-Powered Conversational Interface for Air Quality Data Analytics
Acharya, Pisharodi, Mondal et al.
Air pollution causes about 1.6 million premature deaths each year in India, yet decision makers struggle to turn dispersed data into decisions. Existing tools require expertise and provide static dashboards, leaving key policy questions unresolved. We present VayuChat, a conversational system that answers natural language questions on air quality, meteorology, and policy programs, and responds with both executable Python code and interactive visualizations. VayuChat integrates data from Central Pollution Control Board (CPCB) monitoring stations, state-level demographics, and National Clean Air Programme (NCAP) funding records into a unified interface powered by large language models. Our live demonstration will show how users can perform complex environmental analytics through simple conversations, making data science accessible to policymakers, researchers, and citizens. The platform is publicly deployed at https://huggingface.co/spaces/SustainabilityLabIITGN/ VayuChat. For further information check out video uploaded on https://www.youtube.com/watch?v=d6rklL05cs4.
academic
VayuChat: বায়ু গুণমান ডেটা বিশ্লেষণের জন্য একটি LLM-চালিত কথোপকথন ইন্টারফেস
ভারতে বায়ু দূষণের কারণে প্রতি বছর প্রায় ১.৬ মিলিয়ন মানুষ অকাল মৃত্যুবরণ করে, কিন্তু নীতিনির্ধারকরা বিক্ষিপ্ত ডেটাকে সিদ্ধান্ত গ্রহণের ভিত্তিতে রূপান্তরিত করতে সংগ্রাম করেন। বিদ্যমান সরঞ্জামগুলির জন্য বিশেষায়িত দক্ষতা প্রয়োজন এবং শুধুমাত্র স্ট্যাটিক ড্যাশবোর্ড প্রদান করে, যা গুরুত্বপূর্ণ নীতি প্রশ্নগুলি সমাধান করতে পারে না। এই পত্রটি VayuChat প্রস্তাব করে, একটি কথোপকথন ব্যবস্থা যা বায়ু গুণমান, আবহাওয়া এবং নীতি প্রকল্প সম্পর্কে প্রাকৃতিক ভাষার প্রশ্নের উত্তর দিতে পারে এবং কার্যকর Python কোড এবং ইন্টারেক্টিভ ভিজ্যুয়ালাইজেশন প্রদান করে। VayuChat কেন্দ্রীয় দূষণ নিয়ন্ত্রণ বোর্ড (CPCB) পর্যবেক্ষণ কেন্দ্র ডেটা, রাজ্য-স্তরের জনতাত্ত্বিক ডেটা এবং জাতীয় পরিষ্কার বায়ু পরিকল্পনা (NCAP) তহবিল রেকর্ড একীভূত করে, বড় ভাষা মডেল-চালিত একীভূত ইন্টারফেসের মাধ্যমে সেবা প্রদান করে। এই প্ল্যাটফর্মটি নীতিনির্ধারক, গবেষকদের এবং নাগরিকদের সহজ কথোপকথনের মাধ্যমে জটিল পরিবেশগত বিশ্লেষণ পরিচালনা করতে সক্ষম করে।
গুরুতর জনস্বাস্থ্য সংকট: ভারতে বায়ু দূষণ প্রতি বছর ১.৬ মিলিয়ন অকাল মৃত্যু ঘটায়, PM2.5 এক্সপোজার প্রত্যাশিত জীবনকাল ৫ বছরের বেশি হ্রাস করে
ডেটা ব্যবহারের বাধা: যদিও CPCB ক্রমাগত জাতীয় দূষক পরিমাপ ডেটা সংগ্রহ করে, তবুও কাঁচা ডেটাকে সময়োপযোগী নীতি-সম্পর্কিত অন্তর্দৃষ্টিতে রূপান্তরিত করা অত্যন্ত কঠিন
উচ্চ প্রযুক্তিগত বাধা: বিদ্যমান সরঞ্জামগুলির জন্য বিশেষায়িত জ্ঞান প্রয়োজন, শুধুমাত্র সীমিত ভিজ্যুয়ালাইজেশন কার্যকারিতা প্রদান করে, বা শুধুমাত্র সংকীর্ণ কাজের পরিসর পরিচালনা করে
বায়ু গুণমান বিশ্লেষণের জন্য প্রথম LLM-চালিত কথোপকথন সিস্টেম তৈরি করা: VayuChat প্রাকৃতিক ভাষার প্রশ্নগুলি পরিচালনা করতে এবং কার্যকর Python কোড এবং ভিজ্যুয়ালাইজেশন ফলাফল তৈরি করতে পারে
একাধিক উৎস পরিবেশগত ডেটা একীভূত করা: CPCB বায়ু গুণমান এবং আবহাওয়া পর্যবেক্ষণ ডেটা (2017-2024), রাজ্য-স্তরের জনসংখ্যা এবং এলাকা ডেটা, NCAP তহবিল বরাদ্দ রেকর্ড একীভূত করা
স্বচ্ছ কোড প্রজন্ম প্রক্রিয়া প্রদান করা: সরাসরি ফলাফল আউটপুটের পরিবর্তে Python কোড তৈরি করে হ্যালুসিনেশন হ্রাস করা, ফলাফলের যাচাইযোগ্যতা এবং পুনরুৎপাদনযোগ্যতা নিশ্চিত করা
একাধিক বিশ্লেষণ ধরনকে সমর্থন করা: সরাসরি প্রশ্ন, প্লট প্রজন্ম, সম্পর্ক বিশ্লেষণ এবং নীতি প্রভাব মূল্যায়ন সহ
বাস্তব কেস যাচাইকরণ: 2024 সালের ডিসেম্বরে দিল্লির বায়ু দূষণ সংকটের গভীর বিশ্লেষণের মাধ্যমে সিস্টেমের ব্যবহারিক মূল্য প্রদর্শন করা
এই পত্রটি বায়ু গুণমান বিশ্লেষকদের সাথে সহযোগিতায় VayuChat ব্যবহার করে 2024 সালের ডিসেম্বরে দিল্লির গুরুতর দূষণ বৃদ্ধির কারণ তদন্ত করে, সিস্টেমের বাস্তব প্রয়োগ মূল্য প্রদর্শন করে।
প্রশ্ন: "2017 সাল থেকে দিল্লির ডিসেম্বরে CO, NO2 এবং PM2.5 এর সম্পর্ক বিশ্লেষণ করুন"
সম্পর্ক ম্যাট্রিক্স:
দূষক
CO
NO2
PM2.5
CO
1
0.3
0.47
NO2
0.3
1
0.34
PM2.5
0.47
0.34
1
অন্তর্দৃষ্টি: PM2.5 এবং CO এর সম্পর্ক সবচেয়ে শক্তিশালী (r=0.47), যা যানবাহন নির্গমন, ফসলের অবশেষ পোড়ানো এবং শিল্প নির্গমনের মতো সাধারণ উৎস সমন্বিত দূষণ ঘটনা চালিত করে।
প্রযুক্তিগত সম্ভাব্যতা: LLM জটিল পরিবেশগত ডেটা বিশ্লেষণ প্রশ্নগুলি কার্যকরভাবে পরিচালনা করতে পারে, কোড প্রজন্ম প্রক্রিয়ার মাধ্যমে ফলাফলের নির্ভুলতা নিশ্চিত করে
ব্যবহারিক মূল্য: সিস্টেম দিল্লির বায়ু দূষণ সংকটের গভীর বিশ্লেষণ সফলভাবে সমর্থন করেছে, বাস্তব প্রয়োগ সম্ভাবনা প্রদর্শন করে
অ্যাক্সেসযোগ্যতা উন্নতি: পরিবেশগত ডেটা বিশ্লেষণের প্রযুক্তিগত বাধা উল্লেখযোগ্যভাবে হ্রাস করে, অ-প্রযুক্তিগত ব্যবহারকারীদের জটিল বিশ্লেষণ পরিচালনা করতে সক্ষম করে
এই পত্রটি 15টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা LLM মৌলিক প্রযুক্তি, পরিবেশগত ডেটা বিশ্লেষণ সরঞ্জাম, বায়ু দূষণ স্বাস্থ্য প্রভাব সহ একাধিক দিক কভার করে, গবেষণার জন্য পর্যাপ্ত তাত্ত্বিক ভিত্তি এবং তুলনামূলক রেফারেন্স প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি প্রযুক্তিগত উদ্ভাবন এবং বাস্তব প্রয়োগের সমন্বয়ের একটি চমৎকার পত্র, LLM প্রয়োগ পরিবেশগত বিজ্ঞানে অগ্রগামী তাৎপর্য রয়েছে। সিস্টেম ডিজাইন যুক্তিসঙ্গত, বাস্তব কেস বিশ্লেষণ গভীর, ভারত এবং অন্যান্য উন্নয়নশীল দেশের পরিবেশগত ডেটা ব্যবহার সমস্যা সমাধানে গুরুত্বপূর্ণ মূল্য রয়েছে। যদিও মূল্যায়ন এবং প্রযুক্তিগত বিবরণ দিকে উন্নতির অবকাশ রয়েছে, সামগ্রিক অবদান উল্লেখযোগ্য, ভাল প্রচার প্রয়োগ সম্ভাবনা রয়েছে।