2025-11-11T14:34:09.551839

VayuChat: An LLM-Powered Conversational Interface for Air Quality Data Analytics

Acharya, Pisharodi, Mondal et al.

Air pollution causes about 1.6 million premature deaths each year in India, yet decision makers struggle to turn dispersed data into decisions. Existing tools require expertise and provide static dashboards, leaving key policy questions unresolved. We present VayuChat, a conversational system that answers natural language questions on air quality, meteorology, and policy programs, and responds with both executable Python code and interactive visualizations. VayuChat integrates data from Central Pollution Control Board (CPCB) monitoring stations, state-level demographics, and National Clean Air Programme (NCAP) funding records into a unified interface powered by large language models. Our live demonstration will show how users can perform complex environmental analytics through simple conversations, making data science accessible to policymakers, researchers, and citizens. The platform is publicly deployed at https://huggingface.co/spaces/SustainabilityLabIITGN/ VayuChat. For further information check out video uploaded on https://www.youtube.com/watch?v=d6rklL05cs4.

academic

VayuChat: Eine LLM-gestützte Konversationsschnittstelle für die Luftqualitätsdatenanalyse

Grundinformationen

Paper-ID: 2511.01046
Titel: VayuChat: An LLM-Powered Conversational Interface for Air Quality Data Analytics
Autoren: Vedant Acharya, Abhay Pisharodi, Rishabh Mondal, Mohammad Rafiuddin, Nipun Batra
Klassifizierung: cs.CL (Computerlinguistik)
Veröffentlichungszeit/Konferenz: CODS 2025 (13. Internationale Konferenz für Datenwissenschaft)
Paper-Link: https://arxiv.org/abs/2511.01046
Systembereitstellung: https://huggingface.co/spaces/SustainabilityLabIITGN/VayuChat

Zusammenfassung

In Indien führt Luftverschmutzung jährlich zu etwa 1,6 Millionen vorzeitigen Todesfällen, doch Entscheidungsträger haben Schwierigkeiten, verstreute Daten in Entscheidungsgrundlagen umzuwandeln. Bestehende Werkzeuge erfordern Fachkenntnisse und bieten nur statische Dashboards, ohne kritische politische Fragen zu adressieren. Dieser Beitrag präsentiert VayuChat, ein Konversationssystem, das Fragen zur Luftqualität, Meteorologie und Politikprogrammen in natürlicher Sprache beantworten kann und ausführbaren Python-Code sowie interaktive Visualisierungen bereitstellt. VayuChat integriert Daten von Überwachungsstationen der Central Pollution Control Board (CPCB), Bevölkerungsdaten auf Staatsebene und Finanzierungsunterlagen des National Clean Air Plan (NCAP) über eine von großen Sprachmodellen angetriebene einheitliche Schnittstelle. Die Plattform ermöglicht es Politikern, Forschern und Bürgern, komplexe Umweltanalysen durch einfache Konversation durchzuführen.

Forschungshintergrund und Motivation

Problembeschreibung

Schwerwiegende Krise der öffentlichen Gesundheit: Luftverschmutzung in Indien führt jährlich zu 1,6 Millionen vorzeitigen Todesfällen; PM2,5-Exposition reduziert die Lebenserwartung um über 5 Jahre
Hindernisse bei der Datennutzung: Obwohl die CPCB kontinuierlich nationale Schadstoffmessungen erfasst, bleibt die Umwandlung von Rohdaten in zeitnahe politikrelevante Erkenntnisse schwierig
Hohe technische Hürden: Bestehende Werkzeuge erfordern Fachkenntnisse, bieten begrenzte Visualisierungsfunktionen oder behandeln nur enge Aufgabenbereiche

Einschränkungen bestehender Ansätze

Erfordern spezialisierte technische Fähigkeiten zur Verwendung
Bieten statische Dashboards ohne Interaktivität
Können keine komplexen datensatzübergreifenden Analysen durchführen
Einfache Abfragen wie „Wie hat sich PM2,5 in Delhi im letzten Jahr verändert?" sind schwer zu beantworten
Politische Fragen wie „Welche Städte haben PM2,5 relativ zur NCAP-Finanzierung am meisten reduziert?" erfordern die Integration von Verschmutzungs-, Finanzierungs- und Bevölkerungsdaten

Forschungsmotivation

Nutzung der Fähigkeiten großer Sprachmodelle zur Verarbeitung natürlicher Sprache und Codegenerierung zur Konstruktion eines Systems, das:

Die technischen Hürden der Umweltdatenanalyse senkt
Transparente und reproduzierbare Analyseergebnisse liefert
Mehrere heterogene Datenquellen integriert
Komplexe politikrelevante Abfragen unterstützt

Kernbeiträge

Entwicklung des ersten LLM-gestützten Konversationssystems für Luftqualitätsanalyse: VayuChat kann Abfragen in natürlicher Sprache verarbeiten und ausführbaren Python-Code sowie Visualisierungsergebnisse generieren
Integration mehrerer Umweltdatenquellen: Kombination von CPCB-Luftqualitäts- und Meteorologiebeobachtungsdaten (2017-2024), Bevölkerungs- und Flächendaten auf Staatsebene, NCAP-Finanzierungsverteilungsunterlagen
Transparenter Codegenerierungsmechanismus: Durch die Generierung von Python-Code anstelle direkter Ausgaben werden Halluzinationen reduziert und die Verifizierbarkeit sowie Reproduzierbarkeit der Ergebnisse gewährleistet
Unterstützung mehrerer Analysetypen: Einschließlich direkter Abfragen, Diagrammgenerierung, Korrelationsanalyse und Bewertung politischer Auswirkungen
Validierung durch praktische Fallstudien: Tiefgreifende Analyse der Luftverschmutzungskrise in Delhi im Dezember 2024 demonstriert den praktischen Wert des Systems

Methodische Details

Aufgabendefinition

Eingabe: Abfrage des Benutzers in natürlicher Sprache zu Luftqualität, Meteorologiedaten oder Politikanalyse Ausgabe:

Ausführbarer Python-Code
Datenanalyseergebnisse (Text, Tabellen oder Visualisierungsdiagramme)
Direkte Antwort auf die Abfrage

Einschränkungen:

Code muss auf vordefinierten Datensatzschemata basieren
Ergebnisse müssen verifizierbar und reproduzierbar sein
Unterstützung für Vergleichsbewertung mehrerer LLM-Modelle

Systemarchitektur

Frontend-Schnittstellendesign

VayuChat bietet eine browsergestützte Schnittstelle mit vier Kernfunktionsmodulen:

Modellwähler: Unterstützt mehrere State-of-the-Art-Modelle (GPT-OSS 20B/120B, Qwen3-32B, Llama-Serie, DeepSeek-R1, Gemini usw.)
Schnellabfrageoptiionen: Vordefinierte Abfragetemplates zu Luftqualität
Benutzerdefinierte Abfrageeingabe: Unterstützt beliebige Abfragen in natürlicher Sprache
Code-Anzeigebereich: Zeigt generierten Python-Code zur Gewährleistung der Transparenz

Backend-Verarbeitungsablauf

Benutzerabfrage → Systemaufforderungskombination → LLM-Codegenerierung → Sandbox-Ausführung → Ergebnisanzeige

Datensatzintegration

CPCB-Datensatz:

Zeitraum: 2017-2024
Schadstoffindikatoren: PM2,5, PM10, NO, NO2, NOx, NH3, SO2, CO, Ozon (Einheiten: μg/m³ usw.)
Meteorologische Variablen: Lufttemperatur, relative Luftfeuchte, Windgeschwindigkeit, Windrichtung, Niederschlag, Sonneneinstrahlung, Luftdruck, vertikale Windgeschwindigkeit
Stationsmetadaten: Stadt, Bundesstaat, von der CPCB zugewiesene Stations-ID

Bevölkerungsdaten auf Staatsebene:

Abdeckung von 31 indischen Regionen
Enthält Volkszählungsdaten von 2011
Flächeninformationen (km²)
Kennzeichnung von Unionsterritorien

NCAP-Finanzierungsdaten:

Zeitraum: 2019-2022
Aufzeichnung der Finanzierungsverteilung pro Stadt nach Haushaltsjahr
Status der Mittelverwendung bis Juni 2022

Technische Innovationen

1. Halluzinationsreduktionsmechanismus basierend auf Codegenerierung

Traditionelle Methoden, die LLMs Rohtabellendaten bereitstellen, führen leicht zu Halluzinationen. VayuChat wendet folgende Strategien an:

Bereitstellung von Datensatzschemabeschreibungen in der Systemaufforderung
LLM generiert Python-Code statt direkter Antworten
Codeausführung gewährleistet Ergebnisgenauigkeit

2. Multi-Modell-Unterstützungsarchitektur

Integration von Open-Source-Modellen (über Groq Cloud API) und kommerziellen Modellen (über Gemini API)
Unterstützung für Vergleichsbewertung der Modellleistung
Auswahl des am besten geeigneten Modells für verschiedene Abfragetypen

3. Sichere Code-Ausführungsumgebung

Ausführung generierten Codes in einer Sandbox-Umgebung
Verhinderung potenzieller Systemsicherheitsrisiken
Automatische Erfassung von Ausführungsergebnissen und Integration in die Antwort

Experimentelle Einrichtung

Datensatzdetails

CPCB-Überwachungsnetzwerk:

Abdeckung von über 500 Überwachungsstationen landesweit
37 Überwachungsstationen in Delhi für die Fallstudie
Tägliche Messhäufigkeit mit Qualitätskontrollmarkierungen

Evaluierungsmaßstab:

Konstruktion des VayuBench-Evaluierungsmaßstabs (Details außerhalb des Umfangs dieses Papiers)
Zusammenarbeit mit Luftqualitätsanalyseexperten zur Validierung realer Szenarien

Bewertung der Systemfähigkeiten

VayuChat unterstützt drei Hauptkategorien von Abfragen:

Direktabfragen:

„Welche Stadt hatte 2023 die höchsten PM2,5-Werte?"
„Zeige SO2-Werte für Delhi"

Diagrammgenerierung:

„Zeichne einen Trend-Diagramm für PM2,5 in Mumbai"
„Vergleiche Ozonwerte in Punjab und Gujarat"

Analyseabfragen:

„Analysiere die Korrelation zwischen Windgeschwindigkeit und PM2,5"
„Bewerte die Auswirkung von NCAP auf die Luftqualität"

Experimentelle Ergebnisse

Fallstudie zur Luftqualitätskrise in Delhi

Der Beitrag zeigt durch Zusammenarbeit mit Luftqualitätsanalysten die Verwendung von VayuChat zur Untersuchung der Ursachen der schwerwiegenden Verschmutzungszunahme im Dezember 2024 in Delhi und demonstriert den praktischen Anwendungswert des Systems.

1. Identifizierung der am stärksten verschmutzten Tage

Abfrage: „An welchen Tagen im Dezember 2024 war die Verschmutzung in Delhi am schlimmsten?"

Ergebnisse:

Datum	PM2,5 (μg/m³)
2024-12-18	344,59
2024-12-19	341,46
2024-12-17	330,25
2024-12-20	291,46
2024-12-22	285,98

2. Analyse der Beziehung zwischen Windgeschwindigkeit und Verschmutzung

Abfrage: „Verwende ein Zeitreihendiagramm, um die Verschmutzungswerte und Windgeschwindigkeiten der am stärksten verschmutzten Woche im Dezember 2024 mit den 15 Tagen davor und danach zu vergleichen"

Wichtigste Erkenntnisse:

Windgeschwindigkeit und PM2,5 zeigen eine deutliche negative Korrelation
Wenn die Windgeschwindigkeit unter 1,0 m/s fällt, übersteigt PM2,5 300 μg/m³
Selbst ein kleiner Rückgang der Windgeschwindigkeit (0,6 m/s) kann die Luftqualität schnell von „sehr schlecht" zu „kritisch" verschlechtern

3. Fünfjähriger historischer Vergleich

Abfrage: „Zeichne und vergleiche die Verschmutzungswerte der Krisenwoche im Dezember 2024 mit Daten aus den vorherigen fünf Jahren"

Erkenntnisse:

2024 zeigte leicht verbesserte Windgeschwindigkeiten im Vergleich zu Vorjahren
2019 und 2020 zeigten starke negative Korrelation zwischen PM2,5 und Windgeschwindigkeit
2023 verzeichnete die niedrigste Windgeschwindigkeit (0,6 m/s)
2021 hatte die höchsten PM2,5-Werte (325 μg/m³)

4. Analyse der Korrelation mehrerer Schadstoffe

Abfrage: „Analysiere die Korrelation zwischen CO, NO2 und PM2,5 im Dezember in Delhi seit 2017"

Korrelationsmatrix:

Schadstoff	CO	NO2	PM2,5
CO	1	0,3	0,47
NO2	0,3	1	0,34
PM2,5	0,47	0,34	1

Erkenntnisse: PM2,5 zeigt die stärkste Korrelation mit CO (r=0,47), was darauf hindeutet, dass gemeinsame Quellen wie Fahrzeugemissionen, Strohverbrennung und Industrieemissionen synchrone Verschmutzungsereignisse verursachen.

Systemleistung

Erfolgreiche Verarbeitung komplexer mehrstufiger Analyseabfragen
Generierung präziser Visualisierungsdiagramme
Bereitstellung verifizierbaren Python-Codes
Unterstützung für vollständige Analyseworkflows von Krisenerkennung bis zur mechanistischen Einsicht

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

Technische Machbarkeit: LLMs können komplexe Umweltdatenabfragen effektiv verarbeiten; der Codegenerierungsmechanismus gewährleistet Ergebnisgenauigkeit
Praktischer Wert: Das System unterstützte erfolgreich die tiefgreifende Analyse der Luftverschmutzungskrise in Delhi und zeigt reales Anwendungspotenzial
Verbesserte Zugänglichkeit: Senkt erheblich die technischen Hürden der Umweltdatenanalyse und ermöglicht es nicht-technischen Benutzern, komplexe Analysen durchzuführen

Einschränkungen

Begrenzte Datensatzabdeckung: Basiert derzeit hauptsächlich auf indischen CPCB-Daten mit begrenzter geografischer Abdeckung
Mangelnde Echtzeitfähigkeit: Noch keine Integration von Echtzeitdatenströmen; Analysen basieren auf historischen Daten
Modellabhängigkeit: Systemleistung hängt von der Codegenerierungsfähigkeit des zugrunde liegenden LLM ab
Verarbeitung komplexer Abfragen: Automatische Abfragezerlegung und mehrstufiges Reasoning noch nicht implementiert

Zukünftige Richtungen

Echtzeitdatenintegration: API-Integration von Echtzeitluftqualitätsdatenströmen
Datenerweiterung: Hinzufügung von ERA5-Reanalysedaten, Satellitenprodukten, Landnutzung und Emissionsinventaren
Modell-Feinabstimmung: Spezialisierte Modelloptimierung für den Umweltbereich
Automatisierte Reasoning-Workflows: Implementierung automatischer Abfragezerlegung und mehrstufiger Analyse

Tiefgreifende Bewertung

Stärken

Hohe Innovativität: Erstes LLM-gestütztes Konversationsanalysesystem für Umweltdaten mit neuartiger technischer Route
Hoher praktischer Wert: Demonstration des realen Anwendungswerts durch die Delhi-Verschmutzungsfallstudie mit wichtiger Bedeutung für die Politikgestaltung
Vernünftige technische Lösung: Der Designansatz zur Halluzinationsreduktion durch Codegenerierung ist wissenschaftlich fundiert und praktikabel
Systemische Vollständigkeit: Bildet einen vollständigen Kreislauf von Datenintegration, Modellauswahl bis zur Ergebnisanzeige
Hohe Transparenz: Bereitstellung generierten Codes gewährleistet Verifizierbarkeit und Reproduzierbarkeit der Ergebnisse

Mängel

Unzureichende Bewertung: VayuBench-Details nicht im Text dargestellt; mangelnde quantitative Leistungsbewertung
Begrenzte Fallstudien: Hauptsächlich auf einzelne Delhi-Fallstudie gestützt; mangelnde umfassendere Validierung
Unzureichende technische Details: Beschreibung von LLM-Feinabstimmung, Prompt-Engineering und anderen Schlüsseltechniken nicht detailliert genug
Fehlerbehandlungsmechanismus: Strategien zur Behandlung von Codegenerierungsfehlern oder Ausführungsfehlern nicht ausführlich diskutiert
Bewertung der Benutzererfahrung: Mangel an Feedback von echten Benutzern und Zufriedenheitsbewertung

Auswirkungen

Akademischer Beitrag: Bietet wichtige Referenz für die Anwendung von LLMs in der Umweltwissenschaft
Gesellschaftlicher Wert: Trägt zur Verbesserung der Effizienz der Umweltdatennutzung und Unterstützung besserer Politikentscheidungen bei
Technologische Demonstration: Bietet Designideen für spezialisierte Datenanalysesysteme in anderen Bereichen
Offenheit: Öffentliche Systembereitstellung fördert Technologieverbreitung und Anwendung

Anwendungsszenarien

Regierungsentscheidungsfindung: Umweltabteilungen bei Politikgestaltung und Projektbewertung
Akademische Forschung: Umweltwissenschaft und Forschung im Bereich öffentliche Gesundheit
Nachrichtenmedien: Datengestützte Umweltberichterstattung
Öffentliche Bildung: Erhöhung des öffentlichen Bewusstseins für Luftqualitätsprobleme
NGO-Organisationen: Umweltüberwachung und Advocacy-Aktivitäten

Literaturverzeichnis

Der Beitrag zitiert 15 relevante Literaturquellen, die LLM-Grundlagentechnologie, Werkzeuge zur Umweltdatenanalyse, Gesundheitsauswirkungen von Luftverschmutzung und andere Aspekte abdecken und eine ausreichende theoretische Grundlage und Vergleichsreferenzen für die Forschung bieten.

Gesamtbewertung: Dies ist ein ausgezeichnetes Papier, das technische Innovation mit praktischer Anwendung verbindet und bahnbrechende Bedeutung für die Anwendung von LLMs in der Umweltwissenschaft hat. Das Systemdesign ist vernünftig, die praktische Fallstudienanalyse ist tiefgreifend, und es hat wichtigen Wert für die Lösung von Umweltdatennutzungsproblemen in Entwicklungsländern wie Indien. Obwohl es Raum für Verbesserungen in der Bewertung und technischen Details gibt, ist der Gesamtbeitrag erheblich und hat gute Aussichten für Förderung und Anwendung.