2025-11-11T14:34:09.551839

VayuChat: An LLM-Powered Conversational Interface for Air Quality Data Analytics

Acharya, Pisharodi, Mondal et al.
Air pollution causes about 1.6 million premature deaths each year in India, yet decision makers struggle to turn dispersed data into decisions. Existing tools require expertise and provide static dashboards, leaving key policy questions unresolved. We present VayuChat, a conversational system that answers natural language questions on air quality, meteorology, and policy programs, and responds with both executable Python code and interactive visualizations. VayuChat integrates data from Central Pollution Control Board (CPCB) monitoring stations, state-level demographics, and National Clean Air Programme (NCAP) funding records into a unified interface powered by large language models. Our live demonstration will show how users can perform complex environmental analytics through simple conversations, making data science accessible to policymakers, researchers, and citizens. The platform is publicly deployed at https://huggingface.co/spaces/SustainabilityLabIITGN/ VayuChat. For further information check out video uploaded on https://www.youtube.com/watch?v=d6rklL05cs4.
academic

VayuChat: Eine LLM-gestützte Konversationsschnittstelle für die Luftqualitätsdatenanalyse

Grundinformationen

Zusammenfassung

In Indien führt Luftverschmutzung jährlich zu etwa 1,6 Millionen vorzeitigen Todesfällen, doch Entscheidungsträger haben Schwierigkeiten, verstreute Daten in Entscheidungsgrundlagen umzuwandeln. Bestehende Werkzeuge erfordern Fachkenntnisse und bieten nur statische Dashboards, ohne kritische politische Fragen zu adressieren. Dieser Beitrag präsentiert VayuChat, ein Konversationssystem, das Fragen zur Luftqualität, Meteorologie und Politikprogrammen in natürlicher Sprache beantworten kann und ausführbaren Python-Code sowie interaktive Visualisierungen bereitstellt. VayuChat integriert Daten von Überwachungsstationen der Central Pollution Control Board (CPCB), Bevölkerungsdaten auf Staatsebene und Finanzierungsunterlagen des National Clean Air Plan (NCAP) über eine von großen Sprachmodellen angetriebene einheitliche Schnittstelle. Die Plattform ermöglicht es Politikern, Forschern und Bürgern, komplexe Umweltanalysen durch einfache Konversation durchzuführen.

Forschungshintergrund und Motivation

Problembeschreibung

  1. Schwerwiegende Krise der öffentlichen Gesundheit: Luftverschmutzung in Indien führt jährlich zu 1,6 Millionen vorzeitigen Todesfällen; PM2,5-Exposition reduziert die Lebenserwartung um über 5 Jahre
  2. Hindernisse bei der Datennutzung: Obwohl die CPCB kontinuierlich nationale Schadstoffmessungen erfasst, bleibt die Umwandlung von Rohdaten in zeitnahe politikrelevante Erkenntnisse schwierig
  3. Hohe technische Hürden: Bestehende Werkzeuge erfordern Fachkenntnisse, bieten begrenzte Visualisierungsfunktionen oder behandeln nur enge Aufgabenbereiche

Einschränkungen bestehender Ansätze

  • Erfordern spezialisierte technische Fähigkeiten zur Verwendung
  • Bieten statische Dashboards ohne Interaktivität
  • Können keine komplexen datensatzübergreifenden Analysen durchführen
  • Einfache Abfragen wie „Wie hat sich PM2,5 in Delhi im letzten Jahr verändert?" sind schwer zu beantworten
  • Politische Fragen wie „Welche Städte haben PM2,5 relativ zur NCAP-Finanzierung am meisten reduziert?" erfordern die Integration von Verschmutzungs-, Finanzierungs- und Bevölkerungsdaten

Forschungsmotivation

Nutzung der Fähigkeiten großer Sprachmodelle zur Verarbeitung natürlicher Sprache und Codegenerierung zur Konstruktion eines Systems, das:

  • Die technischen Hürden der Umweltdatenanalyse senkt
  • Transparente und reproduzierbare Analyseergebnisse liefert
  • Mehrere heterogene Datenquellen integriert
  • Komplexe politikrelevante Abfragen unterstützt

Kernbeiträge

  1. Entwicklung des ersten LLM-gestützten Konversationssystems für Luftqualitätsanalyse: VayuChat kann Abfragen in natürlicher Sprache verarbeiten und ausführbaren Python-Code sowie Visualisierungsergebnisse generieren
  2. Integration mehrerer Umweltdatenquellen: Kombination von CPCB-Luftqualitäts- und Meteorologiebeobachtungsdaten (2017-2024), Bevölkerungs- und Flächendaten auf Staatsebene, NCAP-Finanzierungsverteilungsunterlagen
  3. Transparenter Codegenerierungsmechanismus: Durch die Generierung von Python-Code anstelle direkter Ausgaben werden Halluzinationen reduziert und die Verifizierbarkeit sowie Reproduzierbarkeit der Ergebnisse gewährleistet
  4. Unterstützung mehrerer Analysetypen: Einschließlich direkter Abfragen, Diagrammgenerierung, Korrelationsanalyse und Bewertung politischer Auswirkungen
  5. Validierung durch praktische Fallstudien: Tiefgreifende Analyse der Luftverschmutzungskrise in Delhi im Dezember 2024 demonstriert den praktischen Wert des Systems

Methodische Details

Aufgabendefinition

Eingabe: Abfrage des Benutzers in natürlicher Sprache zu Luftqualität, Meteorologiedaten oder Politikanalyse Ausgabe:

  • Ausführbarer Python-Code
  • Datenanalyseergebnisse (Text, Tabellen oder Visualisierungsdiagramme)
  • Direkte Antwort auf die Abfrage

Einschränkungen:

  • Code muss auf vordefinierten Datensatzschemata basieren
  • Ergebnisse müssen verifizierbar und reproduzierbar sein
  • Unterstützung für Vergleichsbewertung mehrerer LLM-Modelle

Systemarchitektur

Frontend-Schnittstellendesign

VayuChat bietet eine browsergestützte Schnittstelle mit vier Kernfunktionsmodulen:

  1. Modellwähler: Unterstützt mehrere State-of-the-Art-Modelle (GPT-OSS 20B/120B, Qwen3-32B, Llama-Serie, DeepSeek-R1, Gemini usw.)
  2. Schnellabfrageoptiionen: Vordefinierte Abfragetemplates zu Luftqualität
  3. Benutzerdefinierte Abfrageeingabe: Unterstützt beliebige Abfragen in natürlicher Sprache
  4. Code-Anzeigebereich: Zeigt generierten Python-Code zur Gewährleistung der Transparenz

Backend-Verarbeitungsablauf

Benutzerabfrage → Systemaufforderungskombination → LLM-Codegenerierung → Sandbox-Ausführung → Ergebnisanzeige

Datensatzintegration

CPCB-Datensatz:

  • Zeitraum: 2017-2024
  • Schadstoffindikatoren: PM2,5, PM10, NO, NO2, NOx, NH3, SO2, CO, Ozon (Einheiten: μg/m³ usw.)
  • Meteorologische Variablen: Lufttemperatur, relative Luftfeuchte, Windgeschwindigkeit, Windrichtung, Niederschlag, Sonneneinstrahlung, Luftdruck, vertikale Windgeschwindigkeit
  • Stationsmetadaten: Stadt, Bundesstaat, von der CPCB zugewiesene Stations-ID

Bevölkerungsdaten auf Staatsebene:

  • Abdeckung von 31 indischen Regionen
  • Enthält Volkszählungsdaten von 2011
  • Flächeninformationen (km²)
  • Kennzeichnung von Unionsterritorien

NCAP-Finanzierungsdaten:

  • Zeitraum: 2019-2022
  • Aufzeichnung der Finanzierungsverteilung pro Stadt nach Haushaltsjahr
  • Status der Mittelverwendung bis Juni 2022

Technische Innovationen

1. Halluzinationsreduktionsmechanismus basierend auf Codegenerierung

Traditionelle Methoden, die LLMs Rohtabellendaten bereitstellen, führen leicht zu Halluzinationen. VayuChat wendet folgende Strategien an:

  • Bereitstellung von Datensatzschemabeschreibungen in der Systemaufforderung
  • LLM generiert Python-Code statt direkter Antworten
  • Codeausführung gewährleistet Ergebnisgenauigkeit

2. Multi-Modell-Unterstützungsarchitektur

  • Integration von Open-Source-Modellen (über Groq Cloud API) und kommerziellen Modellen (über Gemini API)
  • Unterstützung für Vergleichsbewertung der Modellleistung
  • Auswahl des am besten geeigneten Modells für verschiedene Abfragetypen

3. Sichere Code-Ausführungsumgebung

  • Ausführung generierten Codes in einer Sandbox-Umgebung
  • Verhinderung potenzieller Systemsicherheitsrisiken
  • Automatische Erfassung von Ausführungsergebnissen und Integration in die Antwort

Experimentelle Einrichtung

Datensatzdetails

CPCB-Überwachungsnetzwerk:

  • Abdeckung von über 500 Überwachungsstationen landesweit
  • 37 Überwachungsstationen in Delhi für die Fallstudie
  • Tägliche Messhäufigkeit mit Qualitätskontrollmarkierungen

Evaluierungsmaßstab:

  • Konstruktion des VayuBench-Evaluierungsmaßstabs (Details außerhalb des Umfangs dieses Papiers)
  • Zusammenarbeit mit Luftqualitätsanalyseexperten zur Validierung realer Szenarien

Bewertung der Systemfähigkeiten

VayuChat unterstützt drei Hauptkategorien von Abfragen:

Direktabfragen:

  • „Welche Stadt hatte 2023 die höchsten PM2,5-Werte?"
  • „Zeige SO2-Werte für Delhi"

Diagrammgenerierung:

  • „Zeichne einen Trend-Diagramm für PM2,5 in Mumbai"
  • „Vergleiche Ozonwerte in Punjab und Gujarat"

Analyseabfragen:

  • „Analysiere die Korrelation zwischen Windgeschwindigkeit und PM2,5"
  • „Bewerte die Auswirkung von NCAP auf die Luftqualität"

Experimentelle Ergebnisse

Fallstudie zur Luftqualitätskrise in Delhi

Der Beitrag zeigt durch Zusammenarbeit mit Luftqualitätsanalysten die Verwendung von VayuChat zur Untersuchung der Ursachen der schwerwiegenden Verschmutzungszunahme im Dezember 2024 in Delhi und demonstriert den praktischen Anwendungswert des Systems.

1. Identifizierung der am stärksten verschmutzten Tage

Abfrage: „An welchen Tagen im Dezember 2024 war die Verschmutzung in Delhi am schlimmsten?"

Ergebnisse:

DatumPM2,5 (μg/m³)
2024-12-18344,59
2024-12-19341,46
2024-12-17330,25
2024-12-20291,46
2024-12-22285,98

2. Analyse der Beziehung zwischen Windgeschwindigkeit und Verschmutzung

Abfrage: „Verwende ein Zeitreihendiagramm, um die Verschmutzungswerte und Windgeschwindigkeiten der am stärksten verschmutzten Woche im Dezember 2024 mit den 15 Tagen davor und danach zu vergleichen"

Wichtigste Erkenntnisse:

  • Windgeschwindigkeit und PM2,5 zeigen eine deutliche negative Korrelation
  • Wenn die Windgeschwindigkeit unter 1,0 m/s fällt, übersteigt PM2,5 300 μg/m³
  • Selbst ein kleiner Rückgang der Windgeschwindigkeit (0,6 m/s) kann die Luftqualität schnell von „sehr schlecht" zu „kritisch" verschlechtern

3. Fünfjähriger historischer Vergleich

Abfrage: „Zeichne und vergleiche die Verschmutzungswerte der Krisenwoche im Dezember 2024 mit Daten aus den vorherigen fünf Jahren"

Erkenntnisse:

  • 2024 zeigte leicht verbesserte Windgeschwindigkeiten im Vergleich zu Vorjahren
  • 2019 und 2020 zeigten starke negative Korrelation zwischen PM2,5 und Windgeschwindigkeit
  • 2023 verzeichnete die niedrigste Windgeschwindigkeit (0,6 m/s)
  • 2021 hatte die höchsten PM2,5-Werte (325 μg/m³)

4. Analyse der Korrelation mehrerer Schadstoffe

Abfrage: „Analysiere die Korrelation zwischen CO, NO2 und PM2,5 im Dezember in Delhi seit 2017"

Korrelationsmatrix:

SchadstoffCONO2PM2,5
CO10,30,47
NO20,310,34
PM2,50,470,341

Erkenntnisse: PM2,5 zeigt die stärkste Korrelation mit CO (r=0,47), was darauf hindeutet, dass gemeinsame Quellen wie Fahrzeugemissionen, Strohverbrennung und Industrieemissionen synchrone Verschmutzungsereignisse verursachen.

Systemleistung

  • Erfolgreiche Verarbeitung komplexer mehrstufiger Analyseabfragen
  • Generierung präziser Visualisierungsdiagramme
  • Bereitstellung verifizierbaren Python-Codes
  • Unterstützung für vollständige Analyseworkflows von Krisenerkennung bis zur mechanistischen Einsicht

Verwandte Arbeiten

Werkzeuge zur Umweltdatenanalyse

  • openair R-Paket: Professionelles Werkzeug zur Luftqualitätsdatenanalyse, erfordert jedoch R-Programmierkenntnisse
  • Offizielles CPCB-Dashboard: Bietet Echtzeitdaten, aber begrenzte Funktionalität und mangelnde tiefgreifende Analysefähigkeiten
  • Traditionelle BI-Werkzeuge: Erfordern Fachkenntnisse zur Konfiguration, schwierig bei der Verarbeitung von Abfragen in natürlicher Sprache

LLM-Codegenerierung

  • GPT-3/4-Codefähigkeiten: Zeigen hervorragende Leistung bei allgemeinen Programmieraufgaben, aber mangelnde domänenspezifische Optimierung
  • Anweisungsfolgende Modelle: Zeigen Potenzial bei Tabellenableitungsaufgaben, aber begrenzte Anwendungen im Umweltbereich
  • Null-Shot-Tabellenableitung: Verwandte Techniken bilden die Grundlage für den Ansatz dieses Beitrags

Konversative Datenanalyse

Dieser Beitrag ist das erste LLM-gestützte Konversationssystem speziell für Umweltdatenanalyse und füllt eine Lücke in diesem Bereich.

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

  1. Technische Machbarkeit: LLMs können komplexe Umweltdatenabfragen effektiv verarbeiten; der Codegenerierungsmechanismus gewährleistet Ergebnisgenauigkeit
  2. Praktischer Wert: Das System unterstützte erfolgreich die tiefgreifende Analyse der Luftverschmutzungskrise in Delhi und zeigt reales Anwendungspotenzial
  3. Verbesserte Zugänglichkeit: Senkt erheblich die technischen Hürden der Umweltdatenanalyse und ermöglicht es nicht-technischen Benutzern, komplexe Analysen durchzuführen

Einschränkungen

  1. Begrenzte Datensatzabdeckung: Basiert derzeit hauptsächlich auf indischen CPCB-Daten mit begrenzter geografischer Abdeckung
  2. Mangelnde Echtzeitfähigkeit: Noch keine Integration von Echtzeitdatenströmen; Analysen basieren auf historischen Daten
  3. Modellabhängigkeit: Systemleistung hängt von der Codegenerierungsfähigkeit des zugrunde liegenden LLM ab
  4. Verarbeitung komplexer Abfragen: Automatische Abfragezerlegung und mehrstufiges Reasoning noch nicht implementiert

Zukünftige Richtungen

  1. Echtzeitdatenintegration: API-Integration von Echtzeitluftqualitätsdatenströmen
  2. Datenerweiterung: Hinzufügung von ERA5-Reanalysedaten, Satellitenprodukten, Landnutzung und Emissionsinventaren
  3. Modell-Feinabstimmung: Spezialisierte Modelloptimierung für den Umweltbereich
  4. Automatisierte Reasoning-Workflows: Implementierung automatischer Abfragezerlegung und mehrstufiger Analyse

Tiefgreifende Bewertung

Stärken

  1. Hohe Innovativität: Erstes LLM-gestütztes Konversationsanalysesystem für Umweltdaten mit neuartiger technischer Route
  2. Hoher praktischer Wert: Demonstration des realen Anwendungswerts durch die Delhi-Verschmutzungsfallstudie mit wichtiger Bedeutung für die Politikgestaltung
  3. Vernünftige technische Lösung: Der Designansatz zur Halluzinationsreduktion durch Codegenerierung ist wissenschaftlich fundiert und praktikabel
  4. Systemische Vollständigkeit: Bildet einen vollständigen Kreislauf von Datenintegration, Modellauswahl bis zur Ergebnisanzeige
  5. Hohe Transparenz: Bereitstellung generierten Codes gewährleistet Verifizierbarkeit und Reproduzierbarkeit der Ergebnisse

Mängel

  1. Unzureichende Bewertung: VayuBench-Details nicht im Text dargestellt; mangelnde quantitative Leistungsbewertung
  2. Begrenzte Fallstudien: Hauptsächlich auf einzelne Delhi-Fallstudie gestützt; mangelnde umfassendere Validierung
  3. Unzureichende technische Details: Beschreibung von LLM-Feinabstimmung, Prompt-Engineering und anderen Schlüsseltechniken nicht detailliert genug
  4. Fehlerbehandlungsmechanismus: Strategien zur Behandlung von Codegenerierungsfehlern oder Ausführungsfehlern nicht ausführlich diskutiert
  5. Bewertung der Benutzererfahrung: Mangel an Feedback von echten Benutzern und Zufriedenheitsbewertung

Auswirkungen

  1. Akademischer Beitrag: Bietet wichtige Referenz für die Anwendung von LLMs in der Umweltwissenschaft
  2. Gesellschaftlicher Wert: Trägt zur Verbesserung der Effizienz der Umweltdatennutzung und Unterstützung besserer Politikentscheidungen bei
  3. Technologische Demonstration: Bietet Designideen für spezialisierte Datenanalysesysteme in anderen Bereichen
  4. Offenheit: Öffentliche Systembereitstellung fördert Technologieverbreitung und Anwendung

Anwendungsszenarien

  1. Regierungsentscheidungsfindung: Umweltabteilungen bei Politikgestaltung und Projektbewertung
  2. Akademische Forschung: Umweltwissenschaft und Forschung im Bereich öffentliche Gesundheit
  3. Nachrichtenmedien: Datengestützte Umweltberichterstattung
  4. Öffentliche Bildung: Erhöhung des öffentlichen Bewusstseins für Luftqualitätsprobleme
  5. NGO-Organisationen: Umweltüberwachung und Advocacy-Aktivitäten

Literaturverzeichnis

Der Beitrag zitiert 15 relevante Literaturquellen, die LLM-Grundlagentechnologie, Werkzeuge zur Umweltdatenanalyse, Gesundheitsauswirkungen von Luftverschmutzung und andere Aspekte abdecken und eine ausreichende theoretische Grundlage und Vergleichsreferenzen für die Forschung bieten.


Gesamtbewertung: Dies ist ein ausgezeichnetes Papier, das technische Innovation mit praktischer Anwendung verbindet und bahnbrechende Bedeutung für die Anwendung von LLMs in der Umweltwissenschaft hat. Das Systemdesign ist vernünftig, die praktische Fallstudienanalyse ist tiefgreifend, und es hat wichtigen Wert für die Lösung von Umweltdatennutzungsproblemen in Entwicklungsländern wie Indien. Obwohl es Raum für Verbesserungen in der Bewertung und technischen Details gibt, ist der Gesamtbeitrag erheblich und hat gute Aussichten für Förderung und Anwendung.