2025-11-15T11:46:11.842568

Norwegian Electricity in Geographic Dataset (NoreGeo)

Zhang, Maharjan, Strunz et al.
Geographic data is vital in understanding, analyzing, and contextualizing energy usage at the regional level within electricity systems. While geospatial visualizations of electricity infrastructure and distributions of production and consumption are available from governmental and third-party sources, these sources are often disparate, and compatible geographic datasets remain scarce. In this paper, we present a comprehensive geographic dataset representing the electricity system in Norway. We collect data from multiple authoritative sources, process it into widely accepted formats, and generate interactive maps based on this data. Our dataset includes information for each municipality in Norway for the year 2024, encompassing electricity infrastructure, consumption, renewable and conventional production, main power grid topology, relevant natural resources, and population demographics. This work results in a formatted geographic dataset that integrates diverse informational resources, along with openly released interactive maps. We anticipate that our dataset will alleviate software incompatibilities in data retrieval, and facilitate joint analyses on regional electricity system for energy researchers, stakeholders, and developers.
academic

Norwegische Elektrizität im geografischen Datensatz (NoreGeo)

Grundinformationen

  • Paper-ID: 2510.09698
  • Titel: Norwegian Electricity in Geographic Dataset (NoreGeo)
  • Autoren: Shiliang Zhang (Universität Oslo), Sabita Maharjan (Universität Oslo), Kai Strunz (Technische Universität Berlin), Jan Christian Bryne (Google Cloud Norway)
  • Klassifizierung: cs.CY (Informatik und Gesellschaft)
  • Veröffentlichungsdatum: 9. Oktober 2025
  • Paper-Link: https://arxiv.org/abs/2510.09698v1
  • Datensatz-Link: https://doi.org/10.5281/zenodo.16794603

Zusammenfassung

Geografische Daten sind entscheidend für das Verständnis, die Analyse und Kontextualisierung der Energienutzung auf regionaler Ebene. Obwohl Regierungen und Drittquellen geospatiale Visualisierungen der Elektrizitätsinfrastruktur sowie der Produktions- und Verbrauchsverteilung bereitstellen, sind diese Quellen häufig verstreut und kompatible geografische Datensätze bleiben selten. Dieser Beitrag präsentiert einen umfassenden geografischen Datensatz, der das norwegische Elektrizitätssystem darstellt. Das Forschungsteam sammelte Daten aus mehreren maßgeblichen Quellen, verarbeitete diese in weit verbreitete Formate und erstellte auf dieser Grundlage interaktive Karten. Der Datensatz enthält Informationen für jeden Gemeindebezirk Norwegens im Jahr 2024 und umfasst Elektrizitätsinfrastruktur, Verbrauch, erneuerbare und konventionelle Stromerzeugung, Hochspannungsnetzstopologie, relevante Naturressourcen und demografische Daten. Diese Arbeit erzeugt einen formatierten geografischen Datensatz, der vielfältige Informationsressourcen integriert, und stellt interaktive Karten mit offener Zugangsweise bereit.

Forschungshintergrund und Motivation

Problemdefinition

  1. Datenzersplitterungsproblem: Vorhandene geospatiale Daten von Elektrizitätssystemen stammen aus verstreuten Quellen und bieten typischerweise nur begrenzte Merkmale, was die Praktikabilität der Daten einschränkt und umfassende Analysen behindert
  2. Formatkompatibilitätsproblem: Mangel an mit GIS-Plattformen (wie QGIS oder ArcGIS) kompatiblen Datensätzen, was erhebliche Anstrengungen zur Datenformatumstrukturierung erfordert
  3. Fehlende interaktive Visualisierung: Mangel an offenen interaktiven Karten basierend auf geografischen Energiedatensätzen, was technische Hindernisse für die intuitive Verständigung und Argumentation von Energiebeteiligten schafft

Forschungsbedeutung

Im Kontext der Energiewende entwickelt sich das Elektrizitätssystem zu größerer Dekarbonisierung, Dezentralisierung und Digitalisierung. Da Länder bestrebt sind, variable verteilte Energieressourcen (DERs) zu integrieren und die Energieeffizienz zu verbessern, wird das Verständnis der komplexen Beziehungen zwischen Elektrizitätsinfrastruktur, Ressourcenverfügbarkeit und Nachfragemustern entscheidend. Geospatiale Datenanalyse ist zu einem leistungsstarken Werkzeug zur Visualisierung und Untersuchung dieser komplexen Dynamiken geworden.

Einschränkungen bestehender Ansätze

  • Daten von Regierungen und maßgeblichen Quellen sind typischerweise verstreut und merkmalsbegrenzt
  • Datenformate sind nicht einheitlich, Softwarekompatibilität ist schlecht
  • Mangel an umfassendem nationalen Elektrizitätssystem-Geodatensatz
  • Unzureichende Rückverfolgbarkeit und Reproduzierbarkeit bestehender Datensätze

Kernbeiträge

  1. Konstruktion eines umfassenden geografischen Datensatzes des norwegischen Elektrizitätssystems: Integration von Elektrizitätsinfrastruktur, Verbrauch, Produktion, Netztopologie, Naturressourcen und demografischen Daten für 357 norwegische Gemeindebezirke im Jahr 2024
  2. Bereitstellung standardisierter Datenformate: Verarbeitung von Daten in CSV- und GeoJSON-Formate, kompatibel mit führenden GIS-Plattformen
  3. Entwicklung interaktiver Visualisierungskarten: Erstellung öffentlich zugänglicher interaktiver Karten basierend auf dem Datensatz
  4. Sicherung von Datenqualität und Rückverfolgbarkeit: Datenerfassung aus maßgeblichen Quellen mit detaillierter Datenvalidierung und Qualitätsbewertung
  5. Förderung interdisziplinärer Forschung: Bereitstellung von Ressourcen für Energieforscher, Beteiligte und Entwickler zur Unterstützung gemeinsamer Analysen

Methodische Erläuterung

Datenerfassungsrahmen

Die Forschung verfolgte einen systematischen Datenerfassungs- und Verarbeitungsprozess:

Datenquellen:

  • Statistics Norway (SSB): Nationale Statistikbehörde
  • Geonorge: Nationale Kartendatenplattform
  • NVE Kartkatalog: Kartenkatalog der norwegischen Wasser- und Energiebehörde
  • eSett: Unausgeglichene Abrechnungsdienstleistungen des nordischen Strommarktes
  • OpenStreetMap: Open-Source-Kartendaten

Technische Werkzeuge:

  • QGIS und ArcGIS: Geoinformationssystem-Plattformen
  • Python und Google Colab: Datenverarbeitung und -analyse
  • Overpass turbo: OpenStreetMap-Datenextraktion

Datenverarbeitungsprozess

1. Energieverbrauchsdaten

  • Rohdaten: Monatliche Stromverbrauchsdaten auf Gemeindebezirksebene im XLSX-Format von NVE
  • Zeitraum: Monatliche Verbrauchsdaten März–Dezember 2024
  • Verarbeitungsmethode: Integration mit Gemeindebezirksgrenzen von Geonorge unter Verwendung von Python in Google Colab
  • Ausgabeformat: CSV- und GeoJSON-Formate

2. Strompreisdaten

  • Marktausgleichsgebiete: 5 norwegische Marktausgleichsgebiete (MBA)
  • Datenintegration: Kombination von MBA-Geografiegrenzen mit täglichen Strompreisen 2024 (EUR/MWh)
  • Datenquellen: NVE Kartkatalog (Grenzen) und eSett (Preise)

3. Bevölkerungsdichtedaten

  • Auflösung: 250 m × 250 m Raster
  • Datenbasis: Schätzung basierend auf Verknüpfung von SSB-Registerbevölkerung mit Grundstücksvermessungspunkten
  • Formatkonvertierung: Umwandlung von GML-Format in GeoJSON- und CSV-Formate

4. Hochspannungsnetzdata

Enthält Übertragungsnetz, Regionalnetze und Hochspannungsverteilnetze:

  • Freileitungen (32–525 kV)
  • Seekabel (32–170 kV)
  • Transformatorenstationen (24–525 kV)
  • Kapazitätsinformationen

5. Wasserkraftsystemdaten

  • Wasserkraftwerke: Betriebliche und nicht betriebliche Wasserkraftwerke mit Kapazität (MW)
  • Regulierungsseen: Regulierungsseen, die Wasserläufe beeinflussen
  • Rohre und Tunnel: Wasserkraftinfrastruktur mit Längsinformationen

6. Solardaten

  • Gemeindebezirksebene Produktionsschätzungen: NVE-Schätzungen basierend auf durchschnittlichem Wetterjahr
  • Solaranlagen: Standorte und Kapazität genehmigter oder in Genehmigung befindlicher Anlagen
  • Dachsolaranlagen: Beispiel der Solaranlagenverteilung in Oslo (104.024,40 Quadratmeter)

7. Windkraftdaten

  • Windkraftanlagen: Genehmigte und in Genehmigung befindliche Windkraftanlagen
  • Windkraftstandorte: Genaue Standorte von 1.458 Windkraftanlagen
  • Windenergiequellen: Jahresbetriebsstunden in 50 m Höhe, 1×1 km Auflösung

Datenvalidierung und Qualitätskontrolle

Datenklassifizierungssystem

Die Forschung etablierte ein Klassifizierungssystem für Datengenauigkeit:

DatentypGenauigkeitsstufeBeschreibung
Authentisch und öffentlichGenauEchte Daten, die von Regierungsbehörden transparent gemacht wurden
Authentisch und registriertGenauEchte Daten, die von Energiebeteiligten an die Regierung gemeldet wurden
StichprobenestimationHochDaten geschätzt durch Stichproben- und statistische Methoden
SchätzungMittelGeschätzte Daten basierend auf angemessenen Annahmen und Bedingungen
Persönliche BeobachtungMittelVon der Open-Source-Gemeinschaft beigetragene Daten

Datenqualitätsbewertung

Hochwertige Daten: Strompreise, Stromverbrauch, Netztopologie, Gemeindebezirksgrenzen, Preisgebiete, verschiedene Stromerzeugungsanlagendaten Geschätzte Daten: Bevölkerungsdichte, Windenergiequellenverfügbarkeit, Gemeindebezirks-Solarstromerzeugung Crowdsourced-Daten: Solaranlagenverteilung in Oslo

Datensatzgröße und Struktur

Datensatzstatistiken

  • Gesamtdatensätze: Über 600.000 Datensätze
  • Geografische Abdeckung: 357 norwegische Gemeindebezirke
  • Zeitspanne: 2024
  • Dateianzahl: 18 Hauptdatendateien
  • Formate: CSV und GeoJSON

Hauptdatendateien

  1. Norwegische tägliche Strompreise: 1.830 Datensätze
  2. Gemeindebezirks-Monatlicher Verbrauch: 3.580 Datensätze
  3. Hochspannungsnetz-Freileitungen: 145.891 Datensätze
  4. Seekabel: 8.762 Datensätze
  5. Transformatoren: 1.211 Einheiten
  6. Bevölkerungsverteilung: 224.541 Rasterzellen
  7. Wasserkraftwerke: 4.052 Einheiten
  8. Windkraftanlagen: 110 Anlagen
  9. Windkraftstandorte: 1.458 Einheiten
  10. Windenergiequellen: 196.318 Gebiete

Technische Innovationspunkte

1. Datenintegrationsmethode

  • Multi-Source-Datenfusion: Integration von Daten von Regierungen, Statistikbehörden, Marktbetreibern und der Open-Source-Gemeinschaft
  • Standardisierte Verarbeitung: Einheitliche Umwandlung in GIS-kompatible Formate
  • Qualitätsstufung: Etablierung eines systematischen Datenqualitätsbewertungsrahmens

2. Visualisierungsinnovation

  • Interaktive Karten: Erstellung anpassbarer interaktiver Karten basierend auf ArcGIS Online
  • Mehrstufige Anzeige: Unterstützung von Datenvisualisierung in verschiedenen Maßstäben und Dimensionen
  • Schnelle Aktualisierung: Codeunterstützung für schnelle Datenupdates

3. Offene Wissenschaftspraxis

  • Vollständig offen: Daten, Code und Karten sind alle frei zugänglich
  • Reproduzierbarkeit: Bereitstellung vollständiger Datenverarbeitungscodes
  • Erweiterbarkeit: Methoden anwendbar auf andere Länder und Regionen

Anwendungsszenarien und Wert

Forschungsanwendungen

  1. Infrastrukturplanung: Netzausbau und Kapazitätsplanung
  2. Anfälligkeitsanalyse: Vorhersage der Netzanfälligkeit und Risikobewertung
  3. Stromverteilung: Stromübertragungsverteilung unter Berücksichtigung geografischer Einschränkungen
  4. Energiepolitik: Formulierung und Bewertung regionaler Energiepolitik

Praktischer Wert

  1. Entscheidungsunterstützung: Datenstützung für politische Entscheidungsträger
  2. Akademische Forschung: Förderung interdisziplinärer Energiesystemforschung
  3. Industrielle Anwendung: Unterstützung der Planung und des Betriebs von Energieunternehmen
  4. Bildung und Schulung: Verwendung als Lehrressource für Energiegeoinformationssysteme

Dateneinsichten

Geografische Verteilungsmerkmale

  1. Energieverbrauch: Eng mit Bevölkerungsverteilung verbunden, höherer Verbrauch im Süden
  2. Solarstromerzeugung: Deutlich höher im Süden als im Norden
  3. Wasser- und Windkraft: Relativ gleichmäßige Verteilung
  4. Netzanbindung: Bessere Anbindung im Süden, begrenzte Nord-Süd-Übertragungskapazität

Preisunterschiede

Regionen im Norden haben aufgrund von Infrastrukturunterschieden und Energieangebotsungleichgewichten typischerweise niedrigere Strompreise als Regionen im Süden.

Einschränkungen und Verbesserungsrichtungen

Aktuelle Einschränkungen

  1. Zeitraum: Abdeckung nur von 2024-Daten
  2. Schätzgenauigkeit: Einige Daten basieren auf Schätzungen und können Abweichungen aufweisen
  3. Aktualisierungshäufigkeit: Statischer Datensatz, erfordert regelmäßige Aktualisierung
  4. Datenvollständigkeit: Verbrauchsdaten für bestimmte Monate unvollständig

Zukünftige Verbesserungen

  1. Zeitreihen-Erweiterung: Hinzufügung historischer Daten und Prognosedaten
  2. Echtzeitdaten: Integration von Echtzeitstromsystemdaten
  3. Internationale Erweiterung: Ausweitung auf andere nordische Länder
  4. Genauigkeitsverbesserung: Verbesserung von Schätzmethoden und Datenvalidierung

Tiefgreifende Bewertung

Stärken

  1. Hohe Umfassendheit: Erstmals umfassender geografischer Datensatz des norwegischen Elektrizitätssystems
  2. Hoher Standardisierungsgrad: Einheitliche Datenformate erleichtern Verwendung und Analyse
  3. Strenge Qualitätskontrolle: Systematische Datenvalidierung und Qualitätsbewertung
  4. Gute Offenheit: Vollständig offene Daten, Code und Visualisierung
  5. Starke Praktikabilität: Direkte Unterstützung verschiedener Energiesystemanalyse-Anwendungen

Mängel

  1. Begrenzte Zeitdimension: Nur einjährige Daten, fehlende historische Trends
  2. Unzureichende Dynamik: Statischer Datensatz, kann Echtzeitveränderungen nicht widerspiegeln
  3. Schätzungsabhängigkeit: Einige kritische Daten hängen von Schätzmethoden ab
  4. Geografische Einschränkung: Nur Norwegen abgedeckt, internationale Vergleiche begrenzt

Auswirkungsbewertung

  1. Akademischer Beitrag: Wichtige Ressource für Energiegeoinformationssystemforschung
  2. Politische Unterstützung: Unterstützung der Energiewende-Politikformulierung in Norwegen
  3. Methodisches Vorbild: Beispiel für den Aufbau ähnlicher Datensätze in anderen Ländern
  4. Offene Wissenschaft: Förderung offener Freigabe von Energiedaten

Reproduzierbarkeit

  • Bereitstellung vollständiger Datenverarbeitungscodes
  • Detaillierte Erklärung von Datenquellen und Verarbeitungsschritten
  • Offene Datenspeicherung und Zugriffsmethoden
  • Ausführbare Google Colab-Codebibliothek

Schlussfolgerung und Ausblick

Hauptbeiträge

Diese Forschung hat erfolgreich den ersten umfassenden geografischen Datensatz des norwegischen Elektrizitätssystems (NoreGeo) konstruiert, der heterogene Daten aus mehreren Quellen integriert, standardisierte Datenformate und interaktive Visualisierung bereitstellt und eine wichtige Ressource für die geospatiale Analyse von Energiesystemen darstellt.

Wissenschaftlicher Wert

Der Datensatz löst nicht nur das Problem der verstreuten Daten und Formatinkompatibilität, sondern bietet vor allem eine solide Datenbasis für die Analyse regionaler Elektrizitätssysteme im Kontext der Energiewende und unterstützt verschiedene Anwendungen wie Infrastrukturplanung, Anfälligkeitsanalyse und Stromverteilung.

Zukünftige Richtungen

  1. Zeitreihen-Erweiterung: Konstruktion mehrjähriger Datensätze zur Unterstützung von Trendanalysen
  2. Echtzeitdatenintegration: Integration von Echtzeitstromsystem-Betriebsdaten
  3. Internationale Zusammenarbeit: Zusammenarbeit mit anderen Ländern zur Konstruktion länderübergreifender Datensätze
  4. Intelligente Analyse: Entwicklung intelligenter Analysetools in Kombination mit maschinellem Lernen
  5. Dynamische Aktualisierung: Etablierung automatisierter Datenaktualisierungsmechanismen

Diese Forschung setzt neue Standards für die Anwendung von Geoinformationssystemen im Energiebereich und ihre offene Wissenschaftspraxis bietet der akademischen Gemeinschaft ein vorbildliches Beispiel.

Literaturverzeichnis

Das Papier zitiert 24 relevante Literaturquellen, die wichtige Forschungen in mehreren Bereichen wie Energiewende, Geoinformationssysteme und offene Daten abdecken und eine solide theoretische Grundlage und methodische Anleitung für diese Forschung bieten.