Geographic data is vital in understanding, analyzing, and contextualizing energy usage at the regional level within electricity systems. While geospatial visualizations of electricity infrastructure and distributions of production and consumption are available from governmental and third-party sources, these sources are often disparate, and compatible geographic datasets remain scarce. In this paper, we present a comprehensive geographic dataset representing the electricity system in Norway. We collect data from multiple authoritative sources, process it into widely accepted formats, and generate interactive maps based on this data. Our dataset includes information for each municipality in Norway for the year 2024, encompassing electricity infrastructure, consumption, renewable and conventional production, main power grid topology, relevant natural resources, and population demographics. This work results in a formatted geographic dataset that integrates diverse informational resources, along with openly released interactive maps. We anticipate that our dataset will alleviate software incompatibilities in data retrieval, and facilitate joint analyses on regional electricity system for energy researchers, stakeholders, and developers.
- Paper-ID: 2510.09698
- Titel: Norwegian Electricity in Geographic Dataset (NoreGeo)
- Autoren: Shiliang Zhang (Universität Oslo), Sabita Maharjan (Universität Oslo), Kai Strunz (Technische Universität Berlin), Jan Christian Bryne (Google Cloud Norway)
- Klassifizierung: cs.CY (Informatik und Gesellschaft)
- Veröffentlichungsdatum: 9. Oktober 2025
- Paper-Link: https://arxiv.org/abs/2510.09698v1
- Datensatz-Link: https://doi.org/10.5281/zenodo.16794603
Geografische Daten sind entscheidend für das Verständnis, die Analyse und Kontextualisierung der Energienutzung auf regionaler Ebene. Obwohl Regierungen und Drittquellen geospatiale Visualisierungen der Elektrizitätsinfrastruktur sowie der Produktions- und Verbrauchsverteilung bereitstellen, sind diese Quellen häufig verstreut und kompatible geografische Datensätze bleiben selten. Dieser Beitrag präsentiert einen umfassenden geografischen Datensatz, der das norwegische Elektrizitätssystem darstellt. Das Forschungsteam sammelte Daten aus mehreren maßgeblichen Quellen, verarbeitete diese in weit verbreitete Formate und erstellte auf dieser Grundlage interaktive Karten. Der Datensatz enthält Informationen für jeden Gemeindebezirk Norwegens im Jahr 2024 und umfasst Elektrizitätsinfrastruktur, Verbrauch, erneuerbare und konventionelle Stromerzeugung, Hochspannungsnetzstopologie, relevante Naturressourcen und demografische Daten. Diese Arbeit erzeugt einen formatierten geografischen Datensatz, der vielfältige Informationsressourcen integriert, und stellt interaktive Karten mit offener Zugangsweise bereit.
- Datenzersplitterungsproblem: Vorhandene geospatiale Daten von Elektrizitätssystemen stammen aus verstreuten Quellen und bieten typischerweise nur begrenzte Merkmale, was die Praktikabilität der Daten einschränkt und umfassende Analysen behindert
- Formatkompatibilitätsproblem: Mangel an mit GIS-Plattformen (wie QGIS oder ArcGIS) kompatiblen Datensätzen, was erhebliche Anstrengungen zur Datenformatumstrukturierung erfordert
- Fehlende interaktive Visualisierung: Mangel an offenen interaktiven Karten basierend auf geografischen Energiedatensätzen, was technische Hindernisse für die intuitive Verständigung und Argumentation von Energiebeteiligten schafft
Im Kontext der Energiewende entwickelt sich das Elektrizitätssystem zu größerer Dekarbonisierung, Dezentralisierung und Digitalisierung. Da Länder bestrebt sind, variable verteilte Energieressourcen (DERs) zu integrieren und die Energieeffizienz zu verbessern, wird das Verständnis der komplexen Beziehungen zwischen Elektrizitätsinfrastruktur, Ressourcenverfügbarkeit und Nachfragemustern entscheidend. Geospatiale Datenanalyse ist zu einem leistungsstarken Werkzeug zur Visualisierung und Untersuchung dieser komplexen Dynamiken geworden.
- Daten von Regierungen und maßgeblichen Quellen sind typischerweise verstreut und merkmalsbegrenzt
- Datenformate sind nicht einheitlich, Softwarekompatibilität ist schlecht
- Mangel an umfassendem nationalen Elektrizitätssystem-Geodatensatz
- Unzureichende Rückverfolgbarkeit und Reproduzierbarkeit bestehender Datensätze
- Konstruktion eines umfassenden geografischen Datensatzes des norwegischen Elektrizitätssystems: Integration von Elektrizitätsinfrastruktur, Verbrauch, Produktion, Netztopologie, Naturressourcen und demografischen Daten für 357 norwegische Gemeindebezirke im Jahr 2024
- Bereitstellung standardisierter Datenformate: Verarbeitung von Daten in CSV- und GeoJSON-Formate, kompatibel mit führenden GIS-Plattformen
- Entwicklung interaktiver Visualisierungskarten: Erstellung öffentlich zugänglicher interaktiver Karten basierend auf dem Datensatz
- Sicherung von Datenqualität und Rückverfolgbarkeit: Datenerfassung aus maßgeblichen Quellen mit detaillierter Datenvalidierung und Qualitätsbewertung
- Förderung interdisziplinärer Forschung: Bereitstellung von Ressourcen für Energieforscher, Beteiligte und Entwickler zur Unterstützung gemeinsamer Analysen
Die Forschung verfolgte einen systematischen Datenerfassungs- und Verarbeitungsprozess:
Datenquellen:
- Statistics Norway (SSB): Nationale Statistikbehörde
- Geonorge: Nationale Kartendatenplattform
- NVE Kartkatalog: Kartenkatalog der norwegischen Wasser- und Energiebehörde
- eSett: Unausgeglichene Abrechnungsdienstleistungen des nordischen Strommarktes
- OpenStreetMap: Open-Source-Kartendaten
Technische Werkzeuge:
- QGIS und ArcGIS: Geoinformationssystem-Plattformen
- Python und Google Colab: Datenverarbeitung und -analyse
- Overpass turbo: OpenStreetMap-Datenextraktion
- Rohdaten: Monatliche Stromverbrauchsdaten auf Gemeindebezirksebene im XLSX-Format von NVE
- Zeitraum: Monatliche Verbrauchsdaten März–Dezember 2024
- Verarbeitungsmethode: Integration mit Gemeindebezirksgrenzen von Geonorge unter Verwendung von Python in Google Colab
- Ausgabeformat: CSV- und GeoJSON-Formate
- Marktausgleichsgebiete: 5 norwegische Marktausgleichsgebiete (MBA)
- Datenintegration: Kombination von MBA-Geografiegrenzen mit täglichen Strompreisen 2024 (EUR/MWh)
- Datenquellen: NVE Kartkatalog (Grenzen) und eSett (Preise)
- Auflösung: 250 m × 250 m Raster
- Datenbasis: Schätzung basierend auf Verknüpfung von SSB-Registerbevölkerung mit Grundstücksvermessungspunkten
- Formatkonvertierung: Umwandlung von GML-Format in GeoJSON- und CSV-Formate
Enthält Übertragungsnetz, Regionalnetze und Hochspannungsverteilnetze:
- Freileitungen (32–525 kV)
- Seekabel (32–170 kV)
- Transformatorenstationen (24–525 kV)
- Kapazitätsinformationen
- Wasserkraftwerke: Betriebliche und nicht betriebliche Wasserkraftwerke mit Kapazität (MW)
- Regulierungsseen: Regulierungsseen, die Wasserläufe beeinflussen
- Rohre und Tunnel: Wasserkraftinfrastruktur mit Längsinformationen
- Gemeindebezirksebene Produktionsschätzungen: NVE-Schätzungen basierend auf durchschnittlichem Wetterjahr
- Solaranlagen: Standorte und Kapazität genehmigter oder in Genehmigung befindlicher Anlagen
- Dachsolaranlagen: Beispiel der Solaranlagenverteilung in Oslo (104.024,40 Quadratmeter)
- Windkraftanlagen: Genehmigte und in Genehmigung befindliche Windkraftanlagen
- Windkraftstandorte: Genaue Standorte von 1.458 Windkraftanlagen
- Windenergiequellen: Jahresbetriebsstunden in 50 m Höhe, 1×1 km Auflösung
Die Forschung etablierte ein Klassifizierungssystem für Datengenauigkeit:
| Datentyp | Genauigkeitsstufe | Beschreibung |
|---|
| Authentisch und öffentlich | Genau | Echte Daten, die von Regierungsbehörden transparent gemacht wurden |
| Authentisch und registriert | Genau | Echte Daten, die von Energiebeteiligten an die Regierung gemeldet wurden |
| Stichprobenestimation | Hoch | Daten geschätzt durch Stichproben- und statistische Methoden |
| Schätzung | Mittel | Geschätzte Daten basierend auf angemessenen Annahmen und Bedingungen |
| Persönliche Beobachtung | Mittel | Von der Open-Source-Gemeinschaft beigetragene Daten |
Hochwertige Daten: Strompreise, Stromverbrauch, Netztopologie, Gemeindebezirksgrenzen, Preisgebiete, verschiedene Stromerzeugungsanlagendaten
Geschätzte Daten: Bevölkerungsdichte, Windenergiequellenverfügbarkeit, Gemeindebezirks-Solarstromerzeugung
Crowdsourced-Daten: Solaranlagenverteilung in Oslo
- Gesamtdatensätze: Über 600.000 Datensätze
- Geografische Abdeckung: 357 norwegische Gemeindebezirke
- Zeitspanne: 2024
- Dateianzahl: 18 Hauptdatendateien
- Formate: CSV und GeoJSON
- Norwegische tägliche Strompreise: 1.830 Datensätze
- Gemeindebezirks-Monatlicher Verbrauch: 3.580 Datensätze
- Hochspannungsnetz-Freileitungen: 145.891 Datensätze
- Seekabel: 8.762 Datensätze
- Transformatoren: 1.211 Einheiten
- Bevölkerungsverteilung: 224.541 Rasterzellen
- Wasserkraftwerke: 4.052 Einheiten
- Windkraftanlagen: 110 Anlagen
- Windkraftstandorte: 1.458 Einheiten
- Windenergiequellen: 196.318 Gebiete
- Multi-Source-Datenfusion: Integration von Daten von Regierungen, Statistikbehörden, Marktbetreibern und der Open-Source-Gemeinschaft
- Standardisierte Verarbeitung: Einheitliche Umwandlung in GIS-kompatible Formate
- Qualitätsstufung: Etablierung eines systematischen Datenqualitätsbewertungsrahmens
- Interaktive Karten: Erstellung anpassbarer interaktiver Karten basierend auf ArcGIS Online
- Mehrstufige Anzeige: Unterstützung von Datenvisualisierung in verschiedenen Maßstäben und Dimensionen
- Schnelle Aktualisierung: Codeunterstützung für schnelle Datenupdates
- Vollständig offen: Daten, Code und Karten sind alle frei zugänglich
- Reproduzierbarkeit: Bereitstellung vollständiger Datenverarbeitungscodes
- Erweiterbarkeit: Methoden anwendbar auf andere Länder und Regionen
- Infrastrukturplanung: Netzausbau und Kapazitätsplanung
- Anfälligkeitsanalyse: Vorhersage der Netzanfälligkeit und Risikobewertung
- Stromverteilung: Stromübertragungsverteilung unter Berücksichtigung geografischer Einschränkungen
- Energiepolitik: Formulierung und Bewertung regionaler Energiepolitik
- Entscheidungsunterstützung: Datenstützung für politische Entscheidungsträger
- Akademische Forschung: Förderung interdisziplinärer Energiesystemforschung
- Industrielle Anwendung: Unterstützung der Planung und des Betriebs von Energieunternehmen
- Bildung und Schulung: Verwendung als Lehrressource für Energiegeoinformationssysteme
- Energieverbrauch: Eng mit Bevölkerungsverteilung verbunden, höherer Verbrauch im Süden
- Solarstromerzeugung: Deutlich höher im Süden als im Norden
- Wasser- und Windkraft: Relativ gleichmäßige Verteilung
- Netzanbindung: Bessere Anbindung im Süden, begrenzte Nord-Süd-Übertragungskapazität
Regionen im Norden haben aufgrund von Infrastrukturunterschieden und Energieangebotsungleichgewichten typischerweise niedrigere Strompreise als Regionen im Süden.
- Zeitraum: Abdeckung nur von 2024-Daten
- Schätzgenauigkeit: Einige Daten basieren auf Schätzungen und können Abweichungen aufweisen
- Aktualisierungshäufigkeit: Statischer Datensatz, erfordert regelmäßige Aktualisierung
- Datenvollständigkeit: Verbrauchsdaten für bestimmte Monate unvollständig
- Zeitreihen-Erweiterung: Hinzufügung historischer Daten und Prognosedaten
- Echtzeitdaten: Integration von Echtzeitstromsystemdaten
- Internationale Erweiterung: Ausweitung auf andere nordische Länder
- Genauigkeitsverbesserung: Verbesserung von Schätzmethoden und Datenvalidierung
- Hohe Umfassendheit: Erstmals umfassender geografischer Datensatz des norwegischen Elektrizitätssystems
- Hoher Standardisierungsgrad: Einheitliche Datenformate erleichtern Verwendung und Analyse
- Strenge Qualitätskontrolle: Systematische Datenvalidierung und Qualitätsbewertung
- Gute Offenheit: Vollständig offene Daten, Code und Visualisierung
- Starke Praktikabilität: Direkte Unterstützung verschiedener Energiesystemanalyse-Anwendungen
- Begrenzte Zeitdimension: Nur einjährige Daten, fehlende historische Trends
- Unzureichende Dynamik: Statischer Datensatz, kann Echtzeitveränderungen nicht widerspiegeln
- Schätzungsabhängigkeit: Einige kritische Daten hängen von Schätzmethoden ab
- Geografische Einschränkung: Nur Norwegen abgedeckt, internationale Vergleiche begrenzt
- Akademischer Beitrag: Wichtige Ressource für Energiegeoinformationssystemforschung
- Politische Unterstützung: Unterstützung der Energiewende-Politikformulierung in Norwegen
- Methodisches Vorbild: Beispiel für den Aufbau ähnlicher Datensätze in anderen Ländern
- Offene Wissenschaft: Förderung offener Freigabe von Energiedaten
- Bereitstellung vollständiger Datenverarbeitungscodes
- Detaillierte Erklärung von Datenquellen und Verarbeitungsschritten
- Offene Datenspeicherung und Zugriffsmethoden
- Ausführbare Google Colab-Codebibliothek
Diese Forschung hat erfolgreich den ersten umfassenden geografischen Datensatz des norwegischen Elektrizitätssystems (NoreGeo) konstruiert, der heterogene Daten aus mehreren Quellen integriert, standardisierte Datenformate und interaktive Visualisierung bereitstellt und eine wichtige Ressource für die geospatiale Analyse von Energiesystemen darstellt.
Der Datensatz löst nicht nur das Problem der verstreuten Daten und Formatinkompatibilität, sondern bietet vor allem eine solide Datenbasis für die Analyse regionaler Elektrizitätssysteme im Kontext der Energiewende und unterstützt verschiedene Anwendungen wie Infrastrukturplanung, Anfälligkeitsanalyse und Stromverteilung.
- Zeitreihen-Erweiterung: Konstruktion mehrjähriger Datensätze zur Unterstützung von Trendanalysen
- Echtzeitdatenintegration: Integration von Echtzeitstromsystem-Betriebsdaten
- Internationale Zusammenarbeit: Zusammenarbeit mit anderen Ländern zur Konstruktion länderübergreifender Datensätze
- Intelligente Analyse: Entwicklung intelligenter Analysetools in Kombination mit maschinellem Lernen
- Dynamische Aktualisierung: Etablierung automatisierter Datenaktualisierungsmechanismen
Diese Forschung setzt neue Standards für die Anwendung von Geoinformationssystemen im Energiebereich und ihre offene Wissenschaftspraxis bietet der akademischen Gemeinschaft ein vorbildliches Beispiel.
Das Papier zitiert 24 relevante Literaturquellen, die wichtige Forschungen in mehreren Bereichen wie Energiewende, Geoinformationssysteme und offene Daten abdecken und eine solide theoretische Grundlage und methodische Anleitung für diese Forschung bieten.