2025-11-15T11:46:11.842568

Norwegian Electricity in Geographic Dataset (NoreGeo)

Zhang, Maharjan, Strunz et al.
Geographic data is vital in understanding, analyzing, and contextualizing energy usage at the regional level within electricity systems. While geospatial visualizations of electricity infrastructure and distributions of production and consumption are available from governmental and third-party sources, these sources are often disparate, and compatible geographic datasets remain scarce. In this paper, we present a comprehensive geographic dataset representing the electricity system in Norway. We collect data from multiple authoritative sources, process it into widely accepted formats, and generate interactive maps based on this data. Our dataset includes information for each municipality in Norway for the year 2024, encompassing electricity infrastructure, consumption, renewable and conventional production, main power grid topology, relevant natural resources, and population demographics. This work results in a formatted geographic dataset that integrates diverse informational resources, along with openly released interactive maps. We anticipate that our dataset will alleviate software incompatibilities in data retrieval, and facilitate joint analyses on regional electricity system for energy researchers, stakeholders, and developers.
academic

Électricité norvégienne dans un ensemble de données géographiques (NoreGeo)

Informations de base

  • ID de l'article : 2510.09698
  • Titre : Norwegian Electricity in Geographic Dataset (NoreGeo)
  • Auteurs : Shiliang Zhang (Université d'Oslo), Sabita Maharjan (Université d'Oslo), Kai Strunz (Université technique de Berlin), Jan Christian Bryne (Google Cloud Norvège)
  • Classification : cs.CY (Informatique et Société)
  • Date de publication : 9 octobre 2025
  • Lien de l'article : https://arxiv.org/abs/2510.09698v1
  • Lien de l'ensemble de données : https://doi.org/10.5281/zenodo.16794603

Résumé

Les données géographiques sont essentielles pour comprendre, analyser et contextualiser l'utilisation énergétique au niveau régional. Bien que les sources gouvernementales et tierces fournissent des visualisations géospatiales de l'infrastructure électrique ainsi que de la distribution de la production et de la consommation, ces sources sont souvent dispersées et les ensembles de données géographiques compatibles restent rares. Cet article propose un ensemble de données géographiques complet représentant le système électrique norvégien. L'équipe de recherche a collecté des données provenant de multiples sources autorisées, les a traitées dans des formats largement acceptés et a généré des cartes interactives basées sur ces données. L'ensemble de données contient des informations pour chacune des 357 municipalités norvégiennes en 2024, couvrant l'infrastructure électrique, la consommation, la production d'énergie renouvelable et conventionnelle, la topologie du réseau principal, les ressources naturelles pertinentes et les données démographiques. Ce travail a produit un ensemble de données géographiques formaté intégrant des sources d'information diversifiées et fournit des cartes interactives en accès ouvert.

Contexte et motivation de la recherche

Définition du problème

  1. Problème de dispersion des données : Les sources de données géospatiales existantes du système électrique sont dispersées, fournissant généralement des caractéristiques limitées, ce qui limite l'utilité des données et entrave l'analyse intégrée
  2. Problème de compatibilité des formats : Absence d'ensembles de données compatibles avec les plateformes SIG (telles que QGIS ou ArcGIS), nécessitant des efforts considérables pour la restructuration du format des données
  3. Absence de visualisation interactive : Manque de cartes interactives ouvertes basées sur des ensembles de données énergétiques géographiques, créant des obstacles techniques à la compréhension et au raisonnement intuitifs des parties prenantes énergétiques

Importance de la recherche

Dans le contexte de la transition énergétique, les systèmes électriques évoluent vers une plus grande décarbonisation, décentralisation et numérisation. À mesure que les pays s'efforcent d'intégrer des ressources énergétiques distribuées variables (DER) et d'améliorer l'efficacité énergétique, il devient crucial de comprendre les relations complexes entre l'infrastructure électrique, la disponibilité des ressources et les modèles de demande. L'analyse de données géospatiales est devenue un outil puissant pour visualiser et examiner ces dynamiques complexes.

Limitations des approches existantes

  • Les données des sources gouvernementales et autorisées sont généralement dispersées et présentent des caractéristiques limitées
  • Les formats de données ne sont pas uniformes et la compatibilité logicielle est insuffisante
  • Absence d'ensemble de données géographiques complet du système électrique au niveau national
  • Traçabilité et reproductibilité insuffisantes des ensembles de données existants

Contributions principales

  1. Construction d'un ensemble de données géographiques complet du système électrique norvégien : Intégration des données d'infrastructure électrique, de consommation, de production, de topologie du réseau, de ressources naturelles et de données démographiques pour les 357 municipalités norvégiennes en 2024
  2. Fourniture de formats de données standardisés : Traitement des données en formats CSV et GeoJSON, compatibles avec les principales plateformes SIG
  3. Développement de cartes de visualisation interactive : Création de cartes interactives accessibles au public basées sur l'ensemble de données
  4. Assurance de la qualité et de la traçabilité des données : Collecte de données auprès de sources autorisées, avec validation détaillée des données et évaluation de la qualité
  5. Facilitation de la recherche interdisciplinaire : Fourniture de ressources aux chercheurs en énergie, aux parties prenantes et aux développeurs pour l'analyse conjointe

Explication détaillée de la méthodologie

Cadre de collecte de données

La recherche a adopté un processus systématique de collecte et de traitement des données :

Sources de données :

  • Statistics Norway (SSB) : Institution nationale de statistique
  • Geonorge : Plateforme nationale de données cartographiques
  • NVE Kartkatalog : Catalogue cartographique de l'Office norvégien des ressources en eau et de l'énergie
  • eSett : Service de règlement des déséquilibres du marché électrique nordique
  • OpenStreetMap : Données cartographiques en source ouverte

Outils techniques :

  • QGIS et ArcGIS : Plateformes de systèmes d'information géographique
  • Python et Google Colab : Traitement et analyse des données
  • Overpass turbo : Extraction de données OpenStreetMap

Processus de traitement des données

1. Données de consommation énergétique

  • Données brutes : Données de consommation électrique au niveau municipal au format XLSX obtenues auprès de NVE
  • Plage temporelle : Données de consommation mensuelle de mars à décembre 2024
  • Méthode de traitement : Intégration combinant les limites géographiques municipales de Geonorge, utilisant Python dans Google Colab
  • Format de sortie : Formats CSV et GeoJSON

2. Données de prix de l'électricité

  • Zones d'équilibre du marché : 5 zones d'équilibre du marché (MBA) en Norvège
  • Intégration des données : Combinaison des limites géographiques de la MBA avec les prix quotidiens de l'électricité 2024 (EUR/MWh)
  • Sources de données : NVE Kartkatalog (limites) et eSett (prix)

3. Données de densité de population

  • Résolution : Grille 250 m × 250 m
  • Base de données : Estimation basée sur le lien entre les registres de population de SSB et les points d'adresses cadastrales
  • Conversion de format : Conversion du format GML en formats GeoJSON et CSV

4. Données du réseau principal

Contenant le réseau de transmission, les zones et le réseau de distribution haute tension :

  • Câbles aériens (32-525 kV)
  • Câbles sous-marins (32-170 kV)
  • Postes de transformation (24-525 kV)
  • Informations de capacité

5. Données du système hydroélectrique

  • Centrales hydroélectriques : Centrales hydroélectriques en exploitation et non exploitées avec leur capacité (MW)
  • Lacs de régulation : Lacs de régulation affectant les cours d'eau
  • Conduites et tunnels : Infrastructure hydroélectrique contenant des informations de longueur

6. Données solaires

  • Estimation de production au niveau municipal : Estimation de NVE basée sur l'année météorologique moyenne
  • Centrales solaires : Localisation et capacité des centrales autorisées ou en demande d'autorisation
  • Panneaux solaires sur toits : Exemple de distribution de panneaux solaires à Oslo (104 024,40 mètres carrés)

7. Données éoliennes

  • Parcs éoliens : Parcs éoliens autorisés et en demande d'autorisation
  • Localisation des éoliennes : Localisation précise de 1 458 éoliennes
  • Ressources éoliennes : Heures de fonctionnement annuelles à 50 mètres de hauteur, résolution 1 × 1 kilomètre

Validation des données et contrôle de la qualité

Système de classification des données

La recherche a établi un système de classification de la précision des données :

Type de donnéesNiveau de précisionDescription
Réel et publicPrécisDonnées réelles transparentes des institutions gouvernementales
Réel et enregistréPrécisDonnées réelles déclarées aux gouvernements par les parties prenantes énergétiques
Estimation par échantillonnageÉlevéDonnées estimées par des méthodes d'échantillonnage et statistiques
EstimationMoyenDonnées estimées basées sur des hypothèses et conditions raisonnables
Observation personnelleMoyenDonnées contribuées par des individus de la communauté en source ouverte

Évaluation de la qualité des données

Données de haute qualité : Prix de l'électricité, consommation électrique, topologie du réseau, limites municipales, zones de prix, données de diverses centrales électriques Données estimées : Densité de population, disponibilité des ressources éoliennes, production solaire municipale Données participatives : Distribution des panneaux solaires à Oslo

Taille et structure de l'ensemble de données

Statistiques de l'ensemble de données

  • Nombre total d'enregistrements : Plus de 600 000 enregistrements
  • Couverture géographique : 357 municipalités norvégiennes
  • Étendue temporelle : 2024
  • Nombre de fichiers : 18 fichiers de données principaux
  • Formats : CSV et GeoJSON

Fichiers de données principaux

  1. Prix quotidiens de l'électricité norvégienne : 1 830 enregistrements
  2. Consommation mensuelle municipale : 3 580 enregistrements
  3. Lignes aériennes du réseau principal : 145 891 enregistrements
  4. Câbles sous-marins : 8 762 enregistrements
  5. Transformateurs : 1 211 unités
  6. Distribution de population : 224 541 grilles
  7. Centrales hydroélectriques : 4 052 unités
  8. Parcs éoliens : 110 unités
  9. Localisation des éoliennes : 1 458 unités
  10. Ressources éoliennes : 196 318 zones

Points d'innovation technique

1. Méthode d'intégration des données

  • Fusion de données multi-sources : Intégration de données provenant d'institutions gouvernementales, d'organismes statistiques, d'opérateurs de marché et de la communauté en source ouverte
  • Traitement standardisé : Conversion uniforme en formats compatibles SIG
  • Classification de la qualité : Établissement d'un cadre systématique d'évaluation de la qualité des données

2. Innovation en visualisation

  • Cartes interactives : Création de cartes interactives personnalisables basées sur ArcGIS Online
  • Affichage multi-niveaux : Support de la visualisation des données à différentes échelles et dimensions
  • Mise à jour en temps réel : Fourniture de code pour la mise à jour rapide des données

3. Pratiques de science ouverte

  • Ouverture complète : Données, code et cartes entièrement en accès ouvert
  • Reproductibilité : Fourniture de code complet de traitement des données
  • Extensibilité : La méthodologie peut être appliquée à d'autres pays et régions

Scénarios d'application et valeur

Applications de recherche

  1. Planification des infrastructures : Expansion du réseau et planification de la capacité
  2. Analyse de vulnérabilité : Prédiction de la vulnérabilité du réseau et évaluation des risques
  3. Dispatch électrique : Dispatch de transmission électrique tenant compte des contraintes géographiques
  4. Politique énergétique : Formulation et évaluation des politiques énergétiques régionales

Valeur pratique

  1. Soutien à la décision : Fourniture de données aux décideurs politiques
  2. Recherche académique : Promotion de la recherche interdisciplinaire sur les systèmes énergétiques
  3. Applications industrielles : Soutien à la planification et à l'exploitation des entreprises énergétiques
  4. Éducation et formation : Ressource pédagogique pour l'enseignement des systèmes d'information géographique énergétique

Perspectives de données

Caractéristiques de distribution géographique

  1. Consommation énergétique : Étroitement liée à la distribution de la population, consommation plus élevée dans le sud
  2. Production solaire : Significativement plus élevée dans le sud que dans le nord
  3. Hydroélectricité et énergie éolienne : Distribution relativement uniforme
  4. Connexion au réseau : Meilleure connexion dans le sud, capacité de transmission nord-sud limitée

Différences de prix

Les régions du nord connaissent généralement des prix de l'électricité plus bas que le sud en raison des différences d'infrastructure et des déséquilibres entre l'offre et la demande énergétique.

Limitations et orientations d'amélioration

Limitations actuelles

  1. Plage temporelle : Couvre uniquement les données de 2024
  2. Précision des estimations : Certaines données basées sur des estimations peuvent présenter des écarts
  3. Fréquence de mise à jour : Ensemble de données statique nécessitant une mise à jour régulière
  4. Complétude des données : Données de consommation incomplètes pour certains mois

Améliorations futures

  1. Extension des séries temporelles : Ajout de données historiques et de données prédictives
  2. Données en temps réel : Intégration de données d'exploitation du système électrique en temps réel
  3. Extension internationale : Expansion à d'autres pays nordiques
  4. Amélioration de la précision : Amélioration des méthodes d'estimation et de la validation des données

Évaluation approfondie

Avantages

  1. Force de synthèse : Premier ensemble de données géographiques complet du système électrique norvégien
  2. Haut degré de standardisation : Format de données unifié facilitant l'utilisation et l'analyse
  3. Contrôle de qualité rigoureux : Validation systématique des données et évaluation de la qualité
  4. Bonne ouverture : Données, code et visualisation entièrement en accès ouvert
  5. Force pratique : Support direct de multiples applications d'analyse de systèmes énergétiques

Insuffisances

  1. Dimension temporelle limitée : Données d'une seule année, manque de tendances historiques
  2. Dynamique insuffisante : Ensemble de données statique, incapable de refléter les changements en temps réel
  3. Dépendance aux estimations : Certaines données clés dépendent de méthodes d'estimation
  4. Limitation géographique : Couverture limitée à la Norvège, comparaisons internationales limitées

Évaluation de l'impact

  1. Contribution académique : Fourniture de ressources importantes pour la recherche en systèmes d'information géographique énergétique
  2. Soutien politique : Soutien à la formulation des politiques de transition énergétique norvégienne
  3. Démonstration méthodologique : Fourniture d'un exemple pour la construction d'ensembles de données similaires dans d'autres pays
  4. Science ouverte : Promotion du partage ouvert des données énergétiques

Reproductibilité

  • Fourniture de code complet de traitement des données
  • Explication détaillée des sources de données et des étapes de traitement
  • Mode de stockage et d'accès aux données ouvert
  • Base de code Google Colab exécutable

Conclusion et perspectives

Contributions principales

Cette recherche a construit avec succès le premier ensemble de données géographiques complet du système électrique norvégien (NoreGeo), intégrant des données hétérogènes multi-sources, fournissant des formats de données standardisés et une visualisation interactive, offrant une ressource importante pour l'analyse géospatiale des systèmes énergétiques.

Valeur scientifique

Cet ensemble de données non seulement résout les problèmes existants de dispersion des données et d'incompatibilité des formats, mais plus important encore, fournit une base de données solide pour l'analyse des systèmes électriques régionaux dans le contexte de la transition énergétique, soutenant de multiples applications telles que la planification des infrastructures, l'analyse de vulnérabilité et le dispatch électrique.

Orientations futures

  1. Extension des séries temporelles : Construction d'ensembles de données multi-annuels soutenant l'analyse des tendances
  2. Intégration de données en temps réel : Intégration des données d'exploitation du système électrique en temps réel
  3. Coopération internationale : Coopération avec d'autres pays pour la construction d'ensembles de données transnationaux
  4. Analyse intelligente : Développement d'outils d'analyse intelligente combinant l'apprentissage automatique
  5. Mise à jour dynamique : Établissement d'un mécanisme de mise à jour automatique des données

Cette recherche établit une nouvelle norme pour l'application des systèmes d'information géographique dans le domaine énergétique, et sa pratique de science ouverte fournit également un excellent modèle à la communauté académique.

Références

L'article cite 24 références pertinentes, couvrant plusieurs domaines de recherche importants incluant la transition énergétique, les systèmes d'information géographique et les données ouvertes, fournissant une base théorique solide et des conseils méthodologiques pour cette recherche.