2025-11-15T11:46:11.842568

Norwegian Electricity in Geographic Dataset (NoreGeo)

Zhang, Maharjan, Strunz et al.
Geographic data is vital in understanding, analyzing, and contextualizing energy usage at the regional level within electricity systems. While geospatial visualizations of electricity infrastructure and distributions of production and consumption are available from governmental and third-party sources, these sources are often disparate, and compatible geographic datasets remain scarce. In this paper, we present a comprehensive geographic dataset representing the electricity system in Norway. We collect data from multiple authoritative sources, process it into widely accepted formats, and generate interactive maps based on this data. Our dataset includes information for each municipality in Norway for the year 2024, encompassing electricity infrastructure, consumption, renewable and conventional production, main power grid topology, relevant natural resources, and population demographics. This work results in a formatted geographic dataset that integrates diverse informational resources, along with openly released interactive maps. We anticipate that our dataset will alleviate software incompatibilities in data retrieval, and facilitate joint analyses on regional electricity system for energy researchers, stakeholders, and developers.
academic

Norwegian Electricity in Geographic Dataset (NoreGeo)

基本信息

  • 论文ID: 2510.09698
  • 标题: Norwegian Electricity in Geographic Dataset (NoreGeo)
  • 作者: Shiliang Zhang (University of Oslo), Sabita Maharjan (University of Oslo), Kai Strunz (Technical University Berlin), Jan Christian Bryne (Google Cloud Norway)
  • 分类: cs.CY (Computers and Society)
  • 发表时间: 2025年10月9日
  • 论文链接: https://arxiv.org/abs/2510.09698v1
  • 数据集链接: https://doi.org/10.5281/zenodo.16794603

摘要

地理数据对于理解、分析和情境化区域层面的能源使用至关重要。虽然政府和第三方来源提供了电力基础设施以及生产和消费分布的地理空间可视化,但这些来源往往分散,兼容的地理数据集仍然稀缺。本文提出了一个代表挪威电力系统的综合地理数据集。研究团队从多个权威来源收集数据,将其处理为广泛接受的格式,并基于这些数据生成交互式地图。数据集包含2024年挪威每个市政区的信息,涵盖电力基础设施、消费、可再生和传统发电、主电网拓扑、相关自然资源和人口统计。该工作产生了一个整合多样化信息资源的格式化地理数据集,并提供了开放获取的交互式地图。

研究背景与动机

问题定义

  1. 数据分散性问题:现有的电力系统地理空间数据来源分散,通常只提供有限的特征,限制了数据的实用性并阻碍了综合分析
  2. 格式兼容性问题:缺乏与GIS平台(如QGIS或ArcGIS)兼容的数据集,需要大量努力进行数据格式重构
  3. 交互式可视化缺失:缺乏基于地理能源数据集的开放交互式地图,为能源利益相关者的直观理解和推理创造了技术障碍

研究重要性

在能源转型背景下,电力系统正朝着更大的去碳化、去中心化和数字化发展。随着各国努力整合可变分布式能源资源(DERs)并提高能源效率,理解电力基础设施、资源可用性和需求模式之间的复杂关系变得至关重要。地理空间数据分析已成为可视化和检查这些复杂动态的强大工具。

现有方法局限性

  • 政府和权威来源的数据通常分散且特征有限
  • 数据格式不统一,软件兼容性差
  • 缺乏综合性的国家级电力系统地理数据集
  • 现有数据集的可追溯性和可重现性不足

核心贡献

  1. 构建了综合性挪威电力系统地理数据集:整合了2024年挪威357个市政区的电力基础设施、消费、生产、电网拓扑、自然资源和人口统计数据
  2. 提供了标准化的数据格式:将数据处理为CSV和GeoJSON格式,与主流GIS平台兼容
  3. 开发了交互式可视化地图:基于数据集创建了可公开访问的交互式地图
  4. 确保了数据质量和可追溯性:从权威来源收集数据,提供详细的数据验证和质量评估
  5. 促进了跨学科研究:为能源研究人员、利益相关者和开发者提供了便于联合分析的资源

方法详解

数据收集框架

研究采用了系统性的数据收集和处理流程:

数据来源

  • Statistics Norway (SSB):国家统计机构
  • Geonorge:国家地图数据平台
  • NVE Kartkatalog:挪威水资源和能源局地图目录
  • eSett:北欧国家电力市场不平衡结算服务
  • OpenStreetMap:开源地图数据

技术工具

  • QGIS和ArcGIS:地理信息系统平台
  • Python和Google Colab:数据处理和分析
  • Overpass turbo:OpenStreetMap数据提取

数据处理流程

1. 能源消费数据

  • 原始数据:从NVE获取XLSX格式的市政区级电力消费数据
  • 时间范围:2024年3-12月的月度消费数据
  • 处理方法:结合Geonorge的市政区地理边界,使用Python在Google Colab中整合
  • 输出格式:CSV和GeoJSON格式

2. 电力价格数据

  • 市场平衡区域:挪威5个市场平衡区域(MBA)
  • 数据整合:将MBA地理边界与2024年每日电力价格(EUR/MWh)结合
  • 数据来源:NVE Kartkatalog(边界)和eSett(价格)

3. 人口密度数据

  • 分辨率:250m × 250m网格
  • 数据基础:基于SSB注册人口与地籍地址点的链接估算
  • 格式转换:从GML格式转换为GeoJSON和CSV格式

4. 主电网数据

包含输电网络、区域和高压配电网络的:

  • 架空电缆(32-525kV)
  • 海底电缆(32-170kV)
  • 变压器站(24-525kV)
  • 容量信息

5. 水电系统数据

  • 水电站:运营中和未运营的水电站及其容量(MW)
  • 调节湖泊:影响水道的调节湖泊
  • 管道和隧道:包含长度信息的水电基础设施

6. 太阳能数据

  • 市政区级估算生产:NVE基于平均天气年的估算
  • 太阳能电站:已获许可或许可申请中的电站位置和容量
  • 屋顶太阳能板:奥斯陆市太阳能板分布示例(104,024.40平方米)

7. 风电数据

  • 风电场:已获许可和许可申请中的风电场
  • 风机位置:1,458个风机的精确位置
  • 风能资源:50米高度年运行小时数,1×1公里分辨率

数据验证与质量控制

数据分类体系

研究建立了数据准确性分类体系:

数据类型准确性等级描述
真实且公开准确政府机构透明化的真实数据
真实且注册准确能源利益相关者向政府报告的真实数据
采样估算通过采样和统计方法估算的数据
估算中等基于合理假设和条件的估算数据
个人观察中等开源社区个人贡献的数据

数据质量评估

高质量数据:电力价格、电力消费、电网拓扑、市政区边界、价格区域、各类发电厂数据 估算数据:人口密度、风能资源可用性、市政区太阳能发电量 众包数据:奥斯陆太阳能板分布

数据集规模与结构

数据集统计

  • 总记录数:超过60万条记录
  • 地理覆盖:挪威357个市政区
  • 时间跨度:2024年
  • 文件数量:18个主要数据文件
  • 格式:CSV和GeoJSON

主要数据文件

  1. 挪威每日电力价格:1,830条记录
  2. 市政区月度消费:3,580条记录
  3. 主电网架空线路:145,891条记录
  4. 海底电缆:8,762条记录
  5. 变压器:1,211个
  6. 人口分布:224,541个网格
  7. 水电站:4,052个
  8. 风电场:110个
  9. 风机位置:1,458个
  10. 风能资源:196,318个区域

技术创新点

1. 数据整合方法

  • 多源数据融合:整合了政府、统计机构、市场运营商和开源社区的数据
  • 标准化处理:统一转换为GIS兼容格式
  • 质量分级:建立了系统性的数据质量评估框架

2. 可视化创新

  • 交互式地图:基于ArcGIS Online创建可定制的交互式地图
  • 多层次展示:支持不同尺度和维度的数据可视化
  • 实时更新:提供代码支持数据的快速更新

3. 开放科学实践

  • 完全开放:数据、代码、地图全部开放获取
  • 可重现性:提供完整的数据处理代码
  • 可扩展性:方法可应用于其他国家和地区

应用场景与价值

研究应用

  1. 基础设施规划:电网扩展和容量规划
  2. 脆弱性分析:电网脆弱性预测和风险评估
  3. 电力调度:考虑地理约束的电力传输调度
  4. 能源政策:区域能源政策制定和评估

实用价值

  1. 决策支持:为政策制定者提供数据支撑
  2. 学术研究:促进跨学科能源系统研究
  3. 产业应用:支持能源企业的规划和运营
  4. 教育培训:作为能源地理信息系统教学资源

数据洞察

地理分布特征

  1. 能源消费:与人口分布密切相关,南部消费更高
  2. 太阳能发电:南部显著高于北部
  3. 水电和风电:分布相对均匀
  4. 电网连接:南部连接更好,南北传输能力有限

价格差异

北部地区由于基础设施差异和能源供需不平衡,电价通常低于南部地区。

局限性与改进方向

当前局限性

  1. 时间范围:仅覆盖2024年数据
  2. 估算精度:部分数据基于估算,可能存在偏差
  3. 更新频率:静态数据集,需要定期更新
  4. 数据完整性:某些月份消费数据不完整

未来改进

  1. 时间序列扩展:增加历史数据和预测数据
  2. 实时数据:集成实时电力系统数据
  3. 国际扩展:扩展到其他北欧国家
  4. 精度提升:改进估算方法和数据验证

深度评价

优点

  1. 综合性强:首次提供挪威电力系统的综合地理数据集
  2. 标准化程度高:统一的数据格式便于使用和分析
  3. 质量控制严格:系统性的数据验证和质量评估
  4. 开放性好:完全开放的数据、代码和可视化
  5. 实用性强:直接支持多种能源系统分析应用

不足

  1. 时间维度有限:仅有一年数据,缺乏历史趋势
  2. 动态性不足:静态数据集,无法反映实时变化
  3. 估算依赖:部分关键数据依赖估算方法
  4. 地理局限:仅覆盖挪威,国际对比受限

影响力评估

  1. 学术贡献:为能源地理信息系统研究提供重要资源
  2. 政策支持:支持挪威能源转型政策制定
  3. 方法示范:为其他国家构建类似数据集提供范例
  4. 开放科学:推动能源数据的开放共享

可复现性

  • 提供完整的数据处理代码
  • 详细的数据来源和处理步骤说明
  • 开放的数据存储和访问方式
  • 可执行的Google Colab代码库

结论与展望

主要贡献

本研究成功构建了首个综合性的挪威电力系统地理数据集(NoreGeo),整合了多源异构数据,提供了标准化的数据格式和交互式可视化,为能源系统的地理空间分析提供了重要资源。

科学价值

该数据集不仅解决了现有数据分散和格式不兼容的问题,更重要的是为能源转型背景下的区域电力系统分析提供了坚实的数据基础,支持基础设施规划、脆弱性分析、电力调度等多种应用。

未来方向

  1. 时间序列扩展:构建多年度数据集,支持趋势分析
  2. 实时数据集成:整合实时电力系统运行数据
  3. 国际合作:与其他国家合作构建跨国数据集
  4. 智能分析:结合机器学习开发智能分析工具
  5. 动态更新:建立自动化数据更新机制

该研究为地理信息系统在能源领域的应用树立了新的标准,其开放科学的实践方式也为学术界提供了良好的示范。

参考文献

论文引用了24篇相关文献,涵盖了能源转型、地理信息系统、开放数据等多个领域的重要研究,为本研究提供了坚实的理论基础和方法指导。