2025-11-14T12:40:11.870251

Leveraging LLMs to Streamline the Review of Public Funding Applications

Marques, Duarte, Carvalho et al.

Every year, the European Union and its member states allocate millions of euros to fund various development initiatives. However, the increasing number of applications received for these programs often creates significant bottlenecks in evaluation processes, due to limited human capacity. In this work, we detail the real-world deployment of AI-assisted evaluation within the pipeline of two government initiatives: (i) corporate applications aimed at international business expansion, and (ii) citizen reimbursement claims for investments in energy-efficient home improvements. While these two cases involve distinct evaluation procedures, our findings confirm that AI effectively enhanced processing efficiency and reduced workload across both types of applications. Specifically, in the citizen reimbursement claims initiative, our solution increased reviewer productivity by 20.1%, while keeping a negligible false-positive rate based on our test set observations. These improvements resulted in an overall reduction of more than 2 months in the total evaluation time, illustrating the impact of AI-driven automation in large-scale evaluation workflows.

academic

Leveraging LLMs to Streamline the Review of Public Funding Applications

基本信息

论文ID: 2510.09674
标题: Leveraging LLMs to Streamline the Review of Public Funding Applications
作者: João D.S. Marques, André V. Duarte, André Carvalho, Gil Rocha, Bruno Martins, Arlindo L. Oliveira
分类: cs.CY cs.AI
发表时间: 2025年10月8日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.09674

摘要

每年，欧盟及其成员国投入数百万欧元资助各种发展倡议。然而，这些项目收到的申请数量不断增加，由于人力资源有限，往往在评估过程中造成严重瓶颈。本研究详细介绍了在两个政府倡议管道中部署AI辅助评估的实际情况：(i) 针对国际业务扩张的企业申请，(ii) 公民在节能家居改善投资方面的报销申请。虽然这两种情况涉及不同的评估程序，但研究发现AI有效提高了处理效率，减少了两种申请类型的工作量。具体而言，在公民报销申请倡议中，该解决方案将审查员生产力提高了20.1%，同时基于测试集观察保持了可忽略的误报率。这些改进使总评估时间减少了2个多月，展示了AI驱动自动化在大规模评估工作流程中的影响。

研究背景与动机

问题定义

本研究要解决的核心问题是欧盟公共资助项目评估中的效率瓶颈。随着申请数量的激增，传统的人工评估方式已经无法满足处理需求，导致评估周期过长、申请人满意度下降，最终影响公众对这些倡议效率的信心。

问题重要性

公共资助项目是推动经济增长、可持续发展和创新的重要工具。评估效率的低下不仅影响资金分配的及时性，还可能导致优质项目错失机会，影响整体政策目标的实现。

现有方法局限性

传统的文档审查依赖于基于规则的自然语言处理和光学字符识别技术，这些方法在受控环境中表现良好，但对文档结构和内容的变化高度敏感，难以维护且难以扩展到更广泛的应用。

研究动机

大型语言模型(LLMs)的出现为自动化文档处理提供了前所未有的灵活性和适应性。本研究旨在探索如何在保证人工监督的前提下，利用LLMs提高公共资助申请评估的效率和一致性。

核心贡献

实际部署经验报告：首次报告了两个AI辅助文档评估系统的成功部署，展示了自动化如何在确保决策完整性的人工监督下加速申请分析。
实际效果验证：在ReClaim倡议中实现了20.1%的审查员生产力提升，总评估时间减少超过2个月。
最佳实践总结：基于真实世界部署经验，提供了将AI模型集成到类似环境中的最佳实践和关键经验教训。
双重场景验证：通过两个不同类型的政府倡议(企业国际化申请和公民节能改造报销)验证了AI辅助评估的普适性。

方法详解

任务定义

研究涉及两个不同的任务：

IExp任务：企业国际化申请的综合评估，包括文档摘要生成、内部一致性检测和初步评分
ReClaim任务：公民节能改造报销申请的文档验证，主要进行申请信息与支持文档的一致性检查

系统架构

IExp系统架构

输入：平均30,000个token的企业申请文档(超过50页)
核心模型：GPT-4o
处理流程：
1. 文档分段和过滤，避免LLM上下文过载
2. 基于评估团队专业知识识别每个任务的关键字段
3. 自动化6个最耗时的评估任务
输出：应用摘要、一致性报告、初步评分和理由

ReClaim系统架构

输入：约80,000份申请，每份平均11个支持文档
混合处理管道：
1. 文档标准化：仅支持PDF、ZIP、PNG等广泛使用的文件格式
2. XML转换：将用户表单字段转换为结构化XML格式
3. VLM信息提取：使用GPT-4o解析非结构化支持文档
4. 自动一致性检查：比较提取信息与申请人报告值
输出：预填充的验证清单，标记需要人工检查的项目