2025-11-15T18:46:12.059559

A Toolchain for Assisting Migration of Software Executables Towards Post-Quantum Cryptography

Rattanavipanon, Suaboot, Werapun

Quantum computing poses a significant global threat to today's security mechanisms. As a result, security experts and public sectors have issued guidelines to help organizations migrate their software to post-quantum cryptography (PQC). Despite these efforts, there is a lack of (semi-)automatic tools to support this transition especially when software is used and deployed as binary executables. To address this gap, in this work, we first propose a set of requirements necessary for a tool to detect quantum-vulnerable software executables. Following these requirements, we introduce QED: a toolchain for Quantum-vulnerable Executable Detection. QED uses a three-phase approach to identify quantum-vulnerable dependencies in a given set of executables, from file-level to API-level, and finally, precise identification of a static trace that triggers a quantum-vulnerable API. We evaluate QED on both a synthetic dataset with four cryptography libraries and a real-world dataset with over 200 software executables. The results demonstrate that: (1) QED discerns quantum-vulnerable from quantum-safe executables with 100% accuracy in the synthetic dataset; (2) QED is practical and scalable, completing analyses on average in less than 4 seconds per real-world executable; and (3) QED reduces the manual workload required by analysts to identify quantum-vulnerable executables in the real-world dataset by more than 90%. We hope that QED can become a crucial tool to facilitate the transition to PQC, particularly for small and medium-sized businesses with limited resources.

academic

A Toolchain for Assisting Migration of Software Executables Towards Post-Quantum Cryptography

基本信息

论文ID: 2409.07852
标题: A Toolchain for Assisting Migration of Software Executables Towards Post-Quantum Cryptography
作者: Norrathep Rattanavipanon, Jakapan Suaboot, Warodom Werapun (Prince of Songkla University)
分类: cs.CR (Cryptography and Security)
发表状态: 已提交至IEEE ACCESS期刊
论文链接: https://arxiv.org/abs/2409.07852

摘要

量子计算对当今安全机制构成重大全球威胁。尽管安全专家和公共部门已发布指导方针帮助组织将软件迁移到后量子密码学(PQC)，但缺乏支持这种转换的(半)自动化工具，特别是当软件以二进制可执行文件形式部署时。为解决这一问题，本文首先提出了检测量子脆弱软件可执行文件工具的必要需求。基于这些需求，引入了QED：量子脆弱可执行文件检测工具链。QED采用三阶段方法识别给定可执行文件集合中的量子脆弱依赖关系，从文件级到API级，最终精确识别触发量子脆弱API的静态跟踪。评估结果显示：(1) QED在合成数据集上以100%准确率区分量子脆弱和量子安全可执行文件；(2) QED实用且可扩展，平均在不到4秒内完成对真实世界可执行文件的分析；(3) QED将分析师识别量子脆弱可执行文件所需的手动工作量减少了90%以上。

研究背景与动机

问题定义

随着量子计算技术的快速发展，从1998年的2个量子比特发展到现在超过1000个量子比特，专家预测大规模功能性量子计算机将在未来二十年内商业化。量子计算机能够破解当前广泛使用的公钥密码系统，如RSA（需要4098个逻辑量子比特）和椭圆曲线密码（需要2330个逻辑量子比特）。

重要性

全球对量子攻击威胁的认识不断增强，NIST等机构建议组织建立量子就绪团队，准备将软件系统迁移到后量子密码学。这包括：

创建密码学清单以评估组织内密码学使用情况
基于这些清单进行风险评估

现有方法局限性

缺乏专门工具：目前没有专门设计用于协助PQC迁移任务的(半)自动化工具
手动分析负担：分析师必须依赖各种分散工具和手动分析来识别量子脆弱软件系统
二进制分析挑战：分析师通常无法访问源代码，必须基于程序二进制文件进行PQC迁移
成本问题：需要高级二进制分析知识，增加了预算、时间和人力成本

研究动机

针对这些挑战，特别是中小企业缺乏资源进行PQC迁移的问题，本文旨在开发一个自动化工具来减轻分析师的工作负担。

核心贡献

需求制定：首次系统性地制定了协助软件可执行文件PQC迁移工具的需求规范
QED工具链：设计并实现了满足所提需求的QED工具链，开源代码已公开发布
实证验证：在合成和真实世界数据集上验证了QED的准确性和效率，实现100%真正率并减少90%以上的手动工作量
实用价值：为资源有限的中小企业提供了关键的PQC迁移辅助工具

方法详解

任务定义

给定一组软件可执行文件，QED的目标是识别量子脆弱(QV)的可执行文件。一个软件可执行文件被定义为QV，当且仅当从其入口点（主函数）到实现QV算法（如RSA、Diffie-Hellman、椭圆曲线数字签名）的密码学库API之间存在至少一条可能的执行路径。

工具需求(R1-R5)

R1 动态链接：必须能识别通过动态链接使用QV API的可执行文件
R2 二进制级分析：不依赖源代码可用性
R3 静态特征：仅使用静态特征，不需要运行时执行跟踪
R4 可扩展性：支持大量软件可执行文件的分析，在合理时间内完成
R5 有效性：不产生假阴性，可容忍少量假阳性

模型架构

QED采用三阶段渐进式分析架构：

第一阶段：文件级依赖分析(P1)

目标：识别对QV密码学库有依赖关系的可执行文件

方法：

构建软件依赖图G₁ = (V₁, E₁)，其中V₁是文件集合，E₁是直接依赖关系
通过深度优先搜索发现所有依赖关系
定位V₁中的QV密码学库
剪除与密码学库无依赖关系的节点

输出：文件级依赖路径EV₁

第二阶段：API级依赖分析(P2)

目标：减少P1中的假阳性，分析API级依赖关系

方法：

构建API依赖图G₂ = (V₂, E₂)，E₂包含三元组(n₁, n₂, apis)
检查前驱节点是否包含对QV API的函数调用
移除不包含QV API调用的边
为每条边嵌入API级依赖信息

输出：包含QV API信息的依赖路径EV₂

第三阶段：静态跟踪分析(P3)

目标：精确识别符合QV定义的可执行文件

方法：

构建静态调用图进行可达性分析
验证从可执行文件入口点到QV API的执行路径
支持普通模式和保守模式
- 普通模式：缺少执行跟踪直接表明非QV
- 保守模式：将缺失跟踪视为潜在假阴性

输出：静态执行跟踪EV₃

技术创新点

渐进式分析策略：从粗粒度到细粒度的三阶段分析，平衡速度和准确性
API名称信息利用：基于API名称信息检测密码学使用，避免编译器优化导致的假阴性
动态链接支持：专门处理通过动态链接使用密码学库的场景
灵活的分析模式：提供普通和保守两种模式，允许分析师根据需求选择

实验设置

数据集

合成数据集

密码学库：OpenSSL v1.1.1, OpenSSL v3.3.1, MbedTLS v2.28.8, wolfSSL v5.7.2
密码学原语：SHA-512, AES-256, Diffie-Hellman, RSA, ECDSA（后三者为QV）
直接依赖集：20个可执行文件（12个QV，8个非QV）
间接依赖集：20个可执行文件（12个QV，8个非QV）
总计：40个可执行文件（24个QV，16个非QV）

真实世界数据集

Coreutils：109个非密码学软件（非QV）
UnixBench：18个性能基准测试工具（非QV）
Network：13个网络工具程序（7个QV，6个非QV）
tpm2-tools：86个TPM功能实现工具
总计：226个可执行文件，平均大小248KB

评价指标

真正率(TPR)：正确识别QV可执行文件的比例
真负率(TNR)：正确识别非QV可执行文件的比例
运行时间：各阶段分析所需时间
内存使用：峰值RAM使用量
手动工作量减少：需要进一步手动审查的文件数量

实现细节

编程语言：Python3（约800行代码）
依赖库：pyelftools（ELF文件处理）、NetworkX（图操作）、angr（静态调用图构建）
实验环境：Ubuntu 20.04, Intel i5-8520U @ 1.6GHz, 24GB RAM

实验结果

主要结果

合成数据集准确性

阶段	直接依赖	间接依赖	总体
P1	TPR: 100%, TNR: 0%	TPR: 100%, TNR: 0%	TPR: 100%, TNR: 0%
P1+P2	TPR: 100%, TNR: 100%	TPR: 100%, TNR: 0%	TPR: 100%, TNR: 50%
P1+P2+P3	TPR: 100%, TNR: 100%	TPR: 100%, TNR: 100%	TPR: 100%, TNR: 100%