2025-11-25T11:37:18.016926

Augmenting Smart Contract Decompiler Output through Fine-grained Dependency Analysis and LLM-facilitated Semantic Recovery

Liao, Nan, Gao et al.

Decompiler is a specialized type of reverse engineering tool extensively employed in program analysis tasks, particularly in program comprehension and vulnerability detection. However, current Solidity smart contract decompilers face significant limitations in reconstructing the original source code. In particular, the bottleneck of SOTA decompilers lies in inaccurate method identification, incorrect variable type recovery, and missing contract attributes. These deficiencies hinder downstream tasks and understanding of the program logic. To address these challenges, we propose SmartHalo, a new framework that enhances decompiler output by combining static analysis (SA) and large language models (LLM). SmartHalo leverages the complementary strengths of SA's accuracy in control and data flow analysis and LLM's capability in semantic prediction. More specifically, \system{} constructs a new data structure - Dependency Graph (DG), to extract semantic dependencies via static analysis. Then, it takes DG to create prompts for LLM optimization. Finally, the correctness of LLM outputs is validated through symbolic execution and formal verification. Evaluation on a dataset consisting of 465 randomly selected smart contract methods shows that SmartHalo significantly improves the quality of the decompiled code, compared to SOTA decompilers (e.g., Gigahorse). Notably, integrating GPT-4o with SmartHalo further enhances its performance, achieving precision rates of 87.39% for method boundaries, 90.39% for variable types, and 80.65% for contract attributes.

academic

スマートコントラクト逆コンパイラ出力の細粒度依存関係分析とLLM促進意味論復元による拡張

基本情報

論文ID: 2501.08670
タイトル: Augmenting Smart Contract Decompiler Output through Fine-grained Dependency Analysis and LLM-facilitated Semantic Recovery
著者: Zeqin Liao, Yuhong Nan, Zixu Gao, Henglong Liang, Sicheng Hao, Peifan Ren, Zibin Zheng
分類: cs.SE（ソフトウェアエンジニアリング）
発表時期: 2025年1月（arXiv プレプリント）
論文リンク: https://arxiv.org/abs/2501.08670

摘要

スマートコントラクト逆コンパイラはプログラム分析において広く使用されているリバースエンジニアリングツールであり、特にプログラム理解と脆弱性検出において重要な役割を果たしています。しかし、現在のSolidityスマートコントラクト逆コンパイラは、元のソースコード再構成において顕著な制限があり、主に関数識別の不正確さ、変数型復元エラー、契約属性の欠落という3つの側面に表れています。これらの課題を解決するため、本論文はSmartHaloフレームワークを提案し、静的分析（SA）と大規模言語モデル（LLM）を組み合わせることで逆コンパイラ出力を強化しています。SmartHaloはSAの制御フロー・データフロー分析における正確性とLLMの意味論予測能力を活用しています。具体的には、本フレームワークは依存グラフ（DG）データ構造を構築して意味論的依存関係を抽出し、DGに基づいてLLM最適化プロンプトを作成し、最後に記号実行と形式検証によってLLM出力の正確性を検証しています。

研究背景と動機

問題定義

スマートコントラクト逆コンパイルは3つの中核的問題に直面しています：

関数境界識別の不正確さ：既存の逆コンパイラは関数境界を正確に決定できず、複数の関数を誤って単一の関数として復元したり、重要な関数を見落としたりします
変数型復元エラー：逆コンパイラが生成する型エラーは静的ドメイン規則と矛盾しており、例えばkeccak256関数のbytes32戻り値をuint256型として誤って復元します
契約属性の欠落：スマートコントラクト内の状態変数は重要な契約属性（資産、身元、ルーター等）を記録していますが、逆コンパイルコード内では完全に欠落しています

重要性分析

これらの欠陥は下流タスクに深刻な影響を与えます：

脆弱性検出の正確性に影響し、誤検知と見落としを生じさせます
プログラム理解の効率を低下させます
クロスコントラクト呼び出しフロー分析等の高度な分析タスクを制限します

既存手法の制限

SmartDagger：契約属性の状態変数復元のみ部分的に対応でき、深層学習モデルに基づいており、新興コントラクトでの性能が低下します
Neural-FEBI：修飾子関数または継承関数の境界復元をサポートしていません
SigRec/VarLifter/DeepInfer：既知関数署名のパラメータ型のみ部分的に復元でき、事前定義ヒューリスティックに依存しており、カバレッジが低いです

研究動機

2つの重要な洞察に基づいています：

ソフトウェアの自然なパターン：プログラマは類似したコンテキストで類似したコード構造、契約属性、変数型、関数境界を使用する傾向があります
SAとLLMの協調強化：SAは複雑な静的制約の処理において高い正確性を持ち、LLMは静的制約が不足している対象の予測において柔軟性を持ちます

中核的貢献

現在のスマートコントラクト逆コンパイラ出力の重要な制限を識別し、体系的に分析しました
SmartHaloフレームワークを提案し、静的分析と大規模言語モデルを革新的に組み合わせて逆コンパイラ出力を最適化しています
依存グラフ（DG）データ構造を設計し、3種類の意味論的依存関係（状態依存、制御フロー依存、型依存）を抽出しています
厳密な正確性検証メカニズムを確立し、記号実行と形式検証を通じてLLM幻覚問題に対処しています
関数境界、変数型、契約属性復元における有効性を包括的に評価・検証しました

方法の詳細説明

タスク定義

入力：逆コンパイラが生成した疑似コード出力：最適化された逆コンパイルコード（正確な関数境界、変数型、契約属性を含む）制約：プログラム動作の等価性を維持し、Solidityの静的型規則に従う

モデルアーキテクチャ

SmartHaloは3段階アーキテクチャを採用しています：

1. 依存関係に基づく意味論的抽出

制御フロー分析：Tree-sitterを使用して構文木を構築し、3アドレス中間表現に変換し、制御フロー・データフロー図を生成します
依存関係識別：
- 型依存：変数型と他の変数または式との関連関係
- 状態依存：状態変数間の読み書き依存関係
- 制御フロー依存：プログラム実行パスの依存関係
依存グラフ構築：DG = (Nc, Ec, Xe)。ここでNcはノード集合（変数と式）、Ecは辺集合（3種類の依存関係）、Xeはラベル関数です

2. LLM駆動の意味論強化

コードコンテキスト生成：
- 変数：DGに基づくコードスライシングを実施し、対象変数に関連するコード片を抽出します
- 関数：対象関数が存在する呼び出しチェーンを検索します
推論候補生成：
- 変数型候補：Solidityドキュメントから組み込み型を収集します
- 契約属性候補：Limit, Fee, Flag, Address, Asset, Router, Others
思考の連鎖（COT）プロンプト：DG内の依存関係を推論ステップ記述に変換します

3. 正確性検証

プログラム動作等価性チェック：
- 元のおよび最適化された関数に対して記号実行を実施します
- Z3ソルバーを使用して形式検証を行います
- 等価性アサーション：Φ = ¬(s ⇔ s′)
静的規則違反チェック：Solidity型規則に基づいて型推論エラーを検出します

技術的革新点

細粒度依存分析：3種類の意味論的依存関係を初めて体系的に抽出・活用しました
SA-LLM協調フレームワーク：静的分析の正確性とLLMの意味論理解能力を革新的に組み合わせています
厳密な正確性保証：記号実行と形式検証を通じて最適化結果の正確性を確保しています
汎用性設計：異なるLLMと逆コンパイラの統合をサポートしています

実験設定

データセット

評価データセット：最大のオープンソーススマートコントラクトデータセットから無作為に500個の関数を選択し、最終的に456対のソースコードと逆コンパイル出力を取得しました
複雑契約データセット：682個の実際のDAppから無作為に50個のスマートコントラクト（約900個の関数）を選択しました
脆弱性検出データセット：81個の再入攻撃脆弱性ラベル、18対の攻撃コントラクト、50個の整数オーバーフロー脆弱性コントラクトを含みます

評価指標

関数境界マッチング：開始点と終了点がソースコードレベルの関数と完全に一致
型マッチング：予測型が実際の型と完全に一致（データレイアウトとフィールド情報を含む）
契約属性マッチング：予測属性が実際の属性と完全に一致
再コンパイル失敗率：最適化後コードのコンパイルエラー率

比較手法

SmartDagger：契約属性復元比較用
VarLifter：変数型推論比較用
元の逆コンパイラ：Gigahorse/Dedaubをベースラインとして使用

実装詳細

開発環境：Python 3.8.10、1799行のコード
LLM選択：主にGPT-3.5を使用し、GPT-4o mini、Llama-3、Deepseek-v3、Qwen-2.5-coderをサポート
ハードウェア構成：Intel i9-10980XE CPU、RTX 3090 GPU、250GB RAM

実験結果

主要結果

全体的効果比較（元の逆コンパイラとの比較）

指標	精度向上	再現率向上
関数境界識別	+20.30%	+30.03%
変数型推論	+30.02%	+42.04%
契約属性復元	68.06%	90.93%

SOTA手法との比較

SmartDagger比較（契約属性）：精度44.69%向上、再現率80.86%向上
VarLifter比較（変数型）：精度13.51%向上、再現率77.08%向上

異なるLLMの性能比較

LLM	関数境界(P/R)	変数型(P/R)	契約属性(P/R)
GPT-3.5	88.26%/80.51%	92.27%/84.26%	68.06%/90.93%
GPT-4o mini	91.32%/87.38%	90.40%/88.82%	80.66%/91.78%
Llama-3	66.09%/55.11%	62.41%/48.53%	61.68%/60.34%

アブレーション実験

SA、LLM単独使用とSmartHalo完全フレームワークの比較：

SAの貢献：正確な依存関係抽出と制約検証を提供
LLMの貢献：意味論理解と稀なパターン認識能力を提供
協調効果：SmartHaloはLLM単独使用と比較して関数境界で19.23%/29.23%向上

汎化能力検証

クロス逆コンパイラ：Heimdall、Panoramixで顕著な向上
複雑契約：実際の複雑なDApp上で良好な性能を維持
効率分析：平均処理時間23.99秒、コスト$0.00136/関数

下流タスク効果

再入脆弱性検出：精度72.16%から80.41%に向上
攻撃識別：再現率83.33%から100.00%に向上
整数オーバーフロー検出：精度21.96%向上、再現率38.00%向上

結論と考察

主要な結論

SmartHaloはスマートコントラクト逆コンパイル品質を大幅に向上させ、3つの重要指標すべてで実質的な改善を達成しました
SA-LLM協調フレームワークが有効であることが証明され、両者の相補的な利点を十分に活用しています
厳密な正確性検証メカニズムがLLM幻覚問題を成功裏に制御しました
フレームワークは良好な汎化能力を持ち、複数のLLMと逆コンパイラをサポートしています

制限事項

継承構造復元：バイトコードレベルでクラス情報が欠落しているため、契約内の継承関係を復元できません
データセット規模：評価データセットは比較的小規模（456個の関数）ですが、SOTA研究規模と同等です
LLM API進化：結果の再現性に影響を与える可能性があります
複雑なシナリオ処理：低レベル呼び出し、インラインアセンブリ、オフチェーン依存等のシナリオでの性能は限定的です

今後の方向性

継承構造復元：パターンマッチングに基づく継承関係推論の探索
より大規模な評価：より大規模なデータセット上での手法の堅牢性検証
専用モデル訓練：スマートコントラクト理解専用モデルの訓練
リアルタイム最適化：オンライン逆コンパイル最適化のサポート

深層評価

利点

問題定義が明確：スマートコントラクト逆コンパイルの中核的問題を体系的に識別・分析
方法の革新性が強い：SA-LLM協調フレームワークを初めて提案し、巧妙な依存グラフデータ構造を設計
技術方案が完全：意味論抽出、最適化強化から正確性検証まで完全なクローズドループを形成
実験評価が包括的：多次元比較実験、アブレーション研究、下流タスク検証を含む
実用価値が高い：60.22%の最適化コードが直接再コンパイル可能で、実用性を大幅に向上

不足点

理論分析が不十分：方法の理論的保証に関する深い分析が欠落
エラー分析が限定的：最適化失敗ケースの根本原因分析をより深掘りできます
計算オーバーヘッド：記号実行と形式検証が高い計算コストをもたらす可能性
外部ツール依存：既存逆コンパイラとLLM APIの品質に依存

影響力

学術的貢献：スマートコントラクト分析分野に新しい研究パラダイムを提供
実用価値：スマートコントラクトセキュリティ分析とプログラム理解に直接応用可能
拡張性：フレームワーク設計が異なる分析ツールとモデルの統合をサポート
オープンソース貢献：著者がコードとデータセットのオープンソース化を約束し、研究の再現を促進

適用シナリオ

スマートコントラクトセキュリティ監査：逆コンパイルコードの可読性と正確性を向上
脆弱性検出ツール：前処理ステップとして検出精度を向上
プログラム理解ツール：開発者がサードパーティコントラクトロジックを理解するのを支援
学術研究：スマートコントラクト分析研究に高品質データを提供

参考文献

論文は96篇の関連文献を引用しており、主に以下を含みます：

スマートコントラクト分析：Gigahorse、SmartDagger、VarLifter等の古典的研究
プログラム分析理論：記号実行、形式検証関連文献
機械学習応用：プログラム分析における深層学習の応用
逆コンパイル技術：従来の逆コンパイル最適化手法とツール

総合評価：これはスマートコントラクト逆コンパイルという重要な問題に対して革新的なソリューションを提案した高品質なソフトウェアエンジニアリング研究論文です。方法設計が合理的で、実験評価が充分で、実用価値が優れています。いくつかの制限事項がありますが、全体的な貢献は顕著であり、スマートコントラクトセキュリティ分析分野に重要な推進力をもたらします。