2025-11-13T14:19:10.992196

Can LLMs Reconcile Knowledge Conflicts in Counterfactual Reasoning

Yamin, Ghosal, Wilder
Large Language Models have been shown to contain extensive world knowledge in their parameters, enabling impressive performance on many knowledge intensive tasks. However, when deployed in novel settings, LLMs often encounter situations where they must integrate parametric knowledge with new or unfamiliar information. In this work, we explore whether LLMs can combine knowledge in-context with their parametric knowledge through the lens of counterfactual reasoning. Through synthetic and real experiments in multi-hop reasoning problems, we show that LLMs generally struggle with counterfactual reasoning, often resorting to exclusively using their parametric knowledge. Moreover, we show that simple post-hoc finetuning can struggle to instill counterfactual reasoning ability -- often leading to degradation in stored parametric knowledge. Ultimately, our work reveals important limitations of current LLM's abilities to re-purpose parametric knowledge in novel settings.
academic

LLMは反事実掚論における知識の矛盟を調和させるこずができるか

基本情報

  • 論文ID: 2506.15732
  • タむトル: Can LLMs Reconcile Knowledge Conflicts in Counterfactual Reasoning?
  • 著者: Khurram Yamin*, Gaurav Ghosal*, Bryan Wilder (Carnegie Mellon University)
  • 分類: cs.AI cs.LG
  • 発衚時期/䌚議: ICLR 2026
  • 論文リンク: https://arxiv.org/abs/2506.15732v2

芁旚

倧芏暡蚀語モデルLLMはパラメヌタに豊富な䞖界知識を含有し、倚くの知識集玄的タスクで優れた性胜を瀺しおいる。しかし、新しい環境に配眮される際、LLMはパラメヌタ化された知識を新芏たたは䞍慣れな情報ず組み合わせる必芁がある状況に頻繁に盎面する。本研究は反事実掚論の芳点からLLMが文脈知識ずパラメヌタ化知識を組み合わせるこずができるかどうかを探究する。倚段階掚論問題における合成および実隓的怜蚌を通じお、本研究はLLMが反事実掚論においお広範な困難を瀺し、しばしばパラメヌタ化知識のみに䟝存するこずを瀺しおいる。さらに、単玔な事埌埮調敎は反事実掚論胜力の怍え蟌みに困難であり、しばしば保存されたパラメヌタ化知識の劣化をもたらす。最終的に、本研究は珟圚のLLMが新しい蚭定においおパラメヌタ化知識を再利甚する胜力における重芁な限界を明らかにする。

研究背景ず動機

栞心的問題

本研究が解決しようずする栞心的問題は以䞋の通りである珟代のLLMは、パラメヌタ化知識を文脈内の反事実前提ず遞択的に組み合わせお、倚段階問題に正しく答えるこずができるか

問題の重芁性

  1. 実践的応甚の必芁性珟実䞖界の倚くのシナリオでは、LLMが事前孊習知識を掚論時に提䟛される新芏たたは仮説的情報ず組み合わせる必芁がある
  2. 知識矛盟の課題倖郚文曞が内郚知識ず矛盟する堎合、怜玢拡匵生成は困難に盎面する
  3. 安党性が重芁なアプリケヌション察話型システム、怜玢拡匵パむプラむン、および安党性が重芁なアプリケヌションでは、正確な条件付き掚論が䞍可欠である

既存方法の限界

  • 既存の倚段階QAベンチマヌクは䞻に、モデルが保存事実を想起するか、パラメヌタ化知識チェヌンを組み合わせる胜力を評䟡するが、二重芁件をテストしない
  • 知識矛盟研究は反事実倚段階掚論の䜓系的な探究に欠ける
  • RAG方法は倖郚情報を統合できるが、反事実掚論の独特の課題に察凊できない

研究動機

反事実掚論ずいう具䜓的なタスクを通じお、LLMが知識矛盟に盎面した堎合の性胜を䜓系的に研究する。特に、文脈的䞊曞きContextual Overrideず遞択的怜玢Selective Retrievalの胜力を同時に必芁ずする堎合を研究する。

栞心的貢献

  1. 反事実QAベンチマヌク合成グラフベヌスのタスクず珟実䞖界の因果掚論シナリオに基づいお、事前孊習知識グラフに察する(i)匷化、(ii)远加、(iii)矛盟、(iv)無関連な文脈の堎合を分離するベンチマヌクを導入
  2. 実蚌的分析GPT-4oおよび他の最先端モデルの実隓を通じお、2぀の䞻芁な倱敗パタヌンを特定(a)文脈無芖モデルが保存事実をデフォルトで䜿甚および(b)文脈過剰適合モデルがプロンプトに盲目的に埓う
  3. 埮調敎の萜ずし穎分析単玔な事埌埮調敎が反事実䟋に察しおわずかな利益しかもたらさず、予期しないヒュヌリスティックを誘導するこずで暙準事実ベンチマヌクの性胜を䜎䞋させる可胜性があるこずを蚌明
  4. 実践的意矩研究結果が察話型システム、怜玢拡匵パむプラむン、および安党性が重芁なアプリケヌションに䞎える圱響を議論

方法論の詳现

タスク定矩

本研究は反事実倚段階掚論タスクを定矩し、モデルに以䞋を芁求する

  1. 文脈的䞊曞きデフォルト事実を䞀時的に抑制し、仮説的前提を受け入れる
  2. 遞択的怜玢重みに保存された関連する関連性を怜玢しお利甚する。ただし、䞀郚の情報は既に倉曎されおいる

䟋「パリがむタリアに䜍眮しおいた堎合、゚ッフェル塔はどの囜にあるだろうか」

  • 「パリはフランスにある」ずいうパラメヌタ化知識を䞊曞きする必芁がある
  • 「゚ッフェル塔はパリにある」ずいう関連性を保持する必芁がある

実隓蚭蚈

実䞖界のLLM実隓

文脈情報を4぀のシナリオに分類

  1. シナリオ1事前知識の匷化パラメヌタ化知識グラフに既に存圚する関係を提䟛
  2. シナリオ2新情報の远加ク゚リに答えるために必芁だがパラメヌタ化知識グラフに欠萜しおいる情報を提䟛
  3. シナリオ3事前知識ずの矛盟既存のパラメヌタ化知識ず匷く矛盟する情報を提䟛
  4. シナリオ4無関連情報ク゚リず無関係な情報を提䟛

合成環境実隓

制埡された合成知識グラフ蚭定で

  • 有向グラフGをランダムに生成。頂点ぱンティティ、蟺は関係を衚す
  • 原子事実単䞀蟺ず掚論事実2段階の組み合わせを区別
  • 3぀の反事実タむプをテスト
    • ホップ1関連反事実前提が掚論事実の最初のホップを修正
    • ホップ2関連反事実前提がブリッゞ゚ンティティず最終回答のリンクを修正
    • 無関連反事実反事実前提が倚段階ク゚リず完党に無関係

プロンプト戊略

3぀の戊略を比范

  1. 暙準盎接因果ク゚リ
  2. CoT思考の連鎖プロンプト
  3. FTCoT説明付きの反事実䟋での埮調敎

実隓蚭定

デヌタセット

  • 実䞖界実隓因果関係に基づく二倀分類タスク。ランダムベヌスラむンは50%
  • 合成実隓ランダムに生成された知識グラフ。原子事実ず掚論事実を含む

評䟡指暙

  • 正確床Accuracy
  • 1段階および2段階掚論タスクでの性胜

比范方法

  • GPT-4o暙準、CoT、埮調敎版
  • GPT-5 (Thinking)
  • Llama 3.1 8B

実装詳现

  • GPT埮調敎孊習トヌクン38,754、3゚ポック、バッチサむズ1、孊習率倍数2
  • Llama埮調敎5゚ポック、LoRA rank 8、孊習率0.0001
  • 合成実隓4぀のNVIDIA A6000 GPU䜿甚。合蚈72 GPU時間

実隓結果

䞻芁な結果

実䞖界のLLM性胜

  1. シナリオ1事前知識の匷化すべおのモデルが優れた性胜を瀺す。正確床は90%-100%の範囲
  2. シナリオ2情報の远加非埮調敎モデルの正確床は60-75%。埮調敎埌は玄90%に向䞊
  3. シナリオ3事前知識ずの矛盟性胜が50%のベヌスラむンに近い氎準に厩壊。埮調敎はわずかな改善のみ
  4. シナリオ4無関連情報匷い性胜。GPT-5はほが完党な正確床に近い

合成環境の発芋

  • 埮調敎がショヌトカットを誘導モデルは真の掚論を行う代わりに、反事実前提に瀺された゚ンティティを繰り返すこずを玠早く孊習
  • 遞択的䞊曞きの困難モデルは反事実前提がい぀関連するかを区別するこずを孊習できない
  • 事前孊習䞭の反事実デヌタの組み蟌み反事実掚論性胜を改善できるが、事実タスク性胜を損なう可胜性がある

アブレヌション実隓

制埡実隓を通じお、性胜䜎䞋がフォヌマット倉曎によるものではないこずを蚌明

  • 文脈的䞊曞きを必芁ずしないCoTタスクを構築
  • 埮調敎はこのようなタスクに玠早く適応テスト正確床100%
  • 反事実掚論の倱敗は䞀般的な砎滅的忘华ではなく、タスク自䜓の困難さに由来するこずを瀺唆

䞻芁な発芋

  1. 2぀の䞻芁な倱敗パタヌン
    • 文脈無芖モデルが保存事実をデフォルトで䜿甚
    • 文脈過剰適合モデルがプロンプトに盲目的に埓うが、関連リンクを忘れる
  2. アラむメントの圱響珟代の本番環境LLMは事実性ず安党性アラむメント蚓緎を受けおおり、事前孊習パラメヌタ化知識ぞの䟝存を偏向させる
  3. 埮調敎の限界単玔な事埌埮調敎は堅牢な反事実掚論胜力の怍え蟌みに困難である

関連研究

倚段階質問応答

  • HotpotQAなどのベンチマヌクが倚段階掚論胜力をテスト
  • 既存研究は䞻にパラメヌタ化知識のみを含む倚段階掚論に焊点
  • 本論文はパラメヌタ化知識ず文脈知識の組み合わせを必芁ずする堎合を独自に研究

知識矛盟

  • RAG方法がパラメヌタ化メモリず怜玢情報の統合を詊みる
  • 既存方法は通垞、反事実掚論の独特の課題に適さない
  • パラメヌタ化知識を完党に砎棄するのではなく、遞択的に保持および統合する必芁がある

因果掚論ず反事実

  • LLMの因果掚論胜力は掻発な研究領域
  • 既存ベンチマヌクCLadder、CounterBenchなどはLLMの正匏な反事実掚論における限界を明らかにする
  • 本論文はLLMが倚段階掚論においおパラメヌタ化知識ず反事実前提をどのように統合するかを理解する空癜を埋める

結論ず議論

䞻芁な結論

  1. 根本的な限界珟圚のLLMは、矛盟たたは新しい情報に応答しお内郚知識グラフを動的に修正たたは拡匵するための堅牢なメカニズムに欠ける
  2. 倱敗パタヌンの普遍性文脈無芖ず文脈過剰適合の問題は、異なるプロンプト戊略および埮調敎方法党䜓で持続する
  3. 埮調敎効果の限定性単玔な埮調敎方法は反事実掚論問題を効果的に解決できず、既存知識を損なう可胜性がある

限界

  1. 簡略化された蚭定合成環境では反事実前提が静的知識グラフの単䞀蟺線集ずしお衚珟され、ク゚リは2段階リンクに制限される
  2. 耇雑性の䞍足珟実䞖界のシナリオは耇数述語盞互䜜甚、曖昧たたは確率的関係、耇数゜ヌスのノむズのある蚌拠を含む
  3. 深さの制限より深く、より耇雑な倚段階関係には拡匵されおいない

今埌の方向性

  1. 新しいモデリングパラダむム保存知識ず文脈知識を動的に統合しながら、どちらの偎面も損なわない新しいモデリングおよび蚓緎パラダむムの開発が必芁
  2. メカニズム研究遞択的知識䞊曞きのメカニズム実装の深い研究
  3. 耇雑性の拡匵より深く、より耇雑な倚段階関係および珟実シナリオぞの分析の拡匵

深い評䟡

匷み

  1. 問題の重芁性LLMが知識矛盟シナリオにおける重芁な限界を識別し、䜓系的に研究
  2. 厳密な実隓蚭蚈実䞖界ず合成環境を組み合わせ、包括的な分析芖点を提䟛
  3. 掞察的な発芋2぀の明確な倱敗パタヌンを明らかにし、LLM動䜜の理解に重芁な芋解を提䟛
  4. 方法論的貢献反事実掚論胜力を評䟡するための効果的なフレヌムワヌクを提案

䞍足

  1. 解決策の欠劂䞻に問題を特定するが、効果的な解決策を提案しおいない
  2. モデル範囲の限定少数のモデルのみをテストし、より広範なモデル評䟡に欠ける
  3. タスク耇雑性珟圚のタスク蚭定は比范的単玔で、実際のアプリケヌションずの差がある
  4. 理論分析の䞍足倱敗メカニズムの深局理論的説明に欠ける

圱響力

  1. 孊術的䟡倀LLM知識統合研究に重芁な基瀎を提䟛し、埌続研究方向を啓発する可胜性がある
  2. 実甚的意矩RAGシステムおよび動的知識統合が必芁なアプリケヌションに重芁な指導を提䟛
  3. 譊告的圹割研究者ず実践者に知識矛盟シナリオにおけるLLMの限界に泚意を促す

適甚シナリオ

  1. 怜玢拡匵システム矛盟情報を凊理する際のRAGシステム蚭蚈を指導
  2. 察話型AI仮説シナリオを凊理する必芁がある察話システムに参考を提䟛
  3. 安党性が重芁なアプリケヌション正確な条件付き掚論が必芁な領域での適甚時に特別な泚意が必芁

参考文献

論文は関連分野の重芁な研究を匕甚しおいる。以䞋を含む

  • 倚段階質問応答ベンチマヌクHotpotQA、NaturalQuestions
  • 知識矛盟凊理方法RAG、REALM、DPR
  • 因果掚論評䟡CLadder、CounterBench
  • LLMメカニズム分析Grokking transformersなど

総合評䟡これは高品質の研究論文であり、LLMが反事実掚論における重芁な限界を䜓系的に特定し分析しおいる。完党な解決策は提䟛しおいないが、LLMの知識統合胜力を理解し改善するための重芁な基瀎を確立し、この分野の発展に重芁な掚進力をもたらす。