2025-11-16T09:46:12.577001

ICA-RAG: Information Completeness Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis

He, Jia, Jia et al.
Retrieval-Augmented Large Language Models (LLMs), which integrate external knowledge, have shown remarkable performance in medical domains, including clinical diagnosis. However, existing RAG methods often struggle to tailor retrieval strategies to diagnostic difficulty and input sample informativeness. This limitation leads to excessive and often unnecessary retrieval, impairing computational efficiency and increasing the risk of introducing noise that can degrade diagnostic accuracy. To address this, we propose ICA-RAG (\textbf{I}nformation \textbf{C}ompleteness Guided \textbf{A}daptive \textbf{R}etrieval-\textbf{A}ugmented \textbf{G}eneration), a novel framework for enhancing RAG reliability in disease diagnosis. ICA-RAG utilizes an adaptive control module to assess the necessity of retrieval based on the input's information completeness. By optimizing retrieval and incorporating knowledge filtering, ICA-RAG better aligns retrieval operations with clinical requirements. Experiments on three Chinese electronic medical record datasets demonstrate that ICA-RAG significantly outperforms baseline methods, highlighting its effectiveness in clinical diagnosis.
academic

ICA-RAG : Génération Augmentée par Récupération Adaptative Guidée par l'Exhaustivité de l'Information pour le Diagnostic de Maladies

Informations de Base

  • ID de l'article : 2502.14614
  • Titre : ICA-RAG: Information Completeness Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis
  • Auteurs : Jiawei He, Mingyi Jia, Zhihao Jia, Junwen Duan, Yan Song, Jianxin Wang
  • Classification : cs.CL (Calcul et Langage)
  • Date de publication : Prépublication arXiv (version la plus récente du 15 octobre 2025)
  • Lien de l'article : https://arxiv.org/abs/2502.14614

Résumé

Les modèles de langage volumineux augmentés par récupération (RAG-LLMs) démontrent des performances exceptionnelles dans le domaine médical en intégrant des connaissances externes, particulièrement pour le diagnostic clinique. Cependant, les méthodes RAG existantes ont du mal à adapter les stratégies de récupération en fonction de la difficulté diagnostique et de la complétude informationnelle des échantillons d'entrée, ce qui entraîne une récupération excessive et inutile, compromettant l'efficacité computationnelle et augmentant le risque d'introduction de bruit, réduisant ainsi la précision diagnostique. Pour résoudre ce problème, cet article propose ICA-RAG (Génération Augmentée par Récupération Adaptative Guidée par l'Exhaustivité de l'Information), un nouveau cadre renforçant la fiabilité du RAG dans le diagnostic de maladies. ICA-RAG utilise un module de contrôle adaptatif pour évaluer la nécessité de récupération basée sur l'exhaustivité informationnelle de l'entrée, en optimisant la récupération et le filtrage des connaissances pour mieux aligner les opérations de récupération avec les besoins cliniques. Les expériences menées sur trois ensembles de données de dossiers médicaux électroniques chinois démontrent que ICA-RAG surpasse significativement les méthodes de base, soulignant son efficacité dans le diagnostic clinique.

Contexte de Recherche et Motivation

Contexte du Problème

Les modèles de langage volumineux font face à deux défis majeurs dans les tâches médicales :

  1. Problème d'hallucination : génération d'informations apparemment plausibles mais réellement erronées
  2. Coût de mise à jour des connaissances : nature gourmande en ressources du maintien des connaissances médicales à jour

Limitations des Méthodes RAG Existantes

  1. Absence de logique de récupération sélective : exécution indifférenciée de la récupération pour toutes les requêtes, augmentant les coûts computationnels et temporels
  2. Introduction de récupérations de faible qualité : risque de dégrader plutôt que d'améliorer les performances par l'introduction d'informations non pertinentes
  3. Spécificité du domaine médical : de nombreux cas de maladies courantes ou de symptômes légers avec diagnostic évident ne nécessitent pas de récupération pour un diagnostic précis

Insuffisances du RAG Adaptatif Existant

  1. Méthodes basées sur la distribution de sortie du LLM : les LLMs tendent à être excessivement confiants, générant des distributions de confiance élevée même en l'absence de connaissances pertinentes
  2. Méthodes basées sur des modèles de classification : dans le domaine médical, les textes d'entrée manquent généralement de motifs structurels évidents, et les petits modèles de langage ont du mal à comprendre la difficulté des tâches

Contributions Principales

  1. Proposition du cadre ICA-RAG : un cadre de diagnostic de maladies augmenté par récupération adaptative sans nécessité d'ajustement du LLM principal
  2. Méthode innovante d'annotation de données : conception d'une stratégie d'annotation basée sur des opérations de masquage, obtenant des informations d'étiquettes en provoquant différentes réponses du LLM
  3. Optimisation du processus de récupération : optimisation du flux de récupération pour les scénarios cliniques complexes
  4. Validation expérimentale : expériences étendues sur trois ensembles de données EMR chinois, démontrant l'efficacité du cadre

Explication Détaillée de la Méthode

Définition de la Tâche

Diagnostic de maladie direct : étant donné une séquence de jetons représentant le texte d'entrée x=[x1,x2,...,xn]x = [x_1, x_2, ..., x_n], la génération de texte par LLM peut être formalisée comme : D^=LLM(Q,prompt)\hat{D} = \text{LLM}(Q, \text{prompt})

Diagnostic de maladie par RAG : récupération de connaissances pertinentes d'une source de connaissances externe et intégration : D^=LLM(Q,d,prompt)\hat{D} = \text{LLM}(Q, d, \text{prompt})d=Retriever(K,Q)d = \text{Retriever}(K, Q)

Diagnostic de maladie par RAG adaptatif : introduction d'une fonction de contrôle F pour évaluer l'entrée Q :

undefined