Reasoning is an important task for large language models (LLMs). Among all the reasoning paradigms, inductive reasoning is one of the fundamental types, which is characterized by its particular-to-general thinking process and the non-uniqueness of its answers. The inductive mode is crucial for knowledge generalization and aligns better with human cognition, so it is a fundamental mode of learning, hence attracting increasing interest. Despite the importance of inductive reasoning, there is no systematic summary of it. Therefore, this paper presents the first comprehensive survey of inductive reasoning for LLMs. First, methods for improving inductive reasoning are categorized into three main areas: post-training, test-time scaling, and data augmentation. Then, current benchmarks of inductive reasoning are summarized, and a unified sandbox-based evaluation approach with the observation coverage metric is derived. Finally, we offer some analyses regarding the source of inductive ability and how simple model architectures and data help with inductive tasks, providing a solid foundation for future research.
Un Sondage du Raisonnement Inductif pour les Grands Modèles de Langage
- ID de l'article: 2510.10182
- Titre: A Survey of Inductive Reasoning for Large Language Models
- Auteurs: Kedi Chen, Dezhao Ruan, Yuhao Dan, Yaoting Wang, Siyu Yan, Xuecheng Wu, Yinqi Zhang, Qin Chen, Jie Zhou, Liang He, Biqing Qi, Linyang Li, Qipeng Guo, Xiaoming Shi, Wei Zhang
- Classification: cs.CL cs.AI
- Date de publication: 11 octobre 2025 (soumission arXiv)
- Lien de l'article: https://arxiv.org/abs/2510.10182v1
Le raisonnement constitue une tâche importante pour les grands modèles de langage (LLMs). Parmi tous les paradigmes de raisonnement, le raisonnement inductif est l'un des types fondamentaux, caractérisé par un processus de pensée allant du particulier au général et par la non-unicité des réponses. Les modèles de raisonnement inductif sont essentiels pour la généralisation des connaissances, correspondent mieux à la cognition humaine et constituent un mode d'apprentissage fondamental, attirant ainsi une attention croissante. Malgré l'importance du raisonnement inductif, il n'existe actuellement pas de synthèse systématique. Par conséquent, cet article présente le premier sondage complet du raisonnement inductif pour les LLMs. Premièrement, les méthodes d'amélioration du raisonnement inductif sont classées en trois domaines principaux: l'entraînement post-hoc, l'extension au moment du test et l'augmentation des données. Ensuite, les repères actuels du raisonnement inductif sont synthétisés, et une méthode d'évaluation unifiée basée sur un bac à sable ainsi qu'une métrique de couverture d'observations sont proposées. Enfin, les sources de la capacité inductive sont analysées, et la manière dont les architectures de modèles simples et les données facilitent les tâches inductives est examinée, fournissant une base solide pour les recherches futures.
- Problème central: Bien que le raisonnement inductif occupe une place importante dans les LLMs, il manque une synthèse systématique de la recherche et un cadre méthodologique.
- Manifestations de l'importance:
- Le raisonnement inductif est une capacité cognitive fondamentale permettant de déduire des lois générales à partir d'observations particulières
- Il correspond mieux aux modèles de cognition humaine et constitue une clé pour la généralisation des connaissances
- Il possède des applications largement répandues dans les tâches en aval du traitement du langage naturel et dans les scénarios réels
- Contrairement au raisonnement déductif, le raisonnement inductif se caractérise par la non-unicité des réponses
- Biais de recherche: Les travaux antérieurs se concentrent principalement sur le raisonnement déductif (comme les preuves mathématiques et la vérification de programmes), avec une attention insuffisante au raisonnement inductif
- Manque de systématicité: Absence d'une classification unifiée des méthodes et d'un cadre d'évaluation
- Analyse théorique insuffisante: Manque d'analyse approfondie des sources de la capacité inductive et des facteurs d'influence
Cet article vise à combler le vide dans la recherche sur le raisonnement inductif des LLMs, en fournissant le premier cadre de sondage complet et en posant les fondations pour le développement de ce domaine.
- Premier sondage complet: Fournit le premier examen systématique du domaine du raisonnement inductif pour les LLMs
- Nouveau système de classification: Les méthodes d'amélioration sont classées en trois catégories: entraînement post-hoc, extension au moment du test et augmentation des données
- Cadre d'évaluation unifié: Propose une méthode d'évaluation basée sur un bac à sable et une métrique de couverture d'observations (OC)
- Analyse théorique: Analyse approfondie des sources de la capacité inductive et du rôle des architectures simples et des données
- Perspective prospective: Non seulement synthétise les méthodes existantes, mais anticipe également les directions futures
Les caractéristiques essentielles des tâches de raisonnement inductif:
- Entrée: Instances ou cas d'observation concrets
- Sortie: Lois ou règles générales déduites des observations
- Caractéristiques: Processus de pensée allant du particulier au général, réponses non uniques
Génération de données synthétiques:
- LingR: Construction d'ensembles d'instructions de règles linguistiques permettant au modèle d'apprendre le raisonnement progressif basé sur les règles linguistiques
- ItD: Utilisation de la capacité de raisonnement déductif des LLMs pour générer des données optimisant la capacité inductive
- CodeSeq: Construction d'ensembles d'entraînement pour les formules générales de séquences numériques
Optimisation de style IRL:
- Utilisation de concepts d'apprentissage par renforcement inverse (IRL) pour concevoir des modèles de récompense
- Le processus RLHF est essentiellement un IRL, déduisant les fonctions de récompense potentielles par le retour humain
- Prompt-OIRL: Entraînement de modèles de récompense basé sur l'expérience historique des invites
Sélection d'hypothèses:
- MoC: Génération de listes de concepts sémantiquement non redondants, génération d'hypothèses basées sur chaque concept
- EPIC: Utilisation de petits LLMs pour générer des encodages candidats, filtrage par un mécanisme de modulation
Itération d'hypothèses:
- Optimisation d'hypothèses itératives en trois étapes: génération de multiples hypothèses → évaluation de la capacité de couverture → correction basée sur le retour
- SSR: Optimisation itérative des règles candidates par retour d'exécution
- ARISE: Optimisation itérative des règles inductives utilisées ensuite pour l'entraînement du modèle
Évolution d'hypothèses:
- IncSchema: Interrogation progressive des LLMs, induction graduelle de modèles généraux
- HRI: Génération de méta-règles inductives et appariement avec des échantillons, évolution vers des règles de logique du premier ordre
- PRIMO: Méthode progressive d'induction de règles ouvertes multi-étapes
Intervention humaine:
- SS-VQ-VAE: Découverte de nouveaux modèles dépendant d'informations d'annotation humaine limitées
- Importance des connaissances d'experts et des informations d'annotation humaine
Récupération de connaissances externes:
- LLEGO: Intégration des connaissances sémantiques antérieures des LLMs dans les opérations de programmation génétique
- Utilisation des connaissances paramétriques d'autres LLMs comme source d'information supplémentaire
Signaux structurés:
- Utilisation d'informations de sous-graphes ou de contexte fournissant des signaux implicites locaux
- QARR: Extraction de sous-graphes ouverts d'entités de requête pour le raisonnement inductif
- REST: Déploiement de sous-graphes induits par des règles capturant les modèles sémantiques locaux
L'article synthétise 17 repères principaux du raisonnement inductif:
| Type d'Objet | Nom du Repère | Entrée d'Observation | Cible Inductive | Nombre d'Échantillons |
|---|
| Entité | SCAN | État de l'entité | État-action | 7,700 |
| Grille | ARC | Paires de grilles | Règles de transformation de grille | 400 |
| Liste | List Functions | Paires de listes numériques | Règles d'opération de liste | 250 |
| Code | PROGES | Entrée-sortie | Programme | 10,000 |
| Chaîne | SyGuS | Paires de chaînes | Programme de mappage de chaînes | 2,000 |
| Nombre | CodeSeq | Séquence numérique | Formule générale | 1,500 |
Évaluation traditionnelle:
- Précision (ACC), correspondance exacte, taux de réussite, etc.
Évaluation en bac à sable nouvellement proposée:
- Couverture d'observations (OC): Proportion d'observations réussissant les tests unitaires
- Fournit des signaux de supervision plus granulaires
Méthodes d'entraînement post-hoc:
- Les méthodes de données synthétiques améliorent considérablement les performances du modèle sur les tâches inductives spécifiques
- L'optimisation de style IRL montre des avantages dans la gestion de la non-unicité des réponses
Extension au moment du test:
- Les méthodes d'itération d'hypothèses se distinguent dans les tâches de chaînes de raisonnement complexes
- Les méthodes d'évolution d'hypothèses peuvent capturer des modèles plus complexes
Augmentation des données:
- La récupération de connaissances externes montre des résultats significatifs dans les tâches à forte intensité de connaissances
- Les signaux structurés jouent un rôle important dans l'amélioration de la capacité de généralisation
- Importance des têtes inductives: La capacité inductive provient des têtes inductives dans les mécanismes d'attention
- Principe de simplicité: Les architectures de modèles simples et les données simples favorisent souvent le raisonnement inductif
- Complémentarité des méthodes diversifiées: Différents types de méthodes présentent des avantages dans différents scénarios
- Raisonnement déductif: Preuves mathématiques, vérification de programmes et autres raisonnements logiques
- Raisonnement par analogie: Raisonnement du particulier au particulier basé sur la similarité
- Apprentissage en contexte: Reconnaissance de modèles basée sur des exemples
- Premier examen systématique de ce domaine négligé mais important du raisonnement inductif
- Fournit un cadre méthodologique complet et un système d'évaluation
- Analyse approfondie des fondations théoriques du raisonnement inductif
- Le raisonnement inductif est une capacité fondamentale des LLMs, essentielle pour la généralisation des connaissances
- Les trois classes de méthodes d'amélioration ont chacune leurs caractéristiques et doivent être sélectionnées selon la tâche spécifique
- La simplicité joue un rôle clé dans le raisonnement inductif
- Un cadre d'évaluation unifié contribue à promouvoir le développement du domaine
- Contraintes d'espace: En raison des limitations d'espace, de nombreux détails n'ont pas pu être détaillés dans le texte principal
- Nombre limité d'études: Les recherches connexes au raisonnement inductif sont relativement peu nombreuses, ce qui rend difficile la production d'une synthèse systématique à grande échelle
- Profondeur de l'analyse théorique: La compréhension théorique des mécanismes inductifs nécessite un approfondissement supplémentaire
- Innovation méthodologique: Schémas hybrides combinant plusieurs méthodes
- Perfectionnement de l'évaluation: Développement de repères d'évaluation et de métriques plus complets
- Approfondissement théorique: Compréhension plus approfondie des mécanismes neuraux de la capacité inductive
- Extension des applications: Validation des méthodes de raisonnement inductif dans davantage de scénarios pratiques
- Travail novateur: Comble le vide dans la recherche sur le raisonnement inductif des LLMs
- Force systématique: Fournit un cadre de classification complet et un système d'évaluation
- Perspective prospective: Non seulement examine les travaux existants, mais anticipe également les développements futurs
- Valeur pratique élevée: Fournit aux chercheurs une feuille de route de recherche claire
- Équilibre entre théorie et pratique: Combine la synthèse des méthodes et l'analyse théorique
- Analyse de profondeur limitée: En tant qu'article de synthèse, l'analyse des détails techniques des méthodes spécifiques est relativement limitée
- Manque de validation expérimentale: Principalement une synthèse des méthodes, manquant de comparaisons expérimentales unifiées
- Fondations théoriques faibles: Discussion insuffisante des fondations en sciences cognitives et neurosciences du raisonnement inductif
- Valeur académique: Établit un cadre de recherche pour un domaine émergent, devrait devenir une référence importante
- Signification pratique: Fournit des orientations méthodologiques pour l'application industrielle du raisonnement inductif
- Effet de promotion: Devrait inspirer davantage de chercheurs à s'intéresser au domaine du raisonnement inductif
- Introduction à la recherche: Fournit un aperçu complet aux chercheurs entrant dans ce domaine
- Sélection de méthodes: Fournit des orientations pour le choix des méthodes dans les applications pratiques
- Recherche future: Fournit un cadre de référence pour la détermination des directions de recherche
L'article cite un grand nombre de travaux connexes, comprenant principalement:
- Recherche fondamentale sur les grands modèles de langage (Zhao et al., 2023; Wei et al., 2021)
- Recherche sur les capacités de raisonnement (Huang and Chang, 2022; Plaat et al., 2024)
- Fondations théoriques du raisonnement inductif (Arthur, 1994; Heit, 2000)
- Méthodes et repères spécifiques (Chollet, 2019; Rule, 2020, etc.)
Évaluation globale: Ceci est un article de synthèse de haute qualité qui examine systématiquement le raisonnement inductif pour les LLMs, un domaine de recherche important mais négligé. Le cadre de classification de l'article est clair, la couverture est large, et il possède une valeur importante pour promouvoir le développement du domaine. Bien qu'il présente certaines insuffisances en termes de profondeur technique et de validation expérimentale, en tant que première synthèse systématique, sa signification novatrice et sa valeur académique sont indéniables.