Studies with impossible languages falsify LMs as models of human language
Bowers, Mitchell
According to Futrell and Mahowald [arXiv:2501.17047], both infants and language models (LMs) find attested languages easier to learn than impossible languages that have unnatural structures. We review the literature and show that LMs often learn attested and many impossible languages equally well. Difficult to learn impossible languages are simply more complex (or random). LMs are missing human inductive biases that support language acquisition.
academic
Les études avec des langues impossibles réfutent les modèles de langage comme modèles du langage humain
Cet article est un commentaire sur l'article de Futrell et Mahowald (F&M) concernant les modèles de langage et l'apprentissage du langage chez l'humain. F&M affirment que les nourrissons et les modèles de langage (LMs) trouvent tous deux que les langues réelles sont plus faciles à apprendre que les « langues impossibles » possédant des structures non naturelles. Les auteurs, par le biais d'une revue de littérature, démontrent que les LMs peuvent souvent apprendre tout aussi facilement les langues réelles et de nombreuses langues impossibles. Les langues impossibles difficiles à apprendre sont simplement plus complexes ou aléatoires. Les auteurs soutiennent que les LMs manquent des biais inductifs (inductive biases) qui soutiennent l'acquisition du langage chez l'humain.
Cet article se concentre sur une question théorique fondamentale : Les modèles de langage (LMs) constituent-ils un modèle approprié de l'acquisition du langage chez l'humain ?
L'énigme de la vitesse d'acquisition du langage : Les nourrissons peuvent apprendre le langage à une vitesse remarquable, ce qui constitue le défi central pour les modèles d'acquisition du langage
Point focal du débat théorique : La théorie de la grammaire universelle (Universal Grammar, UG) de Chomsky affirme que les humains possèdent des biais inductifs innés spécifiques au langage, qui non seulement contraignent la structure de toutes les langues réelles, mais permettent aussi aux enfants d'apprendre rapidement
Défi posé par les LMs : Les grands modèles de langage tels que ChatGPT, dépourvus de connaissances préalables semblables à celles des humains, démontrent néanmoins d'excellentes performances sur diverses tâches linguistiques, remettant en question les théories linguistiques traditionnelles
Point de vue de F&M : Affirment que les LMs, tout comme les humains, trouvent les langues réelles plus faciles à apprendre que les langues impossibles, suggérant que les LMs possèdent des biais inductifs alignés avec le langage humain
Critique de Chomsky : Affirme que les LMs peuvent apprendre tout aussi facilement les langues possibles et impossibles pour les humains, ce qui constitue le défaut le plus profond en tant que modèle du langage humain
Divergence dans l'interprétation de la littérature : Des interprétations différentes des mêmes études conduisent à des conclusions opposées
Les auteurs visent à clarifier, par le biais d'une revue systématique de la littérature, les preuves empiriques concernant la capacité des LMs à apprendre les langues impossibles, à contester le point de vue de F&M et à soutenir l'affirmation de Chomsky selon laquelle les LMs manquent des biais inductifs linguistiques humains.
Revue systématique de la littérature : Examen complet et réanalyse des recherches récentes sur l'apprentissage des langues impossibles par les LMs
Clarification des preuves empiriques : Révélation de la mauvaise interprétation par F&M des recherches existantes, montrant que les LMs peuvent en réalité apprendre facilement de nombreuses langues impossibles
Analyse théorique : Distinction entre « difficile à apprendre » et « structure complexe/aléatoire », arguant que les langues impossibles difficiles à apprendre sont simplement plus complexes ou aléatoires
Soutien de l'affirmation de Chomsky : Fourniture de preuves montrant que les LMs manquent des biais inductifs d'apprentissage linguistique spécifiquement humains
Critique méthodologique : Indication de l'applicabilité du « théorème du déjeuner gratuit », arguant que la mauvaise performance des LMs sur certaines langues n'est pas surprenante
Langues attestées (Attested Languages) : Langues naturelles réellement utilisées par les humains
Langues impossibles (Impossible Languages) : Langues construites artificiellement violant les contraintes de la grammaire universelle, comme les langues avec un ordre des mots complètement inversé
Langues complexes/aléatoires : Langues manquant de structure ou contenant plusieurs règles aléatoires
Prédiction de Chomsky : Si les LMs manquent d'UG, ils devraient pouvoir apprendre tout aussi facilement les langues impossibles
Contre-argument de F&M : Affirme que les LMs démontrent des préférences d'apprentissage cohérentes avec les humains
« Théorème du déjeuner gratuit » : Tout algorithme d'apprentissage performant sur une classe de données doit nécessairement performer moins bien sur d'autres données
L'innovation de cet article ne réside pas dans les méthodes techniques, mais dans la profondeur de l'analyse théorique :
Distinction des types de langues : Distinction claire entre « langues impossibles violant l'UG » et « langues aléatoires/complexes »
Réinterprétation des résultats empiriques : Indication que F&M et d'autres confondent la complexité linguistique avec la possibilité linguistique
Vérification de la cohérence théorique : Utilisation du « théorème du déjeuner gratuit » pour argumenter que la mauvaise performance des LMs sur certaines langues est inévitable et ne peut pas servir de preuve du soutien de leurs biais inductifs semblables à ceux des humains
Cet article ne contient pas de nouvelles expériences, mais plutôt une réanalyse des recherches publiées. Les auteurs examinent systématiquement les recherches suivantes :
Conception expérimentale : Test de la capacité des LMs à apprendre l'anglais et diverses langues impossibles
Interprétation de F&M : Les LMs apprennent toujours plus rapidement les textes anglais réels que les langues impossibles de base
Réanalyse des auteurs :
Bien que deux langues impossibles difficiles à apprendre aient été rapportées, plusieurs langues impossibles sont presque aussi faciles à apprendre que l'anglais
Y compris une langue impossible conçue par Mitchell & Bowers (2020)
La langue impossible la plus difficile à apprendre est l'ordre des mots aléatoire complètement mélangé (sans structure à apprendre)
Une autre langue difficile est le mélange aléatoire déterministe (différentes longueurs de phrases utilisent différentes règles de mélange, équivalent à apprendre plusieurs langues aléatoires)
Conception expérimentale : Évaluation de la performance des LMs sur diverses langues impossibles, y compris les langues avec mélange déterministe
Découverte : De nombreuses langues impossibles sont faciles à apprendre, les langues avec mélange aléatoire sont difficiles
Critique des auteurs : Les auteurs ont incorrectement supposé que Chomsky prédisait que les LMs devraient pouvoir apprendre les langues avec mélange aléatoire, mais apprendre plusieurs langues aléatoires différentes (pour différentes longueurs de phrases) est difficile sous n'importe quelle théorie
Conception expérimentale : Variation de la plausibilité plutôt que de l'impossibilité des langues
Découverte : Les LMs ont des difficultés avec certaines langues implausibles, mais apprennent facilement dans d'autres cas
Remarque des auteurs : Les chercheurs eux-mêmes reconnaissent que la construction du matériel peut contenir des erreurs, entraînant du bruit dans le corpus contrefactuel
Découverte : Rapport de plusieurs langues impossibles que les LMs peuvent apprendre facilement, y compris les langues partiellement inversées (réplication du résultat de Mitchell & Bowers, 2020)
Les auteurs citent la théorie de Wolpert & Macready (2002) :
Point central : Un algorithme d'apprentissage performant sur une classe de données doit nécessairement performer moins bien sur d'autres données
Déduction : La mauvaise performance des LMs sur certaines langues (comme le mélange aléatoire) est inévitable et ne nécessite pas de confirmation empirique
Distinction clé : Performer mal sur certaines langues ≠ posséder des biais inductifs semblables à ceux des humains
Logique de réfutation : Apprendre avec succès certaines langues impossibles réfute que les LMs constituent un modèle approprié de l'apprentissage du langage humain
Phrase originale (longueur 5) : The cat sat on mat
Règle de mélange 1 (longueur 5) : cat The on sat mat
Phrase originale (longueur 6) : The big cat sat on mat
Règle de mélange 2 (longueur 6) : big The sat cat mat on
Analyse : Apprendre cette langue équivaut à apprendre plusieurs mappages aléatoires différents, la complexité augmentant linéairement avec le nombre de longueurs de phrases. Ce n'est pas un test des biais de l'UG, mais un test de la capacité à mémoriser plusieurs mappages arbitraires.
Certaines règles d'ordre des mots sont systématiquement inversées, mais restent cohérentes.
Découverte : Les LMs peuvent apprendre facilement, indiquant qu'ils manquent des biais inductifs pour exclure ce type de langue.
Cet article s'inscrit dans la tradition linguistique de Chomsky, réfutant par réanalyse des recherches empiriques les arguments récents du camp connexionniste/apprentissage statistique.
Les preuves empiriques ne soutiennent pas le point de vue de F&M : Les LMs peuvent souvent apprendre tout aussi facilement les langues réelles et les langues impossibles
Les « langues impossibles » difficiles à apprendre sont complexes/aléatoires : La difficulté d'apprentissage provient de la complexité plutôt que de la violation de l'UG
Les LMs manquent des biais inductifs humains : Combinant les preuves des langues impossibles faciles à apprendre et de la faible efficacité des données, le modèle d'apprentissage des LMs diffère fondamentalement de celui des humains
Le « déjeuner gratuit » ne peut pas servir de preuve de soutien : La mauvaise performance des LMs sur certaines langues est inévitable et ne peut pas prouver qu'ils possèdent des biais semblables à ceux des humains
Les LMs ne constituent pas un modèle approprié de l'acquisition du langage humain : La façon dont les LMs apprennent actuellement est exactement ce qu'on attendrait de l'absence de biais linguistiques innés humains
Absence de nouvelles données empiriques : Basé uniquement sur une revue de littérature, sans nouvelles expériences de vérification
Définition floue des langues impossibles : Les définitions opérationnelles de « langue impossible » varient selon les études, ce que l'article ne discute pas suffisamment
Exploration insuffisante des mécanismes : N'analyse pas en détail pourquoi les LMs peuvent apprendre les langues impossibles
Taille d'échantillon limitée : Le nombre d'études examinées est relativement petit (principalement 5 articles récents)
Validité écologique des langues impossibles : Les langues impossibles construites artificiellement peuvent ne pas capturer complètement les contraintes de l'UG
Diversité des LMs : Différentes architectures de LMs peuvent avoir des performances différentes, mais l'article ne les distingue pas suffisamment
Problèmes de mesure : Comment mesurer précisément la « difficulté d'apprentissage » reste controversé
Comparaison entre modèles : Comparaison systématique des biais inductifs de différentes architectures de LMs
Études de trajectoire développementale : Comparaison des courbes d'apprentissage des LMs et des enfants
Modèles hybrides : Exploration de l'intégration des connaissances préalables linguistiques dans les LMs
Vérification neuroscientifique : Utilisation d'études d'imagerie cérébrale pour vérifier les mécanismes neuraux du traitement des langues impossibles par les humains
Utilise la logique de réfutation : apprendre avec succès les langues impossibles réfute que les LMs constituent un modèle du langage humain
Indique l'asymétrie dans l'argumentation de l'adversaire : la difficulté d'apprentissage de certaines langues ne peut pas prouver les biais inductifs semblables à ceux des humains
Argumentation sur les langues avec mélange déterministe : Bien que soulignant leur complexité, on peut débattre si cette complexité est complètement indépendante de la violation de l'UG
Applicabilité du « théorème du déjeuner gratuit » : Ce théorème s'applique aux problèmes d'optimisation ; son application directe à l'apprentissage linguistique nécessite plus d'argumentation
Absence de considération des explications alternatives : Les LMs peuvent avoir d'autres types de biais inductifs (comme une préférence pour la localité), simplement différents de l'UG
Position claire : Clairement du côté de Chomsky, ce qui peut affecter l'objectivité
Critique plus sévère des recherches adverses : Comme indiquer « mauvaise interprétation », « erreur », etc. ; le ton du débat académique pourrait être plus mesuré
Implications pour la recherche en IA : La compréhension des biais inductifs des LMs a de la valeur pour l'amélioration des modèles
Implications pour l'éducation : Si la façon dont les LMs apprennent diffère de celle des humains, ils ne peuvent pas être directement utilisés pour simuler l'enseignement du langage
Élevée : L'article est principalement une revue de littérature ; toutes les études citées sont publiées, et les lecteurs peuvent vérifier l'analyse de l'auteur
Ceci est un article de commentaire avec une position théorique claire, une argumentation logique rigoureuse, mais un fondement empirique relativement faible. Les auteurs, par une analyse approfondie de la littérature existante, contestent efficacement le point de vue selon lequel « les LMs possèdent des biais inductifs linguistiques semblables à ceux des humains », soutenant la position linguistique traditionnelle de Chomsky.
La plus grande valeur réside dans sa clarification conceptuelle (distinction entre complexité et impossibilité) et son analyse logique (application de la logique de réfutation et du « théorème du déjeuner gratuit »), qui contribuent significativement à la méthodologie du domaine.
Les principales limitations résident dans l'absence de nouvelles données empiriques et l'analyse insuffisante des mécanismes internes des LMs. En tant qu'article de commentaire, ceci est compréhensible, mais cela limite également sa force de persuasion.
Cet article promouvra une discussion approfondie sur la nature des LMs entre les domaines de la linguistique et de l'IA, encouragera une conception expérimentale plus rigoureuse, mais peut ne pas changer immédiatement les positions fondamentales des deux camps. La résolution de ce débat nécessitera probablement plus de recherches empiriques, un cadre théorique plus précis, et possiblement des preuves indépendantes provenant des neurosciences.