Studies with impossible languages falsify LMs as models of human language
Bowers, Mitchell
According to Futrell and Mahowald [arXiv:2501.17047], both infants and language models (LMs) find attested languages easier to learn than impossible languages that have unnatural structures. We review the literature and show that LMs often learn attested and many impossible languages equally well. Difficult to learn impossible languages are simply more complex (or random). LMs are missing human inductive biases that support language acquisition.
academic
Los estudios con lenguajes imposibles falsifican los LMs como modelos del lenguaje humano
Este artículo es un comentario sobre el trabajo de Futrell y Mahowald (F&M) respecto a los modelos de lenguaje y el aprendizaje del lenguaje humano. F&M afirman que tanto los bebés como los modelos de lenguaje (LMs) encuentran que los lenguajes reales son más fáciles de aprender que los "lenguajes imposibles" con estructuras no naturales. Los autores, mediante una revisión de la literatura, demuestran que los LMs frecuentemente pueden aprender con igual facilidad tanto lenguajes reales como muchos lenguajes imposibles. Los lenguajes imposibles que son difíciles de aprender son simplemente más complejos o aleatorios. Los autores argumentan que los LMs carecen de los sesgos inductivos (inductive biases) que sustentan la adquisición del lenguaje humano.
Este artículo se enfoca en una cuestión teórica fundamental: ¿Son los modelos de lenguaje (LMs) modelos apropiados para la adquisición del lenguaje humano?
El misterio de la velocidad de adquisición del lenguaje: Los bebés pueden aprender lenguaje a una velocidad asombrosa, lo cual representa el desafío central para los modelos de adquisición del lenguaje
Punto focal del debate teórico: La teoría de la Gramática Universal (Universal Grammar, UG) de Chomsky sostiene que los humanos poseen sesgos inductivos del lenguaje innatos, que no solo restringen la estructura de todos los lenguajes reales, sino que también permiten a los niños aprender rápidamente
El desafío de los LMs: Grandes modelos de lenguaje como ChatGPT carecen de conocimiento previo similar al humano, pero aún así muestran un desempeño excelente en diversas tareas lingüísticas, lo que cuestiona las teorías lingüísticas tradicionales
La perspectiva de F&M: Afirman que los LMs, al igual que los humanos, encuentran que los lenguajes reales son más fáciles de aprender que los lenguajes imposibles, lo que sugiere que los LMs poseen sesgos inductivos alineados con el lenguaje humano
La crítica de Chomsky: Sostiene que la capacidad de los LMs para aprender con igual facilidad tanto lenguajes posibles como imposibles para los humanos es su defecto más profundo como modelo del lenguaje humano
Divergencia en la interpretación de la literatura: Las diferentes interpretaciones de los mismos estudios conducen a conclusiones opuestas
Los autores tienen como objetivo, mediante una revisión sistemática de la literatura, aclarar la evidencia empírica sobre la capacidad de los LMs para aprender lenguajes imposibles, desafiar el punto de vista de F&M y respaldar la afirmación de Chomsky de que los LMs carecen de sesgos inductivos del lenguaje humano.
Revisión sistemática de la literatura: Revisión y reanalisis exhaustivos de investigaciones recientes sobre la capacidad de los LMs para aprender lenguajes imposibles
Aclaración de la evidencia empírica: Revelación de malinterpretaciones de F&M sobre investigaciones existentes, demostrando que los LMs en realidad pueden aprender fácilmente muchos lenguajes imposibles
Análisis teórico: Distinción entre "difícil de aprender" y "estructuralmente complejo/aleatorio", argumentando que los lenguajes imposibles difíciles de aprender son simplemente más complejos o aleatorios
Apoyo a la afirmación de Chomsky: Proporciona evidencia de que los LMs carecen de sesgos inductivos del aprendizaje del lenguaje específicos de los humanos
Crítica metodológica: Señala la aplicabilidad del "teorema de no hay almuerzo gratis", argumentando que el desempeño deficiente de los LMs en ciertos lenguajes no es sorprendente
Lenguajes Reales (Attested Languages): Lenguajes naturales que los humanos realmente utilizan
Lenguajes Imposibles (Impossible Languages): Lenguajes artificialmente construidos que violan las restricciones de la Gramática Universal, como lenguajes con orden de palabras completamente invertido
Lenguajes Complejos/Aleatorios: Lenguajes que carecen de estructura o contienen múltiples reglas aleatorias
La innovación de este artículo no radica en métodos técnicos, sino en la profundidad del análisis teórico:
Distinción de tipos de lenguaje: Diferenciación clara entre "lenguajes imposibles que violan UG" y "lenguajes aleatorios/complejos"
Reinterpretación de resultados empíricos: Señalamiento de cómo F&M y otros confunden la complejidad del lenguaje con la posibilidad del lenguaje
Verificación de consistencia teórica: Uso del "teorema de no hay almuerzo gratis" para argumentar que el desempeño deficiente de los LMs en ciertos lenguajes es inevitable, no puede servir como evidencia de apoyo a que posean sesgos inductivos similares a los humanos
Este artículo no contiene nuevos experimentos, sino un reanalisis de investigaciones ya publicadas. Los autores revisan sistemáticamente los siguientes estudios:
Diseño experimental: Prueba de la capacidad de los LMs para aprender inglés y múltiples lenguajes imposibles
Interpretación de F&M: Los LMs aprenden texto inglés real consistentemente más rápido que los lenguajes imposibles de referencia
Reanalisis de los autores:
Aunque se reportaron dos lenguajes imposibles difíciles de aprender, múltiples lenguajes imposibles fueron casi tan fáciles de aprender como el inglés
Incluyendo un lenguaje imposible diseñado por Mitchell & Bowers (2020)
El lenguaje imposible más difícil de aprender fue el barajado de orden de palabras aleatorio (sin estructura para aprender)
Otro lenguaje difícil fue el barajado aleatorio determinista (utiliza diferentes reglas de barajado para diferentes longitudes de oración, equivalente a aprender múltiples lenguajes aleatorios)
Diseño experimental: Evaluación del desempeño de los LMs en múltiples lenguajes imposibles, incluyendo lenguajes con barajado determinista
Hallazgos: Múltiples lenguajes imposibles son fáciles de aprender, los lenguajes con barajado aleatorio son difíciles
Crítica de los autores: Los autores cometieron el error de creer que Chomsky predice que los LMs deberían poder aprender lenguajes con barajado aleatorio, pero aprender múltiples lenguajes aleatorios diferentes (uno para cada longitud de oración) es difícil bajo cualquier teoría
Diseño experimental: Variación de la plausibilidad del lenguaje en lugar de su imposibilidad
Hallazgos: Los LMs tienen dificultades con ciertos lenguajes implausibles, pero en otros casos aprenden fácilmente
Observación de los autores: Los investigadores mismos reconocen que la construcción del material puede tener errores, resultando en ruido aumentado en el corpus contrafáctico
Hallazgos: Reportan múltiples lenguajes imposibles que los LMs pueden aprender fácilmente, incluyendo lenguajes parcialmente invertidos (replicando los resultados de Mitchell & Bowers, 2020)
Los autores citan la teoría de Wolpert & Macready (2002):
Punto central: Un algoritmo de aprendizaje que funciona bien en una clase de datos debe funcionar mal en otros datos
Implicación: El desempeño deficiente de los LMs en ciertos lenguajes (como barajado aleatorio) es inevitable, no requiere confirmación empírica
Distinción clave: Desempeño deficiente en ciertos lenguajes ≠ posesión de sesgos inductivos similares a los humanos
Lógica de falsación: El aprendizaje exitoso de ciertos lenguajes imposibles falsifica que los LMs sean un modelo apropiado del aprendizaje del lenguaje humano
Oración original (longitud 5): The cat sat on mat
Regla de barajado 1 (longitud 5): cat The on sat mat
Oración original (longitud 6): The big cat sat on mat
Regla de barajado 2 (longitud 6): big The sat cat mat on
Análisis: Aprender este lenguaje es equivalente a aprender múltiples mapeos aleatorios diferentes, con complejidad que crece linealmente con el número de tipos de longitud de oración. Esto no es una prueba de sesgos UG, sino una prueba de la capacidad de memorizar múltiples mapeos arbitrarios.
Ciertas reglas de orden de palabras se invierten sistemáticamente, pero mantienen consistencia.
Hallazgo: Los LMs pueden aprender fácilmente, lo que indica que carecen de sesgos inductivos que excluyan este tipo de lenguajes.
Este artículo se sitúa en la tradición de la lingüística chomskiana, refutando los argumentos más recientes del bando del conexionismo/aprendizaje estadístico mediante reanalisis de investigaciones empíricas.
La evidencia empírica no respalda la perspectiva de F&M: Los LMs frecuentemente pueden aprender con igual facilidad tanto lenguajes reales como lenguajes imposibles
Los "lenguajes imposibles" difíciles de aprender son complejos/aleatorios: La dificultad de aprendizaje proviene de la complejidad, no de la violación de UG
Los LMs carecen de sesgos inductivos humanos: Combinando la evidencia de lenguajes imposibles fáciles de aprender y baja eficiencia de datos, el patrón de aprendizaje de los LMs es fundamentalmente diferente del humano
"No hay almuerzo gratis" no puede servir como evidencia de apoyo: El desempeño deficiente de los LMs en ciertos lenguajes es inevitable, no puede probar que posean sesgos similares a los humanos
Los LMs no son un modelo apropiado de adquisición del lenguaje humano: La forma de aprender de los LMs actuales es exactamente lo que se esperaría de la falta de sesgos del lenguaje innatos humanos
Definición borrosa de "lenguajes imposibles": Diferentes estudios utilizan definiciones diferentes, el artículo no discute suficientemente este problema
Criterios para "fácil" vs "difícil": Sin criterios cuantitativos explícitos
Medida de "complejidad": ¿Cómo cuantificar la complejidad del lenguaje?
Argumentación sobre lenguajes con barajado determinista: Aunque señala su complejidad, si esta complejidad está completamente desvinculada de la violación de UG sigue siendo discutible
Aplicabilidad del "teorema de no hay almuerzo gratis": Este teorema se aplica a problemas de optimización, su aplicación directa al aprendizaje del lenguaje requiere más argumentación
Falta de consideración de explicaciones alternativas: Los LMs pueden tener otros tipos de sesgos inductivos (como preferencia por localidad), solo que diferentes de UG
Implicaciones para investigación en IA: Comprender los sesgos inductivos de los LMs tiene valor para mejorar modelos
Implicaciones para educación: Si los LMs aprenden de manera diferente a los humanos, no pueden usarse directamente para simular la enseñanza del lenguaje
Alta: El artículo es principalmente una revisión de literatura, todos los estudios citados ya están publicados, los lectores pueden verificar el análisis de los autores
Este es un artículo de comentario con posición teórica clara, argumentación lógica rigurosa, pero base empírica relativamente débil. Los autores, mediante análisis profundo de literatura existente, desafían efectivamente la perspectiva de que "los LMs poseen sesgos inductivos del lenguaje similares a los humanos", apoyando la posición de la lingüística tradicional de Chomsky.
El mayor valor radica en su aclaración conceptual (diferenciación entre complejidad e imposibilidad) y análisis lógico (aplicación de lógica de falsación y "teorema de no hay almuerzo gratis"), que tienen contribución metodológica importante para este campo.
Las limitaciones principales radican en la falta de nuevos datos empíricos y análisis profundo de mecanismos internos de LMs. Como artículo de comentario, esto es comprensible, pero también limita su poder persuasivo.
Este artículo promoverá discusión profunda sobre la naturaleza de los LMs entre la lingüística y la IA, impulsará diseño experimental más riguroso, pero probablemente no cambiará inmediatamente las posiciones fundamentales de ambos bandos. La resolución de este debate probablemente requiera más investigación empírica, marcos teóricos más precisos, y posiblemente evidencia independiente de la neurociencia.