Studies with impossible languages falsify LMs as models of human language
Bowers, Mitchell
According to Futrell and Mahowald [arXiv:2501.17047], both infants and language models (LMs) find attested languages easier to learn than impossible languages that have unnatural structures. We review the literature and show that LMs often learn attested and many impossible languages equally well. Difficult to learn impossible languages are simply more complex (or random). LMs are missing human inductive biases that support language acquisition.
academic
Исследования с невозможными языками опровергают языковые модели как модели человеческого языка
Данная статья представляет собой комментарий к работе Futrell и Mahowald (F&M) о языковых моделях и изучении языка человеком. F&M утверждают, что младенцы и языковые модели (LMs) находят естественные языки более легкими для изучения, чем "невозможные языки" с неестественной структурой. Авторы посредством обзора литературы демонстрируют, что LMs часто способны одинаково легко изучать как естественные языки, так и множество невозможных языков. Те невозможные языки, которые сложнее изучать, просто являются более сложными или случайными. Авторы утверждают, что LMs не обладают индуктивными смещениями (inductive biases), поддерживающими усвоение человеческого языка.
Загадка скорости языкового усвоения: младенцы способны изучать язык с поразительной скоростью, что представляет собой центральную проблему для моделей языкового усвоения
Фокус теоретических дебатов: теория универсальной грамматики (Universal Grammar, UG) Хомского предполагает, что люди обладают врожденными языковыми индуктивными смещениями, которые не только ограничивают структуру всех естественных языков, но и позволяют детям быстро учиться
Вызов для LMs: крупные языковые модели, такие как ChatGPT, не обладают подобными человеку априорными знаниями, однако демонстрируют отличные результаты в различных языковых задачах, что ставит под сомнение традиционные лингвистические теории
Позиция F&M: утверждают, что LMs, как и люди, находят естественные языки более легкими для изучения, чем невозможные языки, что предполагает наличие у LMs индуктивных смещений, согласованных с человеческим языком
Критика Хомского: утверждает, что LMs способны одинаково легко изучать как возможные, так и невозможные для человека языки, что является глубочайшим недостатком LMs как модели человеческого языка
Расхождения в интерпретации литературы: различные интерпретации одних и тех же исследований приводят к противоположным выводам
Авторы ставят целью посредством систематического обзора литературы уточнить эмпирические доказательства способности LMs изучать невозможные языки, оспорить точку зрения F&M и поддержать утверждение Хомского о том, что LMs не обладают человеческими индуктивными смещениями в языковом усвоении.
Систематический обзор литературы: полный обзор и переанализ недавних исследований о способности LMs изучать невозможные языки
Уточнение эмпирических доказательств: выявление неправильного толкования F&M существующих исследований, демонстрирующее, что LMs фактически легко изучают множество невозможных языков
Теоретическое разграничение: различие между "сложностью изучения" и "структурной сложностью/случайностью", аргумент о том, что сложные для изучения невозможные языки просто являются более сложными или случайными
Поддержка утверждения Хомского: предоставление доказательств того, что LMs не обладают специфичными для человека индуктивными смещениями в языковом усвоении
Методологическая критика: указание на применимость "теоремы об отсутствии бесплатного обеда", аргумент о том, что плохая производительность LMs на некоторых языках неудивительна
Естественные языки (Attested Languages): языки, которые фактически используются людьми
Невозможные языки (Impossible Languages): искусственно созданные языки, нарушающие ограничения универсальной грамматики, такие как языки с полностью инвертированным порядком слов
Сложные/случайные языки: языки, лишенные структуры или содержащие множество случайных правил
Предсказание Хомского: если LMs не обладают UG, они должны одинаково легко изучать невозможные языки
Возражение F&M: утверждают, что LMs демонстрируют предпочтения в изучении, согласованные с человеческими
"Теорема об отсутствии бесплатного обеда": любой алгоритм обучения, хорошо работающий на одном классе данных, обязательно будет работать хуже на других данных
Инновация статьи заключается не в технических методах, а в глубине теоретического анализа:
Различие типов языков: четкое разграничение между "невозможными языками, нарушающими UG" и "случайными/сложными языками"
Переинтерпретация эмпирических результатов: указание на то, что F&M и другие смешивают сложность языка с возможностью языка
Проверка теоретической согласованности: использование "теоремы об отсутствии бесплатного обеда" для аргументации того, что плохая производительность LMs на некоторых языках неизбежна и не может служить доказательством наличия у них человеческих индуктивных смещений
Статья не содержит новых экспериментов, а представляет переанализ опубликованных исследований. Авторы систематически рассмотрели следующие исследования:
Экспериментальный дизайн: тестирование способности LMs изучать английский язык и множество невозможных языков
Интерпретация F&M: LMs изучают реальные английские тексты последовательно быстрее, чем базовые невозможные языки
Переанализ авторов:
Хотя были сообщены два сложных для изучения невозможных языка, множество невозможных языков изучаются почти так же легко, как английский
Включая невозможный язык, разработанный Mitchell & Bowers (2020)
Наиболее сложный для изучения невозможный язык - это полностью случайная перестановка слов (без структуры для изучения)
Другой сложный язык - это детерминированная случайная перестановка (использует разные правила перестановки для разных длин предложений, что эквивалентно изучению множества случайных языков)
Экспериментальный дизайн: оценка производительности LMs на множестве невозможных языков, включая языки с детерминированной перестановкой
Результаты: множество невозможных языков легко изучаются, языки со случайной перестановкой сложны
Критика авторов: авторы ошибочно полагали, что Хомский предсказывал, что LMs должны быть способны изучать языки со случайной перестановкой, однако изучение множества различных случайных языков (для разных длин предложений) сложно в любой теории
Экспериментальный дизайн: варьирование правдоподобности (plausibility) языка, а не его невозможности
Результаты: LMs испытывают трудности с некоторыми неправдоподобными языками, но легко изучают другие
Замечание авторов: исследователи сами признали, что конструкция материала может содержать ошибки, приводящие к увеличению шума в контрфактических корпусах
Результаты: сообщили о множестве невозможных языков, которые LMs легко изучают, включая частично инвертированные языки (воспроизведение результатов Mitchell & Bowers, 2020)
Авторы ссылаются на теорию Wolpert & Macready (2002):
Основная идея: алгоритм обучения, хорошо работающий на одном классе данных, обязательно будет работать хуже на других данных
Вывод: плохая производительность LMs на некоторых языках (таких как случайная перестановка) неизбежна и не требует эмпирического подтверждения
Ключевое различие: плохая производительность на некоторых языках ≠ наличие человеческих индуктивных смещений
Логика опровержения: успешное изучение некоторых невозможных языков опровергает то, что LMs являются надлежащей моделью человеческого языкового усвоения
Исходное предложение (длина 5): The cat sat on mat
Правило перестановки 1 (длина 5): cat The on sat mat
Исходное предложение (длина 6): The big cat sat on mat
Правило перестановки 2 (длина 6): big The sat cat mat on
Анализ: изучение такого языка эквивалентно изучению множества различных случайных отображений, сложность растет линейно с количеством типов длин предложений. Это не тест на наличие UG смещений, а тест на способность запомнить множество произвольных отображений.
Некоторые правила порядка слов систематически инвертированы, но остаются последовательными.
Результаты: LMs легко изучают такие языки, что указывает на то, что они не обладают индуктивными смещениями, исключающими такие языки.
Статья занимает позицию традиционной лингвистики Хомского, опровергая последние аргументы лагеря коннекционизма/статистического обучения посредством переанализа эмпирических исследований.
Эмпирические доказательства не поддерживают точку зрения F&M: LMs часто одинаково легко изучают как естественные языки, так и невозможные языки
Сложные для изучения "невозможные языки" являются сложными/случайными: трудность изучения проистекает из сложности, а не из нарушения UG
LMs не обладают человеческими индуктивными смещениями: объединяя доказательства легкого изучения невозможных языков и низкой эффективности использования данных, модели обучения LMs принципиально отличаются от человеческих
"Отсутствие бесплатного обеда" не может служить подтверждающим доказательством: плохая производительность LMs на некоторых языках неизбежна и не может доказать наличие у них человеческих смещений
LMs не являются надлежащей моделью человеческого языкового усвоения: текущий способ обучения LMs именно таков, какого следует ожидать при отсутствии врожденных человеческих языковых смещений
Аргумент о детерминированной перестановке: хотя указывает на сложность, остается спорным, полностью ли эта сложность не связана с нарушением UG
Применимость "теоремы об отсутствии бесплатного обеда": эта теорема применима к задачам оптимизации, прямое применение к языковому усвоению требует дополнительных аргументов
Неучет альтернативных объяснений: LMs могут обладать другими типами индуктивных смещений (например, предпочтение локальности), которые просто отличаются от UG
Четкая позиция: явно занимает сторону Хомского, что может влиять на объективность
Жесткая критика работ противников: использует такие выражения как "неправильное толкование", "ошибка" и т.д., академический тон может быть более мягким
Это теоретически четко позиционированная, логически строгая, но с относительно слабой эмпирической базой комментарийная статья. Авторы посредством глубокого анализа существующей литературы убедительно оспаривают точку зрения о том, что "LMs обладают человеческими языковыми индуктивными смещениями", поддерживая традиционную позицию Хомского в лингвистике.
Наибольшая ценность заключается в концептуальном уточнении (различие между сложностью и невозможностью) и логическом анализе (применение логики опровержения и "теоремы об отсутствии бесплатного обеда"), что имеет важное методологическое значение для данной области.
Основные ограничения заключаются в отсутствии новых эмпирических данных и недостаточном анализе внутренних механизмов LMs. Для комментарийной статьи это понятно, но также ограничивает убедительность.
Данная статья будет способствовать углубленному обсуждению природы LMs в лингвистике и области AI, продвигая более строгий экспериментальный дизайн, однако может не сразу изменить фундаментальные позиции обеих сторон дебатов. Разрешение этого спора, вероятно, потребует дополнительных эмпирических исследований, более точных теоретических структур и, возможно, независимых доказательств из нейронауки.