Studies with impossible languages falsify LMs as models of human language
Bowers, Mitchell
According to Futrell and Mahowald [arXiv:2501.17047], both infants and language models (LMs) find attested languages easier to learn than impossible languages that have unnatural structures. We review the literature and show that LMs often learn attested and many impossible languages equally well. Difficult to learn impossible languages are simply more complex (or random). LMs are missing human inductive biases that support language acquisition.
academic
অসম্ভব ভাষা সহ গবেষণা ভাষা মডেলগুলিকে মানব ভাষার মডেল হিসাবে মিথ্যা প্রমাণ করে
এই পেপারটি ফিউটরেল এবং মাহোওয়াল্ড (F&M) এর ভাষা মডেল এবং মানব ভাষা শিক্ষার উপর পেপারের একটি মন্তব্য। F&M দাবি করেন যে শিশু এবং ভাষা মডেল (LMs) উভয়ই প্রকৃত ভাষাকে অ-প্রাকৃতিক কাঠামোযুক্ত "অসম্ভব ভাষা" থেকে শিখতে সহজ বলে মনে করে। লেখকরা সাহিত্য পর্যালোচনার মাধ্যমে দেখান যে LMs প্রায়শই প্রকৃত ভাষা এবং অনেক অসম্ভব ভাষা সমানভাবে সহজে শিখতে পারে। যে অসম্ভব ভাষাগুলি শিখতে কঠিন তা কেবল আরও জটিল বা এলোমেলো। লেখকরা যুক্তি দেন যে LMs মানব ভাষা অধিগ্রহণকে সমর্থন করে এমন আবেগপ্রবণ পক্ষপাত (inductive biases) অনুপস্থিত।
ভাষা অধিগ্রহণের গতির রহস্য: শিশুরা অবিশ্বাস্য গতিতে ভাষা শিখতে পারে, যা ভাষা অধিগ্রহণ মডেলের মুখোমুখি হওয়া মূল চ্যালেঞ্জ
তাত্ত্বিক বিতর্কের কেন্দ্রবিন্দু: চমস্কির সর্বজনীন ব্যাকরণ (Universal Grammar, UG) তত্ত্ব বলে যে মানুষের কাছে ভাষা শিক্ষার জন্য জন্মগত আবেগপ্রবণ পক্ষপাত রয়েছে, যা শুধুমাত্র সমস্ত প্রকৃত ভাষার কাঠামোকে সীমাবদ্ধ করে না বরং শিশুদের দ্রুত শিখতে সক্ষম করে
LMs এর চ্যালেঞ্জ: ChatGPT এর মতো বড় ভাষা মডেলগুলি মানব-সদৃশ পূর্ব জ্ঞানের অভাব রয়েছে, তবুও বিভিন্ন ভাষা কাজে চমৎকার কর্মক্ষমতা প্রদর্শন করে, যা ঐতিহ্যবাহী ভাষাবিজ্ঞান তত্ত্বকে চ্যালেঞ্জ করে
F&M এর দৃষ্টিভঙ্গি: দাবি করে যে LMs এবং মানুষের মতো, প্রকৃত ভাষাকে অসম্ভব ভাষার চেয়ে শিখতে সহজ বলে মনে করে, যা পরামর্শ দেয় যে LMs মানব ভাষার সাথে সংযুক্ত আবেগপ্রবণ পক্ষপাত রয়েছে
চমস্কির সমালোচনা: বিশ্বাস করেন যে LMs মানুষের সম্ভাব্য এবং অসম্ভব ভাষা সমানভাবে সহজে শিখতে পারে, যা মানব ভাষা মডেল হিসাবে এর গভীরতম ত্রুটি
সাহিত্য ব্যাখ্যার পার্থক্য: একই গবেষণার বিভিন্ন ব্যাখ্যা বিপরীত সিদ্ধান্তের দিকে পরিচালিত করে
লেখকরা সিস্টেমেটিক সাহিত্য পর্যালোচনার মাধ্যমে, LMs এর অসম্ভব ভাষা শেখার ক্ষমতা সম্পর্কে অভিজ্ঞতামূলক প্রমাণ স্পষ্ট করার লক্ষ্য রাখেন, F&M এর দৃষ্টিভঙ্গি চ্যালেঞ্জ করেন এবং চমস্কির বিষয়ে যে LMs মানব ভাষা শিক্ষার আবেগপ্রবণ পক্ষপাত অনুপস্থিত তা সমর্থন করেন।
এই পেপারের উদ্ভাবন প্রযুক্তিগত পদ্ধতিতে নয় বরং তাত্ত্বিক বিশ্লেষণের গভীরতায়:
ভাষার ধরন পার্থক্য: "UG লঙ্ঘন করে এমন অসম্ভব ভাষা" এবং "এলোমেলো/জটিল ভাষা" এর মধ্যে স্পষ্ট পার্থক্য
অভিজ্ঞতামূলক ফলাফলের পুনর্ব্যাখ্যা: দেখায় যে F&M এবং অন্যরা ভাষার জটিলতা এবং ভাষার সম্ভাবনা মিশিয়ে ফেলেছে
তাত্ত্বিক সামঞ্জস্য পরীক্ষা: "কোন বিনামূল্যে দুপুর নেই" উপপাদ্য ব্যবহার করে যুক্তি দেয় যে LMs কিছু ভাষায় খারাপ কর্মক্ষমতা অনিবার্য, এবং এটি তাদের মানব-সদৃশ আবেগপ্রবণ পক্ষপাত সমর্থন করার প্রমাণ হিসাবে কাজ করতে পারে না
পরীক্ষামূলক ডিজাইন: নির্ধারণীয় বিঘ্ন ভাষা সহ বিভিন্ন অসম্ভব ভাষায় LMs এর কর্মক্ষমতা মূল্যায়ন করা
আবিষ্কার: অনেক অসম্ভব ভাষা সহজে শেখা যায়, এলোমেলো বিঘ্ন ভাষা কঠিন
লেখকদের সমালোচনা: লেখকরা ভুলভাবে বিশ্বাস করেন যে চমস্কি পূর্বাভাস দেন যে LMs এলোমেলো বিঘ্ন ভাষা শিখতে পারে, কিন্তু একাধিক ভিন্ন এলোমেলো ভাষা শেখা (বিভিন্ন বাক্য দৈর্ঘ্যের জন্য) যেকোনো তত্ত্বের অধীনে কঠিন
আবিষ্কার: LMs সহজে শিখতে পারে এমন একাধিক অসম্ভব ভাষা রিপোর্ট করা হয়েছে, যার মধ্যে রয়েছে আংশিক বিপরীত ভাষা (মিচেল এবং বাওয়ার্স, 2020 এর ফলাফল প্রতিলিপি)
মূল বাক্য (দৈর্ঘ্য 5): The cat sat on mat
বিঘ্ন নিয়ম 1 (দৈর্ঘ্য 5): cat The on sat mat
মূল বাক্য (দৈর্ঘ্য 6): The big cat sat on mat
বিঘ্ন নিয়ম 2 (দৈর্ঘ্য 6): big The sat cat mat on
বিশ্লেষণ: এই ভাষা শেখা একাধিক ভিন্ন এলোমেলো ম্যাপিং শেখার সমতুল্য, জটিলতা বাক্য দৈর্ঘ্যের ধরন সহ রৈখিকভাবে বৃদ্ধি পায়। এটি UG পক্ষপাত পরীক্ষা করছে না বরং একাধিক নির্বিচারে ম্যাপিং মনে রাখার ক্ষমতা পরীক্ষা করছে।
কিছু শব্দ ক্রম নিয়ম সিস্টেমেটিকভাবে বিপরীত, কিন্তু সামঞ্জস্য বজায় রাখে।
আবিষ্কার: LMs সহজে শিখতে পারে, এটি নির্দেশ করে যে তাদের এই ধরনের ভাষা বাদ দেওয়ার আবেগপ্রবণ পক্ষপাত অনুপস্থিত।
এই পেপারটি চমস্কি ঐতিহ্যবাহী ভাষাবিজ্ঞান অবস্থান থেকে দাঁড়িয়ে আছে, অভিজ্ঞতামূলক গবেষণা পুনর্বিশ্লেষণের মাধ্যমে সংযোগবাদী/পরিসংখ্যানগত শিক্ষা শিবিরের সর্বশেষ যুক্তির বিরোধিতা করে।
এটি একটি তাত্ত্বিক অবস্থান স্পষ্ট, যুক্তি যুক্তিসঙ্গত কঠোর, কিন্তু অভিজ্ঞতামূলক ভিত্তি তুলনামূলকভাবে দুর্বল মন্তব্য পেপার। লেখক বিদ্যমান সাহিত্য গভীর বিশ্লেষণের মাধ্যমে, "LMs মানব-সদৃশ ভাষা আবেগপ্রবণ পক্ষপাত রয়েছে" দৃষ্টিভঙ্গি শক্তিশালীভাবে চ্যালেঞ্জ করে, চমস্কির ঐতিহ্যবাহী ভাষাবিজ্ঞান অবস্থান সমর্থন করে।
সর্বোচ্চ মূল্য এর ধারণা স্পষ্টকরণ (জটিলতা এবং অসম্ভবতার মধ্যে পার্থক্য) এবং যুক্তি বিশ্লেষণ (মিথ্যা প্রমাণ যুক্তি এবং "কোন বিনামূল্যে দুপুর নেই" উপপাদ্য প্রয়োগ) এ রয়েছে, যা এই ক্ষেত্রের পদ্ধতিতে গুরুত্বপূর্ণ অবদান রাখে।
প্রধান সীমাবদ্ধতা নতুন অভিজ্ঞতামূলক ডেটা অনুপস্থিত এবং LMs এর অভ্যন্তরীণ প্রক্রিয়ার গভীর বিশ্লেষণ অনুপস্থিত। একটি মন্তব্য পেপার হিসাবে, এটি বোধগম্য, কিন্তু এটি এর প্ররোচক শক্তিও সীমাবদ্ধ করে।
এই পেপারটি ভাষাবিজ্ঞান এবং AI ক্ষেত্রে LMs এর প্রকৃতি সম্পর্কে গভীর আলোচনা উৎসাহিত করবে, আরও কঠোর পরীক্ষামূলক ডিজাইন চালিত করবে, কিন্তু সম্ভবত দুটি শিবিরের মৌলিক অবস্থান অবিলম্বে পরিবর্তন করবে না। এই বিতর্কের সমাধান সম্ভবত আরও অভিজ্ঞতামূলক গবেষণা, আরও নির্ভুল তাত্ত্বিক কাঠামো এবং সম্ভবত স্নায়ুবিজ্ঞান থেকে স্বাধীন প্রমাণ প্রয়োজন।