2025-11-17T06:22:13.355563

Survey in Characterization of Semantic Change

de SÃ¡, Da Silveira, Pruski

Live languages continuously evolve to integrate the cultural change of human societies. This evolution manifests through neologisms (new words) or \textbf{semantic changes} of words (new meaning to existing words). Understanding the meaning of words is vital for interpreting texts coming from different cultures (regionalism or slang), domains (e.g., technical terms), or periods. In computer science, these words are relevant to computational linguistics algorithms such as translation, information retrieval, question answering, etc. Semantic changes can potentially impact the quality of the outcomes of these algorithms. Therefore, it is important to understand and characterize these changes formally. The study of this impact is a recent problem that has attracted the attention of the computational linguistics community. Several approaches propose methods to detect semantic changes with good precision, but more effort is needed to characterize how the meaning of words changes and to reason about how to reduce the impact of semantic change. This survey provides an understandable overview of existing approaches to the \textit{characterization of semantic changes} and also formally defines three classes of characterizations: if the meaning of a word becomes more general or narrow (change in dimension) if the word is used in a more pejorative or positive/ameliorated sense (change in orientation), and if there is a trend to use the word in a, for instance, metaphoric or metonymic context (change in relation). We summarized the main aspects of the selected publications in a table and discussed the needs and trends in the research activities on semantic change characterization.

academic

مسح في توصيف التغيير الدلالي

المعلومات الأساسية

معرّف الورقة: 2402.19088
العنوان: مسح في توصيف التغيير الدلالي
المؤلفون: Jader Martins Camboim de Sá, Marcos Da Silveira, Cédric Pruski (معهد لوكسمبرغ للعلوم والتكنولوجيا وجامعة لوكسمبرغ)
التصنيف: cs.CL (اللسانيات الحاسوبية)، cs.AI
تاريخ النشر: ما قبل الطباعة، 17 نوفمبر 2025 (arXiv v4)
رابط الورقة: https://arxiv.org/abs/2402.19088

الملخص

اللغة تتطور بشكل ديناميكي، حيث تعكس التغييرات الاجتماعية والثقافية من خلال الكلمات الجديدة (neologisms) أو التغييرات الدلالية في الكلمات الموجودة. يعتبر فهم معاني الكلمات أمراً حاسماً لتفسير النصوص من ثقافات أو مجالات أو فترات زمنية مختلفة، كما يؤثر بشكل مباشر على أداء تطبيقات معالجة اللغات الطبيعية مثل الترجمة الآلية واسترجاع المعلومات وأنظمة الإجابة على الأسئلة. على الرغم من أن الطرق الموجودة قد حققت دقة جيدة في كشف التغيير الدلالي، إلا أن كيفية توصيف (characterize) أنواع التغيير الدلالي تفتقر إلى دراسة منهجية. يقدم هذا المسح أول مراجعة شاملة للطرق الموجودة في توصيف التغيير الدلالي، ويقدم تعريفات رسمية لثلاثة أنواع من التغييرات: التغيير البُعدي (توسع أو تضييق معنى الكلمة)، التغيير التوجهي (أصبح معنى الكلمة أكثر سلبية أو إيجابية)، التغيير العلائقي (تحول معنى الكلمة من خلال الأساليب البلاغية مثل الاستعارة والكناية). تلخص الورقة النتائج البحثية الرئيسية، وتحلل القيود الحالية، وتشير إلى الاتجاهات البحثية المستقبلية.

السياق البحثي والدافع

1. المشكلة الأساسية

التغيير الدلالي للمفردات (Lexical Semantic Change, LSC) هو ظاهرة أساسية في تطور اللغة الطبيعية. يركز البحث الموجود بشكل أساسي على الكشف (detection) عما إذا حدث تغيير دلالي، لكن البحث في توصيف كيفية حدوث التغيير (how it changed) يعاني من نقص شديد. على سبيل المثال:

"gay" تحول من "سعيد" إلى "مثلي الجنس" (تضييق بُعدي + تحييد توجهي)
"heart" توسع من "عضو القلب" إلى معاني استعارية مثل "الشجاعة" و"الجوهر" (تغيير علائقي)
"awful" تحول من "مثير للإعجاب" إلى "سيء" (تغيير توجهي نحو السلبية)

2. الأهمية

القيمة اللسانية: فهم قوانين تطور اللغة، والكشف عن تأثير الثقافة والمجتمع والتكنولوجيا على اللغة
تطبيقات معالجة اللغات الطبيعية:
- فهم النصوص التاريخية (مثل أبحاث العلوم الإنسانية الرقمية)
- صيانة الرسوم البيانية للمعرفة (مثل اتساق السلاسل الزمنية في Wikidata)
- استرجاع المعلومات عبر الفترات الزمنية (مثل الانجراف الدلالي لكلمة "cloud" في الأدبيات التقنية)
- تحليل المشاعر (مثل تحول كلمة "sick" نحو المعنى الإيجابي في اللغة العامية)

3. قيود الطرق الموجودة

غياب إطار عمل موحد: تستخدم الدراسات المختلفة مصطلحات وتعريفات مختلفة، مما يصعب المقارنة
معايير تقييم غير متسقة: نقص المجموعات البيانية القياسية والمؤشرات التقييمية
التركيز على الكشف بدلاً من التوصيف: 90% من الأبحاث تركز على "هل حدث التغيير"، بينما فقط 10% تدرس "كيف حدث التغيير"
ندرة البيانات: مجموعات اللغة التاريخية أصغر بكثير من ما تتطلبه معالجة اللغات الطبيعية الحديثة (مستوى المليون مقابل مستوى التريليون من الرموز)

4. الدافع البحثي

هذه الورقة هي أول مسح منهجي لتوصيف التغيير الدلالي، وتهدف إلى:

تحديد القيود في الطرق والتصنيفات الموجودة
تقييم مزايا الطرق المختلفة
توفير تعريفات رسمية بناءً على المنطق من الدرجة الأولى
عرض توضيحي مفاهيمي لمهمة توصيف التغيير الدلالي

المساهمات الأساسية

أول مسح موجه نحو التوصيف للتغيير الدلالي: يختلف عن المسوحات الموجودة (Tahmasebi et al. 2018, Kutuzov et al. 2018) التي تركز على الكشف، وتركز هذه الورقة على التوصيف
تصنيف ثلاثي الأقطاب (Three-Pole Taxonomy):
- البُعد (Dimension): توسع/تضييق (تغيير في عدد معاني الكلمة)
- التوجه (Orientation): تحسن/تدهور (تغيير في الميل العاطفي)
- العلاقة (Relation): استعارة/كناية (تغيير في العلاقات البلاغية)
إطار عمل رسمي: يوفر تعريفات رياضية بناءً على نظرية المجموعات (القسم 5)، يميز بين التحديد والتوصيف
تصنيف منهجي للطرق: بناء مصفوفة تصنيف ثنائية الأبعاد حسب طريقة التمثيل (تكرار/موضوع/رسم بياني/تضمين) × قطب التغيير (D/R/O) (الجدول 3)
عرض توضيحي تجريبي: استخدام مجموعات بيانات SEMCOR و MASC للتحقق من جدوى الإطار
تحديد الفجوات البحثية: الإشارة إلى ندرة البحث في القطب العلائقي (R) والتوصيف المتعدد الأقطاب

الكون الدلالي: $S_T$ هي مجموعة جميع معاني الكلمات الممكنة
دالة المعنى: $S: V \times T \rightarrow \wp(S_t)$ ، تعيين كلمة $w$ في مجموعة نصوص $t$ إلى مجموعة معاني الكلمة $S(w, t) = \{s_1, s_2, ..., s_k\}$

تحديد التغيير الدلالي

تحدث كلمة $w$ تغييراً بين $t_1, t_2$ إذا وفقط إذا:

Survey in Characterization of Semantic Change

مسح في توصيف التغيير الدلالي

المعلومات الأساسية

الملخص

السياق البحثي والدافع

1. المشكلة الأساسية

2. الأهمية

3. قيود الطرق الموجودة

4. الدافع البحثي

المساهمات الأساسية

شرح الطرق

تعريف المهمة

كشف التغيير الدلالي (Identification)

توصيف التغيير الدلالي (Characterization) ★الابتكار الأساسي

الإطار الرسمي (جوهر القسم 5)

التعريفات الأساسية

تحديد التغيير الدلالي