2025-11-17T06:22:13.355563

Survey in Characterization of Semantic Change

de Sá, Da Silveira, Pruski
Live languages continuously evolve to integrate the cultural change of human societies. This evolution manifests through neologisms (new words) or \textbf{semantic changes} of words (new meaning to existing words). Understanding the meaning of words is vital for interpreting texts coming from different cultures (regionalism or slang), domains (e.g., technical terms), or periods. In computer science, these words are relevant to computational linguistics algorithms such as translation, information retrieval, question answering, etc. Semantic changes can potentially impact the quality of the outcomes of these algorithms. Therefore, it is important to understand and characterize these changes formally. The study of this impact is a recent problem that has attracted the attention of the computational linguistics community. Several approaches propose methods to detect semantic changes with good precision, but more effort is needed to characterize how the meaning of words changes and to reason about how to reduce the impact of semantic change. This survey provides an understandable overview of existing approaches to the \textit{characterization of semantic changes} and also formally defines three classes of characterizations: if the meaning of a word becomes more general or narrow (change in dimension) if the word is used in a more pejorative or positive/ameliorated sense (change in orientation), and if there is a trend to use the word in a, for instance, metaphoric or metonymic context (change in relation). We summarized the main aspects of the selected publications in a table and discussed the needs and trends in the research activities on semantic change characterization.
academic

Übersicht zur Charakterisierung des semantischen Wandels

Grundinformationen

  • Paper-ID: 2402.19088
  • Titel: Survey in Characterization of Semantic Change
  • Autoren: Jader Martins Camboim de Sá, Marcos Da Silveira, Cédric Pruski (Luxembourg Institute of Science and Technology & University of Luxembourg)
  • Klassifizierung: cs.CL (Computerlinguistik), cs.AI
  • Veröffentlichungsdatum: Preprint, 17. November 2025 (arXiv v4)
  • Paper-Link: https://arxiv.org/abs/2402.19088

Zusammenfassung

Sprache entwickelt sich dynamisch weiter, was sich durch Neologismen oder semantische Veränderungen bestehender Wörter widerspiegelt und soziokulturelle Transformationen reflektiert. Das Verständnis von Wortbedeutungen ist entscheidend für die Interpretation von Texten verschiedener Kulturen, Domänen oder Zeiträume und beeinflusst direkt die Leistung von NLP-Anwendungen wie maschinelle Übersetzung, Informationsabruf und Frage-Antwort-Systeme. Obwohl bestehende Methoden bereits gute Genauigkeit bei der Erkennung semantischer Veränderungen erreicht haben, fehlt es an systematischer Forschung zur Charakterisierung (characterize) von Typen semantischer Veränderungen. Diese Übersicht bietet erstmals eine umfassende Zusammenfassung bestehender Methoden zur Charakterisierung semantischer Veränderungen und definiert formal drei Kategorien von Veränderungen: Dimensionsveränderung (Wortbedeutung wird breiter oder enger), Orientierungsveränderung (Wortbedeutung wird negativer oder positiver), Relationsveränderung (Wortbedeutung transformiert sich durch rhetorische Mittel wie Metapher oder Metonymie). Das Paper fasst die wichtigsten Forschungsergebnisse zusammen, analysiert aktuelle Einschränkungen und weist auf zukünftige Forschungsrichtungen hin.

Forschungshintergrund und Motivation

1. Kernproblem

Lexikalischer semantischer Wandel (Lexical Semantic Change, LSC) ist ein Kernphänomen der Sprachentwicklung. Bestehende Forschung konzentriert sich hauptsächlich auf die Erkennung (detection) von semantischen Veränderungen, aber es mangelt erheblich an Forschung zur Charakterisierung von wie sich Bedeutungen verändern (how it changed). Beispiele:

  • "gay" wandelt sich von "fröhlich" zu "homosexuell" (Dimensionsverengung + Orientierungsneutralisierung)
  • "heart" erweitert sich von "Herzorgan" zu metaphorischen Bedeutungen wie "Mut" und "Kern" (Relationsveränderung)
  • "awful" wandelt sich von "ehrfurchtgebietend" zu "schrecklich" (Orientierungsverschlechterung)

2. Bedeutsamkeit

  • Sprachwissenschaftlicher Wert: Verständnis von Sprachentwicklungsgesetzen, Aufdeckung von Einflüssen von Kultur, Gesellschaft und Technologie auf Sprache
  • NLP-Anwendungen:
    • Verständnis historischer Texte (z.B. Digital Humanities Forschung)
    • Wartung von Wissensgraphen (z.B. zeitliche Konsistenz von Wikidata)
    • Zeitübergreifender Informationsabruf (z.B. semantische Verschiebung von "cloud" in technischer Literatur)
    • Sentimentanalyse (z.B. Positivierung von "sick" in Slang)

3. Einschränkungen bestehender Methoden

  • Fehlender einheitlicher Formalisierungsrahmen: Verschiedene Forschungsarbeiten verwenden unterschiedliche Terminologie und Definitionen, was Vergleiche erschwert
  • Inkonsistente Bewertungsstandards: Mangel an standardisierten Datensätzen und Bewertungsmetriken
  • Übergewicht auf Erkennung statt Charakterisierung: 90% der Forschung konzentriert sich auf "ob Veränderung auftritt", nur 10% auf "wie sich Veränderung vollzieht"
  • Datenmangel: Historische Korpora sind deutlich kleiner als für modernes NLP erforderlich (Millionen vs. Billionen Tokens)

4. Forschungsmotivation

Dieses Paper ist die erste systematische Übersicht zur Charakterisierung semantischer Veränderungen mit dem Ziel:

  1. Einschränkungen bestehender Darstellungs- und Klassifizierungsmethoden zu identifizieren
  2. Stärken verschiedener Methoden zu bewerten
  3. Formalisierte Definitionen basierend auf Logik erster Ordnung bereitzustellen
  4. Konzeptionelle Demonstration der LSC-Charakterisierungsaufgabe

Kernbeiträge

  1. Erste charakterisierungsorientierte LSC-Übersicht: Im Gegensatz zu bestehenden Übersichten (Tahmasebi et al. 2018, Kutuzov et al. 2018), die sich auf Erkennung konzentrieren, fokussiert dieses Paper auf Charakterisierung
  2. Dreipoliges Klassifizierungssystem (Three-Pole Taxonomy):
    • Dimension: broadening/narrowing (Veränderung der Anzahl von Wortbedeutungen)
    • Orientierung: amelioration/pejoration (Veränderung der emotionalen Ausrichtung)
    • Relation: metaphorization/metonymization (Veränderung der rhetorischen Beziehungen)
  3. Formalisierter Rahmen: Mathematische Definitionen basierend auf Mengenlehre (Section 5), Unterscheidung zwischen Identifikation und Charakterisierung
  4. Systematische Methodenklassifizierung: Zweidimensionale Klassifizierungsmatrix konstruiert nach Darstellungsmethode (Häufigkeit/Thema/Graph/Embedding) × Veränderungspol (D/R/O) (Table 3)
  5. Empirische Demonstration: Validierung des Rahmens mit SEMCOR- und MASC-Datensätzen
  6. Identifikation von Forschungslücken: Aufzeigung von Mangel an Forschung zum Relationspol (R) und gemeinsamer Charakterisierung mehrerer Pole

Methodische Details

Aufgabendefinition

Erkennung semantischer Veränderung (Identification)

Gegeben die Darstellung eines Wortes ww in zwei Korpora t1,t2t_1, t_2 als R(w,t1),R(w,t2)R(w, t_1), R(w, t_2), bestimme, ob eine Veränderung auftritt: fC(R(w,t1),R(w,t2))yf_C(R(w, t_1), R(w, t_2)) \rightarrow y wobei y{0,1}y \in \{0,1\} (binäre Klassifizierung) oder yRy \in \mathbb{R} (kontinuierliche Distanz)

Charakterisierung semantischer Veränderung (Characterization) ★Kerninnnovation

Basierend auf Erkennung, weitere Klassifizierung des Veränderungstyps: fx(R(w,t1),R(w,t2))y,x{D,R,O}f_x(R(w, t_1), R(w, t_2)) \rightarrow y, \quad x \in \{D, R, O\}

Formalisierter Rahmen (Section 5 Kern)

Grunddefinitionen

  • Semantisches Universum: STS_T ist die Menge aller möglichen Wortbedeutungen
  • Bedeutungsfunktion: S:V×T(St)S: V \times T \rightarrow \wp(S_t), die ein Wort ww in Korpus tt auf eine Menge von Wortbedeutungen abbildet S(w,t)={s1,s2,...,sk}S(w, t) = \{s_1, s_2, ..., s_k\}

Bestimmung semantischer Veränderung

Ein Wort ww erfährt Veränderung zwischen t1,t2t_1, t_2 dann und nur dann, wenn:

\text{Wahr} & S(w, t_1) \neq S(w, t_2) \\ \text{Falsch} & \text{andernfalls} \end{cases}$$ #### Dreipolige Definitionen **1. Dimensionsveränderung (Dimension)** $$|S(w, t_1)| \neq |S(w, t_2)|$$ - Broadening (Verbreiterung): $|S(w, t_1)| < |S(w, t_2)|$ (Wortbedeutungen nehmen zu) - Narrowing (Verengung): $|S(w, t_1)| > |S(w, t_2)|$ (Wortbedeutungen nehmen ab) **Beispiel**: - "plane" hat in SEMCOR 5 Bedeutungen (Ebene, Flugzeug, Hobel usw.), in MASC nur noch 2 → Verengung **2. Orientierungsveränderung (Orientation)** Definiere Sentimentfunktion $f: V \times T \rightarrow \{-1, 0, +1\}$, dann: $$f(w, t_1) \neq f(w, t_2)$$ - Amelioration (Verbesserung): $f(w, t_1) < f(w, t_2)$ (Positivierung) - Pejoration (Verschlechterung): $f(w, t_1) > f(w, t_2)$ (Negativierung) **Implementierung**: Gewichtete Summe von SentiWordNet-Scores $$f(w, t) = \frac{1}{N}\sum_{i=1}^{N} p(s_i) \cdot \text{positive}(s_i)$$ **Beispiel**: - "heart" hat in SEMCOR $f=0.15$, in MASC $f=0.97$ → Positivierung **3. Relationsveränderung (Relation)** Definiere Relationsähnlichkeit $l: S \times S \rightarrow \mathbb{R}$, Gesamtrelationsstärke: $$R(w, t) = \sum_{i=1}^{N-1}\sum_{j=i+1}^{N} l(s_i, s_j), \quad s_i, s_j \in S(w, t)$$ - Zunahme: $R(w, t_1) < R(w, t_2)$ (mehr metaphorische/metonymische Verwendungen) **Beispiel**: - "heart" erweitert sich von wörtlicher Bedeutung "Herz" zu metaphorischen Bedeutungen "Kern" und "Mut" → Relationsverbesserung ### Technische Innovationen 1. **Mengenlehre-Formalisierung**: Erstmalige Verwendung strenger mathematischer Sprache zur Definition von LSC-Charakterisierung, Beseitigung von Mehrdeutigkeiten 2. **Polsymmetrie**: Drei Pole bilden natürlich Paare (broadening/narrowing teilen Dimensionsmessung), vereinfachen Berechnungsrahmen 3. **Operationalisierbarkeit**: Definitionen können direkt in Algorithmen umgewandelt werden (z.B. Wortbedeutungszählung, Sentimentbewertung, Relationsdiagrammanalyse) 4. **Cambridge-Perspektive**: Adoption von statischem Vergleich (zwei Korpora-Vergleich) statt McTaggart-dynamischer Verfolgung, geeignet für Rechenmethoden ## Experimentelle Einrichtung ### Datensatzklassifizierung #### Diachronische Korpora (Table 2) | Korpus | Sprache | Zeitspanne | Umfang | Besonderheiten | |--------|---------|-----------|--------|-----------------| | **COHA** | Englisch | 1810er-2000er | 400 Millionen Wörter | Am häufigsten verwendet, ausgewogene Genres | | **Google N-Gram** | Mehrsprachig | 1600-2009 | 300 Milliarden Wörter | Größter Umfang, aber viel Rauschen | | **DTA** | Deutsch | 1741-1900 | 1022 Texte | Hohe Qualität, manuell ausgewählt | | **CLMET** | Englisch | 1710-1920 | 34 Millionen Wörter | Hauptsächlich literarische Werke | #### Demonstrationsdatensätze - **SEMCOR** (1993): 200.000 Wörter, WordNet-Bedeutungsannotationen - **MASC** (2013): 500.000 Wörter, modernes amerikanisches Englisch - **Annotationsquellen**: - Bedeutungen: WordNet - Relationen: ChainNet (Metapher-/Metonymie-Verbindungen) - Orientierung: SentiWordNet (positive/negative Scores) ### Bewertungsdimensionen Das Paper selbst als Übersicht bietet keine einheitlichen Bewertungsmetriken, analysiert aber bestehende Bewertungsmethoden: #### Dimensionspol (D) - **Metriken**: Veränderung der Wortbedeutungsanzahl, Cluster-Dichte, Themenzahl - **Datenquellen**: Wörterbücher, Bedeutungsinduktions-Clustering, Topic-Modelle #### Orientierungspol (O) - **Metriken**: Distanz zu Seed-Wörtern, VAD-Framework-Scores (Valence-Arousal-Dominance) - **Herausforderungen**: Stabilität von Seed-Wörtern, Ironie-/Negationsbehandlung #### Relationspol (R) - **Metriken**: Entropiezunahme (Schlechtweg 2017), Kantenanzahl in Relationsdiagrammen - **Probleme**: Schwierigkeit, Metapher vs. neue Homonymie zu unterscheiden ### Methodenklassifizierung (Table 3 Kern) | Methode | D | R | O | Darstellungsmethode | |---------|---|---|---|-------------------| | Biemann 2006 | ✓ | - | - | Graph | | Tang et al. 2013 | ✓ | ✓ | - | Häufigkeit | | Hamilton et al. 2016a | - | - | ✓ | Graph (SentiProp) | | Inoue et al. 2022 | ✓ | - | - | Topics (InfiniteSCAN) | | Giulianelli et al. 2020 | ✓ | - | - | Embeddings (BERT) | | Fonteyn & Manjavacas 2021 | - | ✓ | ✓ | Embeddings | **Schlüsselfunde**: - **Keine Methode deckt alle drei Pole ab**: Charakterisierungskomplexität ist hoch - **Dimensionspol am meisten erforscht**: 18/23 Methoden - **Relationspol am schwächsten**: Nur 3 Methoden - **Embedding-Methoden dominieren**: Neuester Trend ## Experimentelle Ergebnisse ### Rahmenvalidierung (Section 5.7) #### Fall 1: Mehrpolige Veränderung von "heart" **Daten** (SEMCOR → MASC): ``` Bedeutungsverteilungsveränderung: - heart.n.02 (Organ, wörtlich): 34,8% → 0% - heart.n.03 (Mut, Metapher+): 12,1% → 90,1% - heart.n.10 (Pokersymbol, neu): 0% → 2,8% ``` **Berechnungsergebnisse**: 1. **Dimension**: $|S|: 5 \rightarrow 3$, Verengung 2. **Orientierung**: $f: 0.15 \rightarrow 0.97$, starke Positivierung 3. **Relation**: Metaphorische Verwendung dominiert (90,1%), Relationsverbesserung **Interpretation**: Wörtliche Bedeutung "Herz" verschwindet, metaphorische Bedeutung "Mut/Kern" wird zur Prototypbedeutung #### Fall 2: Verengung von "plane" **Daten**: ``` SEMCOR: 5 Bedeutungen (Flugzeug 48,8%, Ebene 37,2%, Hobel 4,7% usw.) MASC: 2 Bedeutungen (Flugzeug 90,9%, Ebene 9,1%) ``` **Berechnungsergebnisse**: 1. **Dimension**: $5 \rightarrow 2$, signifikante Verengung 2. **Orientierung**: Positive Bedeutung (flat.s.01, +0.375) geht verloren → leichte Negativierung 3. **Relation**: $R: 1 \rightarrow 0$ (Metonymie-Beziehung zwischen plane.n.03 und plane.n.02 verschwindet) ### Methodenvergleichsanalyse (Table 4) #### Häufigkeitsmethoden **Vorteile**: - Einfach und interpretierbar - Geeignet für Erkennung von Neologismen - Geringer Datenbedarf **Nachteile**: - Kann Wortbedeutungen nicht unterscheiden (Polysemie-Problem) - Schwierig, semantische Ähnlichkeit zu erfassen - Empfindlich gegenüber Ironie/Negation **Anwendungsszenarien**: Statistische Co-Occurrence von Seed-Wörtern für Orientierungspol #### Topic-Modelle **Vorteile**: - Unüberwachte Entdeckung neuer Wortbedeutungen - Visualisierung der Themenentwicklung - InfiniteSCAN passt Themenzahl dynamisch an **Nachteile**: - Erfordert menschliche Themeninterpretation - Schwierige Kontrolle der Themengranularität - Forschungslücken bei Relationspol und Orientierungspol **Repräsentative Arbeiten**: - SCAN (Frermann & Lapata 2016) - InfiniteSCAN (Inoue et al. 2022): Automatische Erkennung der Wortbedeutungsanzahl-Veränderung #### Graphmethoden **Vorteile**: - Natürliche Darstellung von Wortbeziehungen - Visualisierung von Wortbedeutungs-Entwicklungsbäumen (Ehmüller et al. 2020) - Geeignet für Sentimentausbreitung (SentiProp) **Nachteile**: - Abhängig von Graphkonstruktionsqualität - Hohe Rechenkomplexität - Relationspol stark untererforscht **Repräsentative Arbeiten**: - Chinese Whispers Clustering (Biemann 2006) - Ego-network + PMI-Filterung (Ehmüller et al. 2020) #### Embedding-Methoden **Vorteile**: - Erfassung feiner semantischer Veränderungen - BERT und andere kontextuelle Embeddings verbessern Leistung - Dichte-Embeddings (word2gauss) modellieren Polysemie **Nachteile**: - **Meaning Conflation Deficiency**: Einzelne Vektoren können keine feingranularen Wortbedeutungen unterscheiden - Instabilität bei niedrigen Häufigkeiten - Kontextuelle Embeddings sind überkontext-abhängig → Falsch-Positive **Repräsentative Arbeiten**: - Diachronic embeddings (Hamilton et al. 2016b) - Gaussian embeddings (Moss 2020, Yüksel et al. 2021) - XL-LEXEME (Cassotti et al. 2023): Sprachübergreifendes WSD-Pretraining ### Wichtige Funde 1. **Charakterisierung ist schwieriger als Erkennung**: SemEval-2020 zeigt, dass kontextuelle Embeddings bei LSC-Erkennung statische Embeddings nicht übertreffen, Charakterisierung erfordert spezialisierte Designs 2. **Datenbottleneck**: Historische Korpora Millionen-Skala vs. modernes LLM benötigt Billionen-Skala → Few-Shot-Learning erforderlich 3. **Mehrsprachige Lücke**: 90% der Forschung nur auf Englisch 4. **Relationspol-Lücke**: Nur 3 Papiere, kein standardisierter Datensatz 5. **Bewertungsschwierigkeiten**: Fehlender Gold-Standard, meist qualitative Analyse ## Verwandte Arbeiten ### Vergleich bestehender Übersichten | Übersicht | Jahr | Fokus | Unterschied zu diesem Paper | |-----------|------|-------|---------------------------| | **Tang 2018** | 2018 | Vier-Schritte-Rahmen (Korpus→Bedeutung→Modellierung→Validierung) | Konzentriert sich auf Erkennung, Charakterisierung nur kurz erwähnt | | **Tahmasebi et al. 2018** | 2018 | Wort-/Bedeutungsebenen-Unterscheidung, Wortaustausch | Empfiehlt tiefere Charakterisierungsforschung | | **Kutuzov et al. 2018** | 2018 | Wortdarstellungsmodelle und Daten | Weist auf unzureichende Validierung von Klassifizierungsschemata hin | | **Montanelli & Periti 2023** | 2023 | Kontextuelle Embedding-Methoden | Fordert Forschung zu "Gesetzen des semantischen Wandels" | | **Dieses Paper** | 2025 | **Charakterisierung Dreipolsystem + Formalisierung** | Erste systematische Charakterisierungsübersicht | ### Theoretische Grundlagen #### Sprachwissenschaftliche Klassifizierung (Traugott 2017) - **Broadening/Narrowing**: Veränderung des Bedeutungsumfangs - **Amelioration/Pejoration**: Veränderung des emotionalen Wertes - **Metaphorization/Metonymization**: Veränderung der rhetorischen Mechanismen #### Computerperspektive-Klassifizierung - **Cambridge-Perspektive**: Statischer Vergleich zweier Korpora (in diesem Paper verwendet) - **McTaggart-Perspektive**: Dynamische Verfolgung des Entwicklungsprozesses (erfordert historisches Wissen) ### Entwicklung der Wortbedeutungsdarstellung 1. **Frühe Phase**: Häufigkeit + Co-Occurrence-Matrix (Sagi et al. 2009) 2. **2010er**: Topic-Modelle (Lau et al. 2012), Graph-Clustering (Biemann 2006) 3. **2016+**: Statische Embeddings (Hamilton et al. 2016b) 4. **2019+**: BERT und andere kontextuelle Embeddings (Giulianelli et al. 2020) 5. **Zukunft**: LLM-generative Methoden (Cassotti et al. 2024) ## Schlussfolgerungen und Diskussion ### Hauptschlussfolgerungen 1. **Charakterisierungsforschung stark unterrepräsentiert**: Verhältnis von Erkennungs- zu Charakterisierungspapieren etwa 9:1 2. **Dreipoliges Ungleichgewicht**: Dimensionspol (D) ausreichend erforscht, Relationspol (R) praktisch nicht vorhanden 3. **Methodische Fragmentierung**: Fehlender einheitlicher Rahmen und Bewertungsstandards 4. **Notwendigkeit der Formalisierung**: Mengenlehre-Definitionen können Mehrdeutigkeiten beseitigen und Methodenvergleiche fördern 5. **Datenbeschränkungen**: Historische Korpusgröße begrenzt Deep-Learning-Anwendungen ### Einschränkungen #### Methodologische Einschränkungen 1. **Vereinfachte Annahmen**: Bedeutungsobjektivismus (sense objectivism) ignoriert Kontextabhängigkeit 2. **Binäre Einschränkungen**: Broadening/Narrowing können Veränderungen der Wortbedeutungs-Intension (Intension) nicht beschreiben 3. **Relationspol-Definitionsmehrdeutigkeit**: Schwierig, Metapher vs. Metonymie vs. neue Homonymie zu unterscheiden #### Datenbeschränkungen 1. **Korpus-Bias**: - Ausgewogene Korpora wie COHA haben immer noch Genre-Verzerrungen - Google N-Gram hat viel Rauschen (OCR-Fehler) 2. **Annotationsverzögerung**: Wörterbücher erfassen neue Bedeutungen mit 5-10 Jahren Verzögerung 3. **Mehrsprachige Lücke**: Nicht-englische Forschung <10% #### Bewertungsbeschränkungen 1. **Gold-Standard-Mangel**: Meist qualitative Analyse 2. **Seed-Wort-Stabilitätsproblem**: Orientierungspol nimmt an, dass Seed-Wörter sich nicht ändern (tatsächlich ändern sie sich) 3. **Schwellenwert-Subjektivität**: Schwellenwert für binäre Klassifizierung von Veränderungen fehlt Konsens ### Zukünftige Richtungen #### Kurzfristig (1-2 Jahre) 1. **Relationspol-Durchbruch**: - Konstruktion von Metapher-/Metonymie-annotierten Datensätzen - Nutzung von Wissensgraphen (Wikidata) zur Modellierung von Konzeptbeziehungen 2. **Mehrpolige gemeinsame Modellierung**: Einzelnes Modell charakterisiert gleichzeitig D+R+O 3. **Standardisierte Bewertung**: Etablierung von LSC-Charakterisierungs-Benchmarks #### Mittelfristig (3-5 Jahre) 1. **LLM-Anwendungen**: - Few-Shot-Lernen lindert Datenmangel - Generative Methoden synthetisieren historische Korpora (Cassotti et al. 2024) 2. **Sprachübergreifende Forschung**: - Validierung universeller Gesetze semantischer Veränderungen - Nutzung mehrsprachiger Pretraining-Modelle 3. **Kausalanalyse**: Von "wie sich ändert" zu "warum sich ändert" (soziokulturelle Faktoren) #### Langfristig (5+ Jahre) 1. **Gesetze semantischer Veränderung**: - Welche Wortklassen unterliegen leicht Broadening? - Beziehung zwischen Häufigkeit und Veränderungsgeschwindigkeit 2. **Anwendungsgesteuert**: - Maschinelle Übersetzung historischer Texte - Dynamische Wissensgraph-Wartung - Modellierung kultureller Evolution ## Tiefenanalyse ### Stärken #### Akademische Beiträge 1. **Schließung von Forschungslücken**: Erste systematische Charakterisierungsübersicht, klare Unterscheidung zwischen Identifikation und Charakterisierung 2. **Theoretische Innovationen**: - Dreipoliges Klassifizierungssystem integriert sprachwissenschaftliche und computerlinguistische Perspektiven - Formalisierter Rahmen (Section 5) kann direkt Algorithmendesign leiten 3. **Umfassendheit**: - Zeitspanne: 2006-2024 - Methodenabdeckung: 4 Darstellungstypen × 3 Veränderungstypen = 12-dimensionale Analyse - Tiefenanalyse von 23 Kernpapieren #### Methodologische Vorteile 1. **Semantische Suche**: Verwendung von Research Rabbit-Tool zur iterativen Literaturerweiterung (11→151 Papiere) 2. **Empirische Validierung**: SEMCOR/MASC-Fälle demonstrieren Rahmenoperationalisierbarkeit 3. **Visualisierung**: Figure 1 Klassifizierungsbaum, Figure 11 dreidimensionaler Raum vermitteln intuitive Darstellung #### Schreibqualität 1. **Klare Struktur**: Hintergrund→Methode→Formalisierung→Diskussion logisch konsistent 2. **Terminologische Vereinheitlichung**: Klare Definitionen von LSC, D/R/O und anderen Kernkonzepten 3. **Informationsreiche Tabellen**: Table 2-4 konzentrieren große Informationsmengen ### Schwächen #### Theoretische Ebene 1. **Bedeutungsobjektivitätskontroverse**: - Annahme, dass Wortbedeutungen diskret aufzählbar sind ($S(w,t)=\{s_1,...,s_k\}$) - Ignoriert Wittgensteins "Familienähnlichkeit" und Gebrauchstheorie - Antwort: Autoren geben "pragmatische Haltung" zu, aber unzureichende Diskussion der Prototyp-Theorie 2. **Relationspol-Definition unzureichend**: - Berechnung von $l(s_i, s_j)$ in Formel (6) nicht explizit - Metapher vs. Metonymie-Unterscheidung abhängig von externen Ressourcen wie ChainNet 3. **Orientierungspol-Vereinfachung**: - Berücksichtigt nur positive/negative Polarität, ignoriert Mehrdimenionalität von Gefühl (außer VAD) - Zirkuläres Argument-Problem bei Seed-Wort-Auswahl #### Experimentelle Ebene 1. **Unzureichende Validierung**: - Section 5.7 nur 2 Wort-Fälle, statistische Signifikanz unzureichend - SEMCOR/MASC Zeitspanne nur 20 Jahre, unzureichend für diachronische Veränderung - Keine Vergleiche mit manuellen Annotationen zur Validierung 2. **Fehlende Methodenvergleiche**: - Table 3 nur Klassifizierung, keine quantitativen Genauigkeitsvergleiche - Fehlende Vergleichsexperimente verschiedener Darstellungsmethoden auf gleicher Aufgabe 3. **Datensatz-Einschränkungen**: - Abhängig von WordNet-Annotationen, aber WordNet-Abdeckung unvollständig (z.B. Slang, Neologismen) - Rauschen in ChainNet/SentiWordNet nicht diskutiert #### Abdeckungsbereich 1. **LLM-Ära-Methoden unzureichend**: - Nur einfache Erwähnung von GPT/BERT-Anwendungen in LSC - Keine Diskussion neuer Paradigmen wie Prompt Engineering, In-Context-Learning 2. **Multimodale Lücke**: Bild-Text-gemeinsame Modellierung kann Wortbedeutungsverständnis unterstützen 3. **Schwache kognitive Linguistik-Perspektive**: Keine Einbeziehung von Computational Models der Konzeptmetapher-Theorie (Lakoff & Johnson) ### Einflussanalyse #### Beitrag zum Forschungsgebiet (erwartet) 1. **Paradigmenwechsel**: Förderung von LSC-Forschung von Erkennung zu Charakterisierung 2. **Methodische Anleitung**: Formalisierter Rahmen kann direkt in Algorithmen umgewandelt werden (z.B. Algorithm 1 Pseudocode) 3. **Datensatz-Anforderungen**: Aufruf zur Konstruktion dreipoliger annotierter Daten, kann neue Benchmarks katalysieren #### Praktischer Wert 1. **Historisches NLP**: Verbesserung des Verständnisses historischer Texte (z.B. Wortbedeutungs-Disambiguierung in Shakespeares Werken) 2. **Wissensengineering**: Anleitung zur Wartung zeitlicher Wissensgraphen wie Wikidata 3. **Soziale Informatik**: Verfolgung von Wortbedeutungs-Entwicklung in sozialen Medien (z.B. Politisierung von "woke") #### Reproduzierbarkeit - **Hoch**: Formalisierte Definitionen sind klar, SEMCOR/MASC öffentlich verfügbar - **Mittel**: Einige Methoden (z.B. ChainNet) schwierig zu erhalten - **Niedrig**: Fehlende Code-Repositories, Leser müssen selbst implementieren ### Anwendungsszenarien #### Geeignete Anwendungen 1. **Digital Humanities**: Analyse von Wortbedeutungs-Entwicklung in literarischen Werken 2. **Wörterbuch-Erstellung**: Automatische Entdeckung von Einträgen, die aktualisiert werden müssen 3. **Soziolinguistik**: Untersuchung von Diskursveränderungen in sozialen Bewegungen (z.B. "feminism") 4. **Ressourcenarm-Sprachen**: Formalisierter Rahmen kann auf nicht-englische Sprachen übertragen werden #### Ungeeignete Szenarien 1. **Echtzeitsysteme**: Diachronische Analyse erfordert große historische Datenmengen, nicht geeignet für Online-Anwendungen 2. **Feingranulare WSD**: Dreipolige Klassifizierung ist zu grob, kann subtile semantische Unterschiede nicht verarbeiten 3. **Kausalinferenz**: Beschreibt nur "wie sich ändert", kann nicht "warum sich ändert" erklären ## Referenzen (Auswahl wichtiger Literatur) ### Theoretische Grundlagen 1. **Traugott (2017)**: Semantic change - Autoritative Quelle für sprachwissenschaftliche Klassifizierung 2. **Koch (2016)**: Meaning change and semantic shifts - Detaillierte Erklärung rhetorischer Mechanismen 3. **Blank (2012)**: Prinzipien des lexikalischen Bedeutungswandels - Deutsche Forschung zu semantischem Wandel ### Erkennungsmethoden 4. **Hamilton et al. (2016b)**: Diachronic word embeddings reveal statistical laws - Meilenstein für statische Embeddings 5. **Giulianelli et al. (2020)**: Analysing lexical semantic change with contextualised word representations - BERT-Anwendung 6. **Schlechtweg et al. (2020)**: SemEval-2020 Task 1 - Standard-Bewertungsaufgabe ### Charakterisierungsmethoden 7. **Inoue et al. (2022)**: Infinite SCAN - Topic-Modell dynamische Erkennung von Wortbedeutungs-Anzahl-Veränderung 8. **Fonteyn & Manjavacas (2021)**: Adjusting scope - Mehrpolige gemeinsame Analyse-Fallstudie 9. **Ehmüller et al. (2020)**: Sense tree discovery - Graph-Methode zur Visualisierung ### Vergleichende Übersichten 10. **Tahmasebi et al. (2018)**: Survey of computational approaches to LSC - Umfassendste Erkennungsübersicht 11. **Kutuzov et al. (2018)**: Diachronic word embeddings and semantic shifts - Wortdarstellungsmodell-Übersicht --- ## Zusammenfassung Dieses Paper ist eine **Meilenstein-Übersicht** im Forschungsgebiet semantischer Veränderungen, die erstmals die Charakterisierungsfrage systematisiert und einen dreipoligen Rahmen (D/R/O) mit formalisierter Definition als theoretische Grundlage für zukünftige Forschung bietet. Sein größter Wert liegt in: 1. **Klare Forschungsrichtung**: Aufzeigung von Lücken in Relationspol und mehrpoliger gemeinsamer Charakterisierung 2. **Terminologische Vereinheitlichung**: Beseitigung von Verwechslungen zwischen Erkennung vs. Charakterisierung, Broadening vs. Generalisierung usw. 3. **Operationalisierbarkeit**: Mengenlehre-Definitionen können direkt in Algorithmen umgewandelt werden Allerdings hat das Paper noch Verbesserungspotenzial in experimenteller Validierung, LLM-Ära-Methodenintegration und kognitiver Linguistik-Tiefe. Empfohlene zukünftige Arbeiten: - Konstruktion großflächiger dreipoliger annotierter Datensätze (z.B. Annotation von 1000 Wörtern in COHA für D/R/O-Veränderungen) - Entwicklung von End-to-End-Charakterisierungsmodellen (z.B. Multi-Task-Learning zur gleichzeitigen Vorhersage aller drei Pole) - Erkundung von Zero-Shot-Charakterisierungsfähigkeiten von LLMs (z.B. GPT-4 zur Bestimmung von Metaphorisierung) Für NLP-Forscher ist dieses Paper **Pflichtlektüre** beim Einstieg in das LSC-Forschungsgebiet; für Anwendungsentwickler bietet sein formalisierter Rahmen einen **theoretischen Leitfaden** zur Konstruktion von Systemen zum Verständnis historischer Texte.