Sprache entwickelt sich dynamisch weiter, was sich durch Neologismen oder semantische Veränderungen bestehender Wörter widerspiegelt und soziokulturelle Transformationen reflektiert. Das Verständnis von Wortbedeutungen ist entscheidend für die Interpretation von Texten verschiedener Kulturen, Domänen oder Zeiträume und beeinflusst direkt die Leistung von NLP-Anwendungen wie maschinelle Übersetzung, Informationsabruf und Frage-Antwort-Systeme. Obwohl bestehende Methoden bereits gute Genauigkeit bei der Erkennung semantischer Veränderungen erreicht haben, fehlt es an systematischer Forschung zur Charakterisierung (characterize) von Typen semantischer Veränderungen. Diese Übersicht bietet erstmals eine umfassende Zusammenfassung bestehender Methoden zur Charakterisierung semantischer Veränderungen und definiert formal drei Kategorien von Veränderungen: Dimensionsveränderung (Wortbedeutung wird breiter oder enger), Orientierungsveränderung (Wortbedeutung wird negativer oder positiver), Relationsveränderung (Wortbedeutung transformiert sich durch rhetorische Mittel wie Metapher oder Metonymie). Das Paper fasst die wichtigsten Forschungsergebnisse zusammen, analysiert aktuelle Einschränkungen und weist auf zukünftige Forschungsrichtungen hin.
Lexikalischer semantischer Wandel (Lexical Semantic Change, LSC) ist ein Kernphänomen der Sprachentwicklung. Bestehende Forschung konzentriert sich hauptsächlich auf die Erkennung (detection) von semantischen Veränderungen, aber es mangelt erheblich an Forschung zur Charakterisierung von wie sich Bedeutungen verändern (how it changed). Beispiele:
Dieses Paper ist die erste systematische Übersicht zur Charakterisierung semantischer Veränderungen mit dem Ziel:
Gegeben die Darstellung eines Wortes in zwei Korpora als , bestimme, ob eine Veränderung auftritt: wobei (binäre Klassifizierung) oder (kontinuierliche Distanz)
Basierend auf Erkennung, weitere Klassifizierung des Veränderungstyps:
Ein Wort erfährt Veränderung zwischen dann und nur dann, wenn:
\text{Wahr} & S(w, t_1) \neq S(w, t_2) \\ \text{Falsch} & \text{andernfalls} \end{cases}$$ #### Dreipolige Definitionen **1. Dimensionsveränderung (Dimension)** $$|S(w, t_1)| \neq |S(w, t_2)|$$ - Broadening (Verbreiterung): $|S(w, t_1)| < |S(w, t_2)|$ (Wortbedeutungen nehmen zu) - Narrowing (Verengung): $|S(w, t_1)| > |S(w, t_2)|$ (Wortbedeutungen nehmen ab) **Beispiel**: - "plane" hat in SEMCOR 5 Bedeutungen (Ebene, Flugzeug, Hobel usw.), in MASC nur noch 2 → Verengung **2. Orientierungsveränderung (Orientation)** Definiere Sentimentfunktion $f: V \times T \rightarrow \{-1, 0, +1\}$, dann: $$f(w, t_1) \neq f(w, t_2)$$ - Amelioration (Verbesserung): $f(w, t_1) < f(w, t_2)$ (Positivierung) - Pejoration (Verschlechterung): $f(w, t_1) > f(w, t_2)$ (Negativierung) **Implementierung**: Gewichtete Summe von SentiWordNet-Scores $$f(w, t) = \frac{1}{N}\sum_{i=1}^{N} p(s_i) \cdot \text{positive}(s_i)$$ **Beispiel**: - "heart" hat in SEMCOR $f=0.15$, in MASC $f=0.97$ → Positivierung **3. Relationsveränderung (Relation)** Definiere Relationsähnlichkeit $l: S \times S \rightarrow \mathbb{R}$, Gesamtrelationsstärke: $$R(w, t) = \sum_{i=1}^{N-1}\sum_{j=i+1}^{N} l(s_i, s_j), \quad s_i, s_j \in S(w, t)$$ - Zunahme: $R(w, t_1) < R(w, t_2)$ (mehr metaphorische/metonymische Verwendungen) **Beispiel**: - "heart" erweitert sich von wörtlicher Bedeutung "Herz" zu metaphorischen Bedeutungen "Kern" und "Mut" → Relationsverbesserung ### Technische Innovationen 1. **Mengenlehre-Formalisierung**: Erstmalige Verwendung strenger mathematischer Sprache zur Definition von LSC-Charakterisierung, Beseitigung von Mehrdeutigkeiten 2. **Polsymmetrie**: Drei Pole bilden natürlich Paare (broadening/narrowing teilen Dimensionsmessung), vereinfachen Berechnungsrahmen 3. **Operationalisierbarkeit**: Definitionen können direkt in Algorithmen umgewandelt werden (z.B. Wortbedeutungszählung, Sentimentbewertung, Relationsdiagrammanalyse) 4. **Cambridge-Perspektive**: Adoption von statischem Vergleich (zwei Korpora-Vergleich) statt McTaggart-dynamischer Verfolgung, geeignet für Rechenmethoden ## Experimentelle Einrichtung ### Datensatzklassifizierung #### Diachronische Korpora (Table 2) | Korpus | Sprache | Zeitspanne | Umfang | Besonderheiten | |--------|---------|-----------|--------|-----------------| | **COHA** | Englisch | 1810er-2000er | 400 Millionen Wörter | Am häufigsten verwendet, ausgewogene Genres | | **Google N-Gram** | Mehrsprachig | 1600-2009 | 300 Milliarden Wörter | Größter Umfang, aber viel Rauschen | | **DTA** | Deutsch | 1741-1900 | 1022 Texte | Hohe Qualität, manuell ausgewählt | | **CLMET** | Englisch | 1710-1920 | 34 Millionen Wörter | Hauptsächlich literarische Werke | #### Demonstrationsdatensätze - **SEMCOR** (1993): 200.000 Wörter, WordNet-Bedeutungsannotationen - **MASC** (2013): 500.000 Wörter, modernes amerikanisches Englisch - **Annotationsquellen**: - Bedeutungen: WordNet - Relationen: ChainNet (Metapher-/Metonymie-Verbindungen) - Orientierung: SentiWordNet (positive/negative Scores) ### Bewertungsdimensionen Das Paper selbst als Übersicht bietet keine einheitlichen Bewertungsmetriken, analysiert aber bestehende Bewertungsmethoden: #### Dimensionspol (D) - **Metriken**: Veränderung der Wortbedeutungsanzahl, Cluster-Dichte, Themenzahl - **Datenquellen**: Wörterbücher, Bedeutungsinduktions-Clustering, Topic-Modelle #### Orientierungspol (O) - **Metriken**: Distanz zu Seed-Wörtern, VAD-Framework-Scores (Valence-Arousal-Dominance) - **Herausforderungen**: Stabilität von Seed-Wörtern, Ironie-/Negationsbehandlung #### Relationspol (R) - **Metriken**: Entropiezunahme (Schlechtweg 2017), Kantenanzahl in Relationsdiagrammen - **Probleme**: Schwierigkeit, Metapher vs. neue Homonymie zu unterscheiden ### Methodenklassifizierung (Table 3 Kern) | Methode | D | R | O | Darstellungsmethode | |---------|---|---|---|-------------------| | Biemann 2006 | ✓ | - | - | Graph | | Tang et al. 2013 | ✓ | ✓ | - | Häufigkeit | | Hamilton et al. 2016a | - | - | ✓ | Graph (SentiProp) | | Inoue et al. 2022 | ✓ | - | - | Topics (InfiniteSCAN) | | Giulianelli et al. 2020 | ✓ | - | - | Embeddings (BERT) | | Fonteyn & Manjavacas 2021 | - | ✓ | ✓ | Embeddings | **Schlüsselfunde**: - **Keine Methode deckt alle drei Pole ab**: Charakterisierungskomplexität ist hoch - **Dimensionspol am meisten erforscht**: 18/23 Methoden - **Relationspol am schwächsten**: Nur 3 Methoden - **Embedding-Methoden dominieren**: Neuester Trend ## Experimentelle Ergebnisse ### Rahmenvalidierung (Section 5.7) #### Fall 1: Mehrpolige Veränderung von "heart" **Daten** (SEMCOR → MASC): ``` Bedeutungsverteilungsveränderung: - heart.n.02 (Organ, wörtlich): 34,8% → 0% - heart.n.03 (Mut, Metapher+): 12,1% → 90,1% - heart.n.10 (Pokersymbol, neu): 0% → 2,8% ``` **Berechnungsergebnisse**: 1. **Dimension**: $|S|: 5 \rightarrow 3$, Verengung 2. **Orientierung**: $f: 0.15 \rightarrow 0.97$, starke Positivierung 3. **Relation**: Metaphorische Verwendung dominiert (90,1%), Relationsverbesserung **Interpretation**: Wörtliche Bedeutung "Herz" verschwindet, metaphorische Bedeutung "Mut/Kern" wird zur Prototypbedeutung #### Fall 2: Verengung von "plane" **Daten**: ``` SEMCOR: 5 Bedeutungen (Flugzeug 48,8%, Ebene 37,2%, Hobel 4,7% usw.) MASC: 2 Bedeutungen (Flugzeug 90,9%, Ebene 9,1%) ``` **Berechnungsergebnisse**: 1. **Dimension**: $5 \rightarrow 2$, signifikante Verengung 2. **Orientierung**: Positive Bedeutung (flat.s.01, +0.375) geht verloren → leichte Negativierung 3. **Relation**: $R: 1 \rightarrow 0$ (Metonymie-Beziehung zwischen plane.n.03 und plane.n.02 verschwindet) ### Methodenvergleichsanalyse (Table 4) #### Häufigkeitsmethoden **Vorteile**: - Einfach und interpretierbar - Geeignet für Erkennung von Neologismen - Geringer Datenbedarf **Nachteile**: - Kann Wortbedeutungen nicht unterscheiden (Polysemie-Problem) - Schwierig, semantische Ähnlichkeit zu erfassen - Empfindlich gegenüber Ironie/Negation **Anwendungsszenarien**: Statistische Co-Occurrence von Seed-Wörtern für Orientierungspol #### Topic-Modelle **Vorteile**: - Unüberwachte Entdeckung neuer Wortbedeutungen - Visualisierung der Themenentwicklung - InfiniteSCAN passt Themenzahl dynamisch an **Nachteile**: - Erfordert menschliche Themeninterpretation - Schwierige Kontrolle der Themengranularität - Forschungslücken bei Relationspol und Orientierungspol **Repräsentative Arbeiten**: - SCAN (Frermann & Lapata 2016) - InfiniteSCAN (Inoue et al. 2022): Automatische Erkennung der Wortbedeutungsanzahl-Veränderung #### Graphmethoden **Vorteile**: - Natürliche Darstellung von Wortbeziehungen - Visualisierung von Wortbedeutungs-Entwicklungsbäumen (Ehmüller et al. 2020) - Geeignet für Sentimentausbreitung (SentiProp) **Nachteile**: - Abhängig von Graphkonstruktionsqualität - Hohe Rechenkomplexität - Relationspol stark untererforscht **Repräsentative Arbeiten**: - Chinese Whispers Clustering (Biemann 2006) - Ego-network + PMI-Filterung (Ehmüller et al. 2020) #### Embedding-Methoden **Vorteile**: - Erfassung feiner semantischer Veränderungen - BERT und andere kontextuelle Embeddings verbessern Leistung - Dichte-Embeddings (word2gauss) modellieren Polysemie **Nachteile**: - **Meaning Conflation Deficiency**: Einzelne Vektoren können keine feingranularen Wortbedeutungen unterscheiden - Instabilität bei niedrigen Häufigkeiten - Kontextuelle Embeddings sind überkontext-abhängig → Falsch-Positive **Repräsentative Arbeiten**: - Diachronic embeddings (Hamilton et al. 2016b) - Gaussian embeddings (Moss 2020, Yüksel et al. 2021) - XL-LEXEME (Cassotti et al. 2023): Sprachübergreifendes WSD-Pretraining ### Wichtige Funde 1. **Charakterisierung ist schwieriger als Erkennung**: SemEval-2020 zeigt, dass kontextuelle Embeddings bei LSC-Erkennung statische Embeddings nicht übertreffen, Charakterisierung erfordert spezialisierte Designs 2. **Datenbottleneck**: Historische Korpora Millionen-Skala vs. modernes LLM benötigt Billionen-Skala → Few-Shot-Learning erforderlich 3. **Mehrsprachige Lücke**: 90% der Forschung nur auf Englisch 4. **Relationspol-Lücke**: Nur 3 Papiere, kein standardisierter Datensatz 5. **Bewertungsschwierigkeiten**: Fehlender Gold-Standard, meist qualitative Analyse ## Verwandte Arbeiten ### Vergleich bestehender Übersichten | Übersicht | Jahr | Fokus | Unterschied zu diesem Paper | |-----------|------|-------|---------------------------| | **Tang 2018** | 2018 | Vier-Schritte-Rahmen (Korpus→Bedeutung→Modellierung→Validierung) | Konzentriert sich auf Erkennung, Charakterisierung nur kurz erwähnt | | **Tahmasebi et al. 2018** | 2018 | Wort-/Bedeutungsebenen-Unterscheidung, Wortaustausch | Empfiehlt tiefere Charakterisierungsforschung | | **Kutuzov et al. 2018** | 2018 | Wortdarstellungsmodelle und Daten | Weist auf unzureichende Validierung von Klassifizierungsschemata hin | | **Montanelli & Periti 2023** | 2023 | Kontextuelle Embedding-Methoden | Fordert Forschung zu "Gesetzen des semantischen Wandels" | | **Dieses Paper** | 2025 | **Charakterisierung Dreipolsystem + Formalisierung** | Erste systematische Charakterisierungsübersicht | ### Theoretische Grundlagen #### Sprachwissenschaftliche Klassifizierung (Traugott 2017) - **Broadening/Narrowing**: Veränderung des Bedeutungsumfangs - **Amelioration/Pejoration**: Veränderung des emotionalen Wertes - **Metaphorization/Metonymization**: Veränderung der rhetorischen Mechanismen #### Computerperspektive-Klassifizierung - **Cambridge-Perspektive**: Statischer Vergleich zweier Korpora (in diesem Paper verwendet) - **McTaggart-Perspektive**: Dynamische Verfolgung des Entwicklungsprozesses (erfordert historisches Wissen) ### Entwicklung der Wortbedeutungsdarstellung 1. **Frühe Phase**: Häufigkeit + Co-Occurrence-Matrix (Sagi et al. 2009) 2. **2010er**: Topic-Modelle (Lau et al. 2012), Graph-Clustering (Biemann 2006) 3. **2016+**: Statische Embeddings (Hamilton et al. 2016b) 4. **2019+**: BERT und andere kontextuelle Embeddings (Giulianelli et al. 2020) 5. **Zukunft**: LLM-generative Methoden (Cassotti et al. 2024) ## Schlussfolgerungen und Diskussion ### Hauptschlussfolgerungen 1. **Charakterisierungsforschung stark unterrepräsentiert**: Verhältnis von Erkennungs- zu Charakterisierungspapieren etwa 9:1 2. **Dreipoliges Ungleichgewicht**: Dimensionspol (D) ausreichend erforscht, Relationspol (R) praktisch nicht vorhanden 3. **Methodische Fragmentierung**: Fehlender einheitlicher Rahmen und Bewertungsstandards 4. **Notwendigkeit der Formalisierung**: Mengenlehre-Definitionen können Mehrdeutigkeiten beseitigen und Methodenvergleiche fördern 5. **Datenbeschränkungen**: Historische Korpusgröße begrenzt Deep-Learning-Anwendungen ### Einschränkungen #### Methodologische Einschränkungen 1. **Vereinfachte Annahmen**: Bedeutungsobjektivismus (sense objectivism) ignoriert Kontextabhängigkeit 2. **Binäre Einschränkungen**: Broadening/Narrowing können Veränderungen der Wortbedeutungs-Intension (Intension) nicht beschreiben 3. **Relationspol-Definitionsmehrdeutigkeit**: Schwierig, Metapher vs. Metonymie vs. neue Homonymie zu unterscheiden #### Datenbeschränkungen 1. **Korpus-Bias**: - Ausgewogene Korpora wie COHA haben immer noch Genre-Verzerrungen - Google N-Gram hat viel Rauschen (OCR-Fehler) 2. **Annotationsverzögerung**: Wörterbücher erfassen neue Bedeutungen mit 5-10 Jahren Verzögerung 3. **Mehrsprachige Lücke**: Nicht-englische Forschung <10% #### Bewertungsbeschränkungen 1. **Gold-Standard-Mangel**: Meist qualitative Analyse 2. **Seed-Wort-Stabilitätsproblem**: Orientierungspol nimmt an, dass Seed-Wörter sich nicht ändern (tatsächlich ändern sie sich) 3. **Schwellenwert-Subjektivität**: Schwellenwert für binäre Klassifizierung von Veränderungen fehlt Konsens ### Zukünftige Richtungen #### Kurzfristig (1-2 Jahre) 1. **Relationspol-Durchbruch**: - Konstruktion von Metapher-/Metonymie-annotierten Datensätzen - Nutzung von Wissensgraphen (Wikidata) zur Modellierung von Konzeptbeziehungen 2. **Mehrpolige gemeinsame Modellierung**: Einzelnes Modell charakterisiert gleichzeitig D+R+O 3. **Standardisierte Bewertung**: Etablierung von LSC-Charakterisierungs-Benchmarks #### Mittelfristig (3-5 Jahre) 1. **LLM-Anwendungen**: - Few-Shot-Lernen lindert Datenmangel - Generative Methoden synthetisieren historische Korpora (Cassotti et al. 2024) 2. **Sprachübergreifende Forschung**: - Validierung universeller Gesetze semantischer Veränderungen - Nutzung mehrsprachiger Pretraining-Modelle 3. **Kausalanalyse**: Von "wie sich ändert" zu "warum sich ändert" (soziokulturelle Faktoren) #### Langfristig (5+ Jahre) 1. **Gesetze semantischer Veränderung**: - Welche Wortklassen unterliegen leicht Broadening? - Beziehung zwischen Häufigkeit und Veränderungsgeschwindigkeit 2. **Anwendungsgesteuert**: - Maschinelle Übersetzung historischer Texte - Dynamische Wissensgraph-Wartung - Modellierung kultureller Evolution ## Tiefenanalyse ### Stärken #### Akademische Beiträge 1. **Schließung von Forschungslücken**: Erste systematische Charakterisierungsübersicht, klare Unterscheidung zwischen Identifikation und Charakterisierung 2. **Theoretische Innovationen**: - Dreipoliges Klassifizierungssystem integriert sprachwissenschaftliche und computerlinguistische Perspektiven - Formalisierter Rahmen (Section 5) kann direkt Algorithmendesign leiten 3. **Umfassendheit**: - Zeitspanne: 2006-2024 - Methodenabdeckung: 4 Darstellungstypen × 3 Veränderungstypen = 12-dimensionale Analyse - Tiefenanalyse von 23 Kernpapieren #### Methodologische Vorteile 1. **Semantische Suche**: Verwendung von Research Rabbit-Tool zur iterativen Literaturerweiterung (11→151 Papiere) 2. **Empirische Validierung**: SEMCOR/MASC-Fälle demonstrieren Rahmenoperationalisierbarkeit 3. **Visualisierung**: Figure 1 Klassifizierungsbaum, Figure 11 dreidimensionaler Raum vermitteln intuitive Darstellung #### Schreibqualität 1. **Klare Struktur**: Hintergrund→Methode→Formalisierung→Diskussion logisch konsistent 2. **Terminologische Vereinheitlichung**: Klare Definitionen von LSC, D/R/O und anderen Kernkonzepten 3. **Informationsreiche Tabellen**: Table 2-4 konzentrieren große Informationsmengen ### Schwächen #### Theoretische Ebene 1. **Bedeutungsobjektivitätskontroverse**: - Annahme, dass Wortbedeutungen diskret aufzählbar sind ($S(w,t)=\{s_1,...,s_k\}$) - Ignoriert Wittgensteins "Familienähnlichkeit" und Gebrauchstheorie - Antwort: Autoren geben "pragmatische Haltung" zu, aber unzureichende Diskussion der Prototyp-Theorie 2. **Relationspol-Definition unzureichend**: - Berechnung von $l(s_i, s_j)$ in Formel (6) nicht explizit - Metapher vs. Metonymie-Unterscheidung abhängig von externen Ressourcen wie ChainNet 3. **Orientierungspol-Vereinfachung**: - Berücksichtigt nur positive/negative Polarität, ignoriert Mehrdimenionalität von Gefühl (außer VAD) - Zirkuläres Argument-Problem bei Seed-Wort-Auswahl #### Experimentelle Ebene 1. **Unzureichende Validierung**: - Section 5.7 nur 2 Wort-Fälle, statistische Signifikanz unzureichend - SEMCOR/MASC Zeitspanne nur 20 Jahre, unzureichend für diachronische Veränderung - Keine Vergleiche mit manuellen Annotationen zur Validierung 2. **Fehlende Methodenvergleiche**: - Table 3 nur Klassifizierung, keine quantitativen Genauigkeitsvergleiche - Fehlende Vergleichsexperimente verschiedener Darstellungsmethoden auf gleicher Aufgabe 3. **Datensatz-Einschränkungen**: - Abhängig von WordNet-Annotationen, aber WordNet-Abdeckung unvollständig (z.B. Slang, Neologismen) - Rauschen in ChainNet/SentiWordNet nicht diskutiert #### Abdeckungsbereich 1. **LLM-Ära-Methoden unzureichend**: - Nur einfache Erwähnung von GPT/BERT-Anwendungen in LSC - Keine Diskussion neuer Paradigmen wie Prompt Engineering, In-Context-Learning 2. **Multimodale Lücke**: Bild-Text-gemeinsame Modellierung kann Wortbedeutungsverständnis unterstützen 3. **Schwache kognitive Linguistik-Perspektive**: Keine Einbeziehung von Computational Models der Konzeptmetapher-Theorie (Lakoff & Johnson) ### Einflussanalyse #### Beitrag zum Forschungsgebiet (erwartet) 1. **Paradigmenwechsel**: Förderung von LSC-Forschung von Erkennung zu Charakterisierung 2. **Methodische Anleitung**: Formalisierter Rahmen kann direkt in Algorithmen umgewandelt werden (z.B. Algorithm 1 Pseudocode) 3. **Datensatz-Anforderungen**: Aufruf zur Konstruktion dreipoliger annotierter Daten, kann neue Benchmarks katalysieren #### Praktischer Wert 1. **Historisches NLP**: Verbesserung des Verständnisses historischer Texte (z.B. Wortbedeutungs-Disambiguierung in Shakespeares Werken) 2. **Wissensengineering**: Anleitung zur Wartung zeitlicher Wissensgraphen wie Wikidata 3. **Soziale Informatik**: Verfolgung von Wortbedeutungs-Entwicklung in sozialen Medien (z.B. Politisierung von "woke") #### Reproduzierbarkeit - **Hoch**: Formalisierte Definitionen sind klar, SEMCOR/MASC öffentlich verfügbar - **Mittel**: Einige Methoden (z.B. ChainNet) schwierig zu erhalten - **Niedrig**: Fehlende Code-Repositories, Leser müssen selbst implementieren ### Anwendungsszenarien #### Geeignete Anwendungen 1. **Digital Humanities**: Analyse von Wortbedeutungs-Entwicklung in literarischen Werken 2. **Wörterbuch-Erstellung**: Automatische Entdeckung von Einträgen, die aktualisiert werden müssen 3. **Soziolinguistik**: Untersuchung von Diskursveränderungen in sozialen Bewegungen (z.B. "feminism") 4. **Ressourcenarm-Sprachen**: Formalisierter Rahmen kann auf nicht-englische Sprachen übertragen werden #### Ungeeignete Szenarien 1. **Echtzeitsysteme**: Diachronische Analyse erfordert große historische Datenmengen, nicht geeignet für Online-Anwendungen 2. **Feingranulare WSD**: Dreipolige Klassifizierung ist zu grob, kann subtile semantische Unterschiede nicht verarbeiten 3. **Kausalinferenz**: Beschreibt nur "wie sich ändert", kann nicht "warum sich ändert" erklären ## Referenzen (Auswahl wichtiger Literatur) ### Theoretische Grundlagen 1. **Traugott (2017)**: Semantic change - Autoritative Quelle für sprachwissenschaftliche Klassifizierung 2. **Koch (2016)**: Meaning change and semantic shifts - Detaillierte Erklärung rhetorischer Mechanismen 3. **Blank (2012)**: Prinzipien des lexikalischen Bedeutungswandels - Deutsche Forschung zu semantischem Wandel ### Erkennungsmethoden 4. **Hamilton et al. (2016b)**: Diachronic word embeddings reveal statistical laws - Meilenstein für statische Embeddings 5. **Giulianelli et al. (2020)**: Analysing lexical semantic change with contextualised word representations - BERT-Anwendung 6. **Schlechtweg et al. (2020)**: SemEval-2020 Task 1 - Standard-Bewertungsaufgabe ### Charakterisierungsmethoden 7. **Inoue et al. (2022)**: Infinite SCAN - Topic-Modell dynamische Erkennung von Wortbedeutungs-Anzahl-Veränderung 8. **Fonteyn & Manjavacas (2021)**: Adjusting scope - Mehrpolige gemeinsame Analyse-Fallstudie 9. **Ehmüller et al. (2020)**: Sense tree discovery - Graph-Methode zur Visualisierung ### Vergleichende Übersichten 10. **Tahmasebi et al. (2018)**: Survey of computational approaches to LSC - Umfassendste Erkennungsübersicht 11. **Kutuzov et al. (2018)**: Diachronic word embeddings and semantic shifts - Wortdarstellungsmodell-Übersicht --- ## Zusammenfassung Dieses Paper ist eine **Meilenstein-Übersicht** im Forschungsgebiet semantischer Veränderungen, die erstmals die Charakterisierungsfrage systematisiert und einen dreipoligen Rahmen (D/R/O) mit formalisierter Definition als theoretische Grundlage für zukünftige Forschung bietet. Sein größter Wert liegt in: 1. **Klare Forschungsrichtung**: Aufzeigung von Lücken in Relationspol und mehrpoliger gemeinsamer Charakterisierung 2. **Terminologische Vereinheitlichung**: Beseitigung von Verwechslungen zwischen Erkennung vs. Charakterisierung, Broadening vs. Generalisierung usw. 3. **Operationalisierbarkeit**: Mengenlehre-Definitionen können direkt in Algorithmen umgewandelt werden Allerdings hat das Paper noch Verbesserungspotenzial in experimenteller Validierung, LLM-Ära-Methodenintegration und kognitiver Linguistik-Tiefe. Empfohlene zukünftige Arbeiten: - Konstruktion großflächiger dreipoliger annotierter Datensätze (z.B. Annotation von 1000 Wörtern in COHA für D/R/O-Veränderungen) - Entwicklung von End-to-End-Charakterisierungsmodellen (z.B. Multi-Task-Learning zur gleichzeitigen Vorhersage aller drei Pole) - Erkundung von Zero-Shot-Charakterisierungsfähigkeiten von LLMs (z.B. GPT-4 zur Bestimmung von Metaphorisierung) Für NLP-Forscher ist dieses Paper **Pflichtlektüre** beim Einstieg in das LSC-Forschungsgebiet; für Anwendungsentwickler bietet sein formalisierter Rahmen einen **theoretischen Leitfaden** zur Konstruktion von Systemen zum Verständnis historischer Texte.