One Sentence, Two Embeddings: Contrastive Learning of Explicit and Implicit Semantic Representations
Oda, Chuang, Shirai et al.
Sentence embedding methods have made remarkable progress, yet they still struggle to capture the implicit semantics within sentences. This can be attributed to the inherent limitations of conventional sentence embedding methods that assign only a single vector per sentence. To overcome this limitation, we propose DualCSE, a sentence embedding method that assigns two embeddings to each sentence: one representing the explicit semantics and the other representing the implicit semantics. These embeddings coexist in the shared space, enabling the selection of the desired semantics for specific purposes such as information retrieval and text classification. Experimental results demonstrate that DualCSE can effectively encode both explicit and implicit meanings and improve the performance of the downstream task.
academic
Одно предложение, два встраивания: Контрастивное обучение явных и неявных семантических представлений
Методы встраивания предложений достигли значительного прогресса, однако испытывают трудности при захвате неявной семантики внутри предложений. Это можно отнести к присущему ограничению традиционных методов встраивания предложений, которые назначают каждому предложению только один вектор. Для преодоления этого ограничения в данной работе предлагается DualCSE — метод, назначающий каждому предложению два встраивания: одно для представления явной семантики, другое для представления неявной семантики. Эти встраивания сосуществуют в общем пространстве, позволяя выбирать требуемую семантику для конкретных целей, таких как информационный поиск и классификация текстов. Экспериментальные результаты демонстрируют, что DualCSE эффективно кодирует явные и неявные значения, улучшая производительность нижестоящих задач.
Существующие методы встраивания предложений имеют значительные недостатки при обработке неявной семантики. Sun и соавторы (2025) указывают, что даже самые передовые методы встраивания предложений демонстрируют разрыв в производительности около 20% между явной и неявной семантикой на эталоне классификации MTEB.
Полнота семантического понимания: Естественный язык содержит как буквальные значения (явная семантика), так и метафорические или прагматические значения (неявная семантика)
Требования практического применения: Задачи информационного поиска, классификации текстов и другие требуют понимания различных уровней семантики
Ограничения модели: Традиционные методы представляют предложение только одним вектором, игнорируя существование множественных интерпретаций
Предложение фреймворка DualCSE: Генерирование двух векторов встраивания для каждого предложения, представляющих явную и неявную семантику соответственно
Разработка новой функции контрастивных потерь: Одновременная оптимизация отношений между предложениями и внутри предложений
Построение пространства с двойной семантикой: Возможность сравнения явных и неявных встраиваний в одном пространстве
Верификация эффективности метода: Демонстрация превосходства метода на задачах RTE и EIS
Предоставление способности оценки неявности: Возможность оценить степень неявности предложения
В работе цитируются важные работы из нескольких областей, включая встраивание предложений, естественный языковой вывод, контрастивное обучение и другие:
Gao et al. (2021): Метод SimCSE
Havaldar et al. (2025): Набор данных INLI
Wang et al. (2025): Метод оценки неявности
Reimers and Gurevych (2019): Sentence-BERT
Общая оценка: Это статья с сильной технической инновационностью, предлагающая интересный и практичный метод двойного семантического представления. Хотя есть место для улучшения в теоретической глубине и широте оценки, работа открывает новое направление в исследованиях встраивания предложений и имеет определенную академическую ценность и потенциал применения.