Sentence embedding methods have made remarkable progress, yet they still struggle to capture the implicit semantics within sentences. This can be attributed to the inherent limitations of conventional sentence embedding methods that assign only a single vector per sentence. To overcome this limitation, we propose DualCSE, a sentence embedding method that assigns two embeddings to each sentence: one representing the explicit semantics and the other representing the implicit semantics. These embeddings coexist in the shared space, enabling the selection of the desired semantics for specific purposes such as information retrieval and text classification. Experimental results demonstrate that DualCSE can effectively encode both explicit and implicit meanings and improve the performance of the downstream task.
One Sentence, Two Embeddings: Contrastive Learning of Explicit and Implicit Semantic Representations 论文ID : 2510.09293标题 : One Sentence, Two Embeddings: Contrastive Learning of Explicit and Implicit Semantic Representations作者 : Kohei Oda¹, Po-Min Chuang², Kiyoaki Shirai¹, Natthawut Kertkeidkachorn¹机构 : ¹日本先端科学技术研究院, ²东芝公司分类 : cs.CL (Computation and Language)发表时间 : 2025年10月10日论文链接 : https://arxiv.org/abs/2510.09293v1 句子嵌入方法已取得显著进展,但在捕获句子内的隐含语义方面仍存在困难。这可归因于传统句子嵌入方法只为每个句子分配单一向量的固有限制。为克服这一限制,本文提出DualCSE,一种为每个句子分配两个嵌入的方法:一个表示显式语义,另一个表示隐式语义。这些嵌入在共享空间中共存,能够针对信息检索和文本分类等特定用途选择所需的语义。实验结果表明,DualCSE能够有效编码显式和隐式含义,并提高下游任务的性能。
现有的句子嵌入方法在处理隐含语义方面存在显著缺陷。Sun等人(2025)指出,即使是最先进的句子嵌入方法在MTEB分类基准上,显式语义和隐式语义之间也存在近20%的性能差距。
语义理解的完整性 :自然语言中既包含字面意思(显式语义)也包含比喻或语用含义(隐式语义)实际应用需求 :信息检索、文本分类等任务需要理解不同层次的语义模型局限性 :传统方法仅用单一向量表示句子,忽略了多重解释的存在单向量限制 :每个句子只分配一个嵌入向量语义混合 :无法区分显式和隐式语义表示能力不足 :难以捕获句子的多层含义提出DualCSE框架 :为每个句子生成两个嵌入向量,分别表示显式和隐式语义设计新颖的对比损失函数 :同时优化句间关系和句内关系构建双语义共享空间 :使显式和隐式嵌入能够在同一空间中进行比较验证方法有效性 :在RTE和EIS任务上证明了方法的优越性提供隐含性评估能力 :能够估计句子的隐含程度给定句子s,DualCSE将其编码为两个嵌入:
论文提出两种编码器架构:
Cross-encoder :使用单个BERT/RoBERTa模型 输入"CLS s SEP explicit"生成显式嵌入r 输入"CLS s SEP implicit"生成隐式嵌入u Bi-encoder :使用两个独立的BERT/RoBERTa模型 分别训练生成r和u 基于INLI数据集设计的损失函数:
v(h₁,h₂) = e^(sim(h₁,h₂)/τ)
lᵢ = -log(v(rᵢ,r⁺ᵢ₁)/∑ⱼ(v(rᵢ,r⁺ⱼ₁) + v(rᵢ,r⁻ⱼ) + v(rᵢ,uⱼ)))
-log(v(uᵢ,r⁺ᵢ₂)/∑ⱼ(v(uᵢ,r⁺ⱼ₂) + v(uᵢ,r⁻ⱼ) + v(uᵢ,rⱼ)))
-log(v(r⁺ᵢ₁,u⁺ᵢ₁)/∑ⱼv(r⁺ᵢ₁,u⁺ⱼ₁))
-log(v(r⁺ᵢ₂,u⁺ᵢ₂)/∑ⱼv(r⁺ᵢ₂,u⁺ⱼ₂))
-log(v(r⁻ᵢ,u⁻ᵢ)/∑ⱼv(r⁻ᵢ,u⁻ⱼ))
双重语义表示 :突破单向量限制,为句子提供两个不同维度的表示句间和句内关系建模 :
句间:前提与蕴含假设相似,与矛盾假设不相似 句内:假设的显式和隐式语义相近,前提的显式和隐式语义相远 共享空间设计 :使不同类型的语义能够在同一空间中比较规模 :训练集32,000对,开发集4,000对,测试集4,000对特点 :为每个前提提供四种假设标签
implied-entailment:隐式蕴含 explicit-entailment:显式蕴含 neutral:中性 contradiction:矛盾 规模 :训练集101,320对,开发/测试集各5,630对用途 :隐含性评分任务RTE任务 :准确率(Accuracy)EIS任务 :准确率(Accuracy)SimCSE (SNLI+MNLI) :基于标准NLI数据集训练SimCSE (INLI) :基于INLI数据集训练的SimCSEImpScore :专门用于隐含性评分的方法大语言模型 :GPT-4、Gemini-1.5-Pro等作为参考基础模型 :BERT-base、RoBERTa-base批次大小 :Cross-encoder为64,Bi-encoder为32学习率 :Cross-encoder为5e-5,Bi-encoder为3e-5温度参数τ :0.05模型 显式 隐式 中性 矛盾 平均 SimCSE (SNLI+MNLI) 79.80 49.00 74.30 67.60 67.68 SimCSE (INLI) 90.60 69.10 66.90 91.00 79.40 DualCSE-Cross 90.20 73.40 68.40 88.70 80.18 DualCSE-Bi 91.90 69.90 72.10 87.60 80.38 Gemini-1.5-Pro 97.90 80.30 92.00 95.40 91.40
模型 INLI Wang等人数据集 LENGTH 99.90 73.37 ImpScore (original) 80.55 95.20 ImpScore (INLI) 99.97 81.56 DualCSE-Cross 99.97 79.31 DualCSE-Bi 100 77.48
消融实验验证了损失函数各组件的重要性:
损失函数配置 RTE EIS 完整DualCSE 80.18 99.97 无矛盾项 64.57 99.88 无句内关系 80.10 92.25 无矛盾项和句内关系 64.68 32.75
发现 :
矛盾项对RTE任务更重要 句内关系对EIS任务更重要 查询句 :"She conquered his heart."
显式语义检索结果 :
"She defeated his heart in battle."(字面战斗含义) "She overcame his cardiac defenses." "She vanquished his emotional barriers." 隐式语义检索结果 :
"She won his affection and love."(爱情含义) "She captured his romantic interest." "She gained his deep emotional attachment." BERT-based方法 :Sentence-BERT、SimCSE等对比学习 :在句子嵌入中的应用多语义表示 :少数工作尝试捕获多重含义语用学研究 :会话含义、间接言语行为NLI扩展 :从显式推理到隐式推理隐含性评估 :量化句子的隐含程度首次系统性 :专门针对显式/隐式语义的双重表示端到端训练 :统一框架同时学习两种语义实用性强 :可直接应用于多种下游任务DualCSE有效性 :在RTE和EIS任务上均优于基线方法双重表示价值 :显式和隐式语义的分离表示确实有助于理解损失函数设计合理 :句间和句内关系的建模都很重要架构灵活性 :Cross-encoder和Bi-encoder都能有效工作数据集依赖 :仅使用INLI数据集训练,领域多样性有限评估任务有限 :只在两个任务上验证,缺乏更广泛的评估计算开销 :需要为每个句子生成两个嵌入,增加了计算成本跨领域泛化 :在Wang等人数据集上的表现不如专门方法数据集扩展 :将仇恨言论检测、情感分析等数据转换为INLI格式大模型集成 :将方法扩展到大语言模型实际应用 :在客户评论分析、搜索引擎等场景中验证理论分析 :深入研究显式/隐式语义的数学性质问题定义清晰 :准确识别了现有方法的核心问题方法创新性强 :双重语义表示是一个新颖且合理的思路实验设计充分 :包含主实验、消融实验和定性分析技术实现可行 :提供了两种不同的架构选择代码开源 :提高了可复现性理论基础薄弱 :缺乏对显式/隐式语义区分的理论分析评估范围有限 :仅在两个任务上验证,说服力不够强基线对比不够 :缺少与其他多语义表示方法的对比效率分析缺失 :未分析双重嵌入带来的计算开销跨语言能力未知 :仅在英语上验证学术价值 :为句子嵌入研究提供了新的视角实用价值 :可应用于需要理解隐含含义的NLP任务启发性 :可能激发更多关于多重语义表示的研究局限性 :影响力可能受限于方法的通用性信息检索 :需要同时考虑字面和隐含含义的搜索文本分类 :情感分析、意图识别等任务对话系统 :理解用户的言外之意内容审核 :检测隐晦的不当内容语言教育 :帮助理解语言的多层含义本文引用了句子嵌入、自然语言推理、对比学习等多个领域的重要工作,包括:
Gao et al. (2021): SimCSE方法 Havaldar et al. (2025): INLI数据集 Wang et al. (2025): 隐含性评分方法 Reimers and Gurevych (2019): Sentence-BERT 总体评价 :这是一篇技术创新性较强的论文,提出了有趣且实用的双重语义表示方法。虽然在理论深度和评估广度上还有提升空间,但为句子嵌入研究开辟了新方向,具有一定的学术价值和应用潜力。