2025-11-12T20:04:10.594856

Reputational Conservatism in Expert Advice

Lukyanov, Vlasova
We study an expert-advice problem with career concerns and a continuous private signal about a binary payoff. A principal implements safe advice for sure and risky advice with a probability that increases with the expert's reputation; realized outcomes, when available, update reputation. We show equilibrium advice follows a cutoff in the signal and, under a relative-diagnosticity condition, the cutoff increases with reputation (reputational conservatism). Comparative statics are transparent, and simple policy levers - a success-contingent bonus and gatekeeping - provide implementable control of experimentation.
academic

Reputational Conservatism in Expert Advice

基本信息

  • 论文ID: 2509.04036
  • 标题: Reputational Conservatism in Expert Advice
  • 作者: Georgy Lukyanov (Toulouse School of Economics), Anna Vlasova (CREST—École Polytechnique)
  • 分类: econ.TH (Economic Theory)
  • 发表时间: 2025年10月14日 (arXiv版本v4)
  • 论文链接: https://arxiv.org/abs/2509.04036

摘要

本文研究了一个具有职业关切的专家建议问题,其中专家对二元收益拥有连续的私人信号。委托人必定会实施安全建议,而风险建议的实施概率随专家声誉的提高而增加;实现的结果(如果可观察)会更新声誉。研究表明,均衡建议遵循信号的截止形式,在相对诊断性条件下,截止值随声誉增加而提高(声誉保守主义)。比较静态分析透明,简单的政策杠杆——成功条件奖金和门控——为实验控制提供可实施的工具。

研究背景与动机

  1. 核心问题:组织经常依赖专家在安全行动方案和风险方案之间提供建议。一个常见现象是高级别、高地位的专家似乎更倾向于保守:他们比初级专家更少提出风险举措,但当他们确实承担风险时,成功率似乎更高。
  2. 问题重要性:理解专家建议中的声誉效应对组织设计至关重要,因为它影响创新、实验和风险承担的决策质量。
  3. 现有方法局限性
    • 政治正确模型关注偏见感知,而非基于能力的声誉更新
    • 连续信号的声誉廉价谈话模型缺乏明确的实施概率机制
    • 动态职业关切环境复杂,难以分离短期选择效应
  4. 研究动机:提供一个简单、可处理的框架来解释高声誉专家的保守行为模式,并展示委托人如何调节这种模式。

核心贡献

  1. 理论框架:建立了一个单期专家建议模型,其中实施概率随声誉增加,结果更新基于能力的声誉
  2. 均衡特征:证明了均衡建议采用唯一的信号截止形式(命题3.1)
  3. 声誉保守主义:在透明的相对诊断性条件下,实验阈值随声誉单调递增(命题4.2)
  4. 比较静态分析:提供了信息性、先验成功概率和职业关切强度的封闭形式结果
  5. 政策工具:识别了两个可实施的杠杆——成功条件奖金和门控——来调节实验行为

方法详解

任务定义

研究一个专家-委托人的单期建议问题,其中:

  • 输入:专家观察关于状态t∈{0,1}的连续私人信号x∈ℝ
  • 输出:专家推荐行动a∈{R,S}(风险或安全)
  • 约束:委托人总是实施S,以概率λ(ρ)实施R,其中ρ是专家当前声誉

模型架构

时间线结构

  1. 自然状态t∈{0,1}以先验π := P(t=1)∈(0,1)被抽取
  2. 市场对专家持有当前声誉ρ∈0,1
  3. 专家观察关于t的私人信号x∈ℝ并推荐a∈{R,S}
  4. 委托人以概率1实施S,以概率λ(ρ)∈0,1实施R
  5. 如果R被实施,结果y∈{0,1}实现并公开观察;如果S被实施,结果无信息
  6. 市场根据公开历史更新专家声誉至ρ⁺

关键技术组件

信息结构

  • 后验成功概率:p(x) := P(t=1|x),严格递增且连续
  • 满足单调似然比性质(MLRP)

收益函数

  • 安全建议:U_S(ρ) = W(ρ)
  • 风险建议:U_R(p;ρ,b) = λ(ρ)p(W(ρ⁺{R,1}(ρ)) + b) + (1-p)W(ρ⁺{R,0}(ρ)) + (1-λ(ρ))W(ρ)

增量价值函数

Δ(p;ρ,b) := U_R(p;ρ,b) - U_S(ρ)
           = λ(ρ)[p(Δ_s(ρ) + b) + (1-p)Δ_f(ρ)]

其中Δ_s(ρ) := W(ρ⁺{R,1}(ρ)) - W(ρ) > 0,Δ_f(ρ) := W(ρ⁺{R,0}(ρ)) - W(ρ) < 0

技术创新点

  1. 截止策略的唯一性:通过严格单调性和连续性保证唯一截止点存在
  2. 相对诊断性条件(RD):形式化了失败比成功在高声誉时更具诊断性的直觉
  3. 封闭形式解:后验截止点的显式表达式:
    p̄(ρ;b) = -Δ_f(ρ)/(Δ_s(ρ) + b - Δ_f(ρ))
    
  4. 政策杠杆分离:奖金影响推荐阈值,门控影响实施频率但不改变推荐策略

实验设置

理论验证

作为理论经济学论文,本文主要通过数学证明和理论分析验证结果,而非传统的实证实验。

数值示例

高斯环境

  • 能力类型θ∈{H,L},信号x~N(μ_t(θ), σ²)
  • 参数设置:σ=1, π=1/2, Δ_H=1.2, Δ_L=0.6, W(ρ)=ρ
  • 验证RD条件在声誉ρ∈{0.2,0.5,0.8}处成立

对比基准

  • 无声誉关切的基准模型
  • 线性收益函数情况
  • 不同信息精度参数κ的比较

实验结果

主要理论结果

命题3.1(截止存在性):对于给定(ρ,b),存在唯一阈值p̄(ρ;b)∈(0,1),专家当且仅当p(x)≥p̄(ρ;b)时推荐R。

命题4.2(声誉保守主义):在相对诊断性条件下,实验截止值随声誉单调递增:

ρ₁ ≤ ρ₂ ⟹ p̄(ρ₁;b) ≤ p̄(ρ₂;b)

命题6.1(奖金映射):推荐实验率q(ρ;b) = P(p(x)≥p̄(ρ;b))在b中连续严格递增,存在唯一奖金b*(ρ;q)实现目标率q。

比较静态结果

  1. 信号信息性:更高精度κ降低信号截止c(ρ;b;κ),后验截止p̄(ρ;b)不变
  2. 先验成功概率:更高π降低信号截止,后验截止不变
  3. 职业关切强度:更强ϕ提高截止值(当b>0时),b=0时截止值不变

政策杠杆效果

成功条件奖金

  • 提供实验率的一对一映射
  • 封闭形式的目标实现公式
  • 不影响实施概率

门控机制

  • 不改变推荐阈值
  • 按比例缩放实施实验
  • 减缓声誉学习速度

相关工作

职业关切文献

  • Holmström (1999):职业关切的基础框架
  • Scharfstein and Stein (1990):羊群行为与投资
  • Prendergast and Stole (1996):声誉获取的年龄效应

战略沟通

  • Crawford and Sobel (1982):战略信息传递
  • Morris (2001):政治正确模型
  • Ottaviani and Sørensen (2006):声誉廉价谈话

组织设计

  • Williamson (1996):治理机制
  • Foss (2003):选择性干预与内部混合组织

结论与讨论

主要结论

  1. 机制识别:高声誉专家面临更多可见失败(因为建议更可能被实施),而成功的回报不成比例增加
  2. 政策含义:组织可通过成功奖金调节提案频率,通过门控控制实施风险
  3. 实证预测:随声誉增加,风险推荐频率下降,条件成功率上升

局限性

  1. 静态分析:未完全考虑动态职业关切的长期激励效应
  2. RD条件:相对诊断性假设可能在某些环境中不成立
  3. 单一专家:多专家竞争和相对排名效应未充分探讨
  4. 实施函数:λ(ρ)被视为外生,内生化可能改变结果

未来方向

  1. 动态扩展:多期模型中早期探索vs后期保守的权衡
  2. 内生实施:委托人的最优接受策略
  3. 多专家竞争:相对声誉和差异化激励
  4. 实证检验:建议频率和成功率的跨级别比较

深度评价

优点

  1. 理论贡献:提供了声誉保守主义的简洁、可处理解释
  2. 政策相关性:识别了实用的组织设计工具
  3. 数学严谨性:完整的存在性、唯一性和比较静态证明
  4. 直觉清晰:RD条件和机制解释易于理解
  5. 稳健性:结果不依赖于特定的信号分布假设

不足

  1. 假设限制:RD条件的普遍性需要更多验证
  2. 实证缺失:缺乏真实数据的实证检验
  3. 动态简化:静态模型可能忽略重要的跨期效应
  4. 委托人被动:实施函数外生性限制了分析深度

影响力

  1. 理论影响:为职业关切文献提供新的分析框架
  2. 实用价值:为组织设计提供具体的政策建议
  3. 方法贡献:截止策略分析和政策杠杆设计的方法论价值
  4. 跨学科应用:适用于管理学、组织行为学等领域

适用场景

  1. 咨询行业:高级顾问vs初级顾问的建议模式
  2. 医疗决策:资深医生vs住院医生的治疗选择
  3. 金融投资:基金经理的投资策略选择
  4. 政策制定:不同级别官员的改革倾向
  5. 学术研究:知名学者vs新兴学者的研究方向选择

参考文献

核心理论基础

  • Holmström, B. (1999). Managerial incentive problems: A dynamic perspective. Review of Economic Studies, 66(1), 169-182.
  • Crawford, V. P., & Sobel, J. (1982). Strategic information transmission. Econometrica, 50(6), 1431-1451.

相关模型

  • Morris, S. (2001). Political correctness. Journal of Political Economy, 109(2), 231-265.
  • Ottaviani, M., & Sørensen, P. N. (2006). Professional advice. Journal of Economic Theory, 126(1), 120-142.

组织设计

  • Williamson, O. E. (1996). The Mechanisms of Governance. Oxford University Press.

本论文为理解专家建议中的声誉效应提供了重要的理论框架,其简洁的模型和清晰的政策含义使其在理论经济学和实际应用中都具有重要价值。