1 min read

因果推断:Shift-Share 工具变量

从shift-share工具变量的零散应用到系统化方法论,计量学领域对因果识别的探索始终围绕解决内生性这一核心命题。由 Kirill Borusyak、Peter Hull 和 Xavier Jaravel 于2025年发表在 Journal of Economic Perspectives 的论文,首次系统梳理了该工具变量的两类核心识别路径,为实证研究提供了从理论到操作的完整框架。

一、论文核心定位:填补方法论空白

Shift-share工具变量早已被广泛应用——约1/8的 NBER 工作论文明确采用该类工具。但长期以来,其识别假设模糊、稳健性检验缺乏统一标准的问题,导致研究结果可信度参差不齐。

论文的核心贡献在于,将看似零散的应用经验提炼为两类可操作的识别路径,明确了每种路径的假设条件、公式约束、估计方法和稳健性步骤(Borusyak et al., 2025)。其核心公式与变量定义贯穿两类路径,成为统一的分析基础:

工具变量构造公式: \(z_{\mathrm{i}} = \sum_{k=1}^K s_{\mathrm{ik}} \cdot g_{\mathrm{k}}\)

  • \(z_{\mathrm{i}}\) :第i个单位(如区域、城市)的shift-share工具变量;

  • \(s_{\mathrm{ik}}\) :第i个单位在第k个维度(如行业、国家)的暴露份额,通常取自前期数据(如初始份额);

  • \(g_{\mathrm{k}}\) :第k个维度的共同冲击,对所有分析单位一致(如行业补贴、国家增长);

  • \(K\) :冲击维度数量(如行业总数、国家数量)。

目标结果方程(解决内生性的核心方程): \(y_{\mathrm{i}} = \beta x_{\mathrm{i}} + \gamma' w_{\mathrm{i}} + \varepsilon_{\mathrm{i}}\)

  • \(y_{\mathrm{i}}\) :结果变量(如增长率);

  • \(x_{\mathrm{i}}\) :内生处理变量(如经济暴露度、人口占比);

  • \(w_{\mathrm{i}}\) :控制变量向量;

  • \(\varepsilon_{\mathrm{i}}\) :误差项,包含未观测混淆因素。

二、两类识别路径:假设、约束与推断

论文的核心创新的是提出两类相互独立的识别路径,研究者可根据数据特征和研究场景选择适配方案。

(一)多外生shifts路径

该路径的核心逻辑是借助大量外生共同冲击,抵消暴露份额的潜在内生性。其关键特征包括:

  • 识别假设:仅要求共同冲击 \(g_{\mathrm{k}}\) 外生(即 \(\text{cov}(g_{\mathrm{k}}, \sum_{\mathrm{i}} s_{\mathrm{ik}} \varepsilon_{\mathrm{i}}) = 0\) ),暴露份额 \(s_{\mathrm{ik}}\) 可内生;

  • 核心约束:需要足够多的 \(g_{\mathrm{k}}\) (满足大数定律,避免少数冲击主导结果), \(s_{\mathrm{ik}}\) 宜加总为1,若不满足(即“不完全份额”),需在回归中控制 \(S_{\mathrm{i}} = \sum_{k} s_{\mathrm{ik}}\)

  • 统计推断:需采用暴露稳健标准误,通过shift-level两阶段最小二乘法(2SLS)实现,规避单位间因份额相似导致的误差项相关问题。

(二)外生shares路径

该路径的核心逻辑是依托外生的暴露份额,将工具变量转化为多双重差分设计的集合。其关键特征包括:

  • 识别假设:仅要求暴露份额 \(s_{\mathrm{ik}}\) 外生(即 \(\text{cov}(s_{\mathrm{ik}}, \varepsilon_{\mathrm{i}}) = 0\) ,满足平行趋势假设),共同冲击 \(g_{\mathrm{k}}\) 无需外生;

  • 核心约束:无需大量 \(g_{\mathrm{k}}\) ,可通过Rotemberg权重 \(\omega_{\mathrm{k}}\) 识别对估计结果贡献最大的关键份额;

  • 统计推断:采用常规聚类稳健标准误,需通过Sargan-Hansen过度识别检验,验证多份额工具的一致性。

结语

该论文的发表标志着shift-share工具变量从经验性应用进入体系化规范阶段。对于实证研究者而言,其价值体现在三方面:

  1. 明确识别假设的表述方式,避免以往笼统声称工具外生的模糊性;

  2. 提供针对性的稳健性检验方案,减少结果的偶然性;

  3. 结合具体案例展示路径选择逻辑,降低方法应用门槛。

正如论文强调,两类路径并非相互排斥,而是根据研究场景的适配选择——若能找到随机化的共同冲击(如政策实验),优先选择多外生shifts路径;若暴露份额具有明确的外生来源(如历史形成的行业结构),外生shares路径更为高效(Borusyak et al., 2025)。

参考文献

Borusyak, K., Hull, P., & Jaravel, X. (2025). A practical guide to shift-share instruments. Journal of Economic Perspectives, 39(1), 181-204. https://doi.org/10.1257/jep.20231370