从shift-share工具变量的零散应用到系统化方法论,计量学领域对因果识别的探索始终围绕解决内生性这一核心命题。由 Kirill Borusyak、Peter Hull 和 Xavier Jaravel 于2025年发表在 Journal of Economic Perspectives 的论文,首次系统梳理了该工具变量的两类核心识别路径,为实证研究提供了从理论到操作的完整框架。
一、论文核心定位:填补方法论空白
Shift-share工具变量早已被广泛应用——约1/8的 NBER 工作论文明确采用该类工具。但长期以来,其识别假设模糊、稳健性检验缺乏统一标准的问题,导致研究结果可信度参差不齐。
论文的核心贡献在于,将看似零散的应用经验提炼为两类可操作的识别路径,明确了每种路径的假设条件、公式约束、估计方法和稳健性步骤(Borusyak et al., 2025)。其核心公式与变量定义贯穿两类路径,成为统一的分析基础:
工具变量构造公式: \(z_{\mathrm{i}} = \sum_{k=1}^K s_{\mathrm{ik}} \cdot g_{\mathrm{k}}\)
\(z_{\mathrm{i}}\) :第i个单位(如区域、城市)的shift-share工具变量;
\(s_{\mathrm{ik}}\) :第i个单位在第k个维度(如行业、国家)的暴露份额,通常取自前期数据(如初始份额);
\(g_{\mathrm{k}}\) :第k个维度的共同冲击,对所有分析单位一致(如行业补贴、国家增长);
\(K\) :冲击维度数量(如行业总数、国家数量)。
目标结果方程(解决内生性的核心方程): \(y_{\mathrm{i}} = \beta x_{\mathrm{i}} + \gamma' w_{\mathrm{i}} + \varepsilon_{\mathrm{i}}\)
\(y_{\mathrm{i}}\) :结果变量(如增长率);
\(x_{\mathrm{i}}\) :内生处理变量(如经济暴露度、人口占比);
\(w_{\mathrm{i}}\) :控制变量向量;
\(\varepsilon_{\mathrm{i}}\) :误差项,包含未观测混淆因素。
二、两类识别路径:假设、约束与推断
论文的核心创新的是提出两类相互独立的识别路径,研究者可根据数据特征和研究场景选择适配方案。
(一)多外生shifts路径
该路径的核心逻辑是借助大量外生共同冲击,抵消暴露份额的潜在内生性。其关键特征包括:
识别假设:仅要求共同冲击 \(g_{\mathrm{k}}\) 外生(即 \(\text{cov}(g_{\mathrm{k}}, \sum_{\mathrm{i}} s_{\mathrm{ik}} \varepsilon_{\mathrm{i}}) = 0\) ),暴露份额 \(s_{\mathrm{ik}}\) 可内生;
核心约束:需要足够多的 \(g_{\mathrm{k}}\) (满足大数定律,避免少数冲击主导结果), \(s_{\mathrm{ik}}\) 宜加总为1,若不满足(即“不完全份额”),需在回归中控制 \(S_{\mathrm{i}} = \sum_{k} s_{\mathrm{ik}}\) ;
统计推断:需采用暴露稳健标准误,通过shift-level两阶段最小二乘法(2SLS)实现,规避单位间因份额相似导致的误差项相关问题。
结语
该论文的发表标志着shift-share工具变量从经验性应用进入体系化规范阶段。对于实证研究者而言,其价值体现在三方面:
明确识别假设的表述方式,避免以往笼统声称工具外生的模糊性;
提供针对性的稳健性检验方案,减少结果的偶然性;
结合具体案例展示路径选择逻辑,降低方法应用门槛。
正如论文强调,两类路径并非相互排斥,而是根据研究场景的适配选择——若能找到随机化的共同冲击(如政策实验),优先选择多外生shifts路径;若暴露份额具有明确的外生来源(如历史形成的行业结构),外生shares路径更为高效(Borusyak et al., 2025)。
参考文献
Borusyak, K., Hull, P., & Jaravel, X. (2025). A practical guide to shift-share instruments. Journal of Economic Perspectives, 39(1), 181-204. https://doi.org/10.1257/jep.20231370