近日,我系预聘副教授王法独立作者论文Maximum likelihood estimation and inference for high dimensional generalized factor models with application to factor-augmented regressions发表于计量经济学领域顶级期刊Journal of Econometrics。
论文简介
高维因子模型在资产定价,宏观经济预测,风险管理等领域有广泛的应用,是处理大数据最流行的方法之一。目前,理论和实证研究中用到的因子模型几乎都是线性因子模型,非线性因子模型的研究极少。本文中非线性因子模型指的是应变量与作为自变量的不可观测因子的关系是非线性的,典型例子是LOGIT、PROBIT、TOBIT和POISSON,即应变量是0/1二元数据,或删失数据(censored),或正整数。线性因子模型中我们用主成分来提取因子,但非线性模型中该方法不再适用。目前的文献中没有严谨的估计方法从受限应变量中提取因子,相应的分布理论也不清楚。
非线性因子模型有广阔的应用前景。在用因子模型进行宏观经济预测时,非线性因子模型允许我们从受限应变量数据中提取因子。在风险管理问题中,公司违约数据是二元变量,非线性因子模型允许我们从很多个公司的违约数据中提取影响这些公司违约行为的公共因子,相关研究见Creal Schwaab Koopman Lucas (2014)。在发展经济学研究中,家庭调查问卷中很多问题的回答是二元数据或删失数据或离散数据,把家庭财产看成是影响这些回答的潜在因子,非线性因子模型允许我们从家庭调查问卷中估算家庭财产,相关研究见Filmer Pritchett (2001)。
本文提出用极大似然估计来从受限应变量中提取因子,并证明了估计的因子线性空间的收敛速度、估计因子的渐进正态分布和估计因子负载的渐进正态分布。这些性质为非线性因子模型提供了基础理论,也可以帮助证明由于使用估计因子而不是真实因子给宏观预测等后续研究所带来的误差的置信区间。本文的难点在于高维因子模型中的参数个数随着样本量和模型维度的增加趋向于无穷,即我们要处理参数个数趋于无穷情况下的极大似然估计。本文的创新点在于因子模型的特殊结构可以帮助我们解决这个困难。
论文引用
Maximum likelihood estimation and inference for high dimensional generalized factor models with application to factor-augmented regressions, Journal of Econometrics, forthcoming, 2021
作者简介
8797威尼斯老品牌金融学系预聘副教授、博士生导师,研究领域为金融计量,面板数据,资产定价。多篇研究成果发表于 Journal of Econometrics 和 Econometric Reviews 等国际一流期刊,并多次担任 Journal of Econometrics 和 Journal of Business & Economic Statistics 等一流期刊的审稿人。2020年加入8797威尼斯老品牌,曾任教于伦敦大学卡斯商学院和上海财经大学。