当前位置:首页 > 运营 > 正文

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)

更多CFA官方教材详解,请关注“边际实验室”。

“边际实验室”是一家专注于金融科技、金融大数据领域的工作室,同时提供CFA、FRM等金融考试内容的免费讲解。

每当我们估计回归模型时,都必须假定回归具有正确的函数形式。该假设可能会有以下几种错误:

■可以从回归中忽略一个或多个重要变量。

■在估计回归之前,可能需要转换一个或多个回归变量(例如,通过对变量取自然对数)。

■回归模型汇集了来自不同样本中不应该被汇集的数据。

首先,考虑从回归中忽略一个重要的自变量的影响(遗漏变量偏差)。如果真正的回归模型是:

Yi= b0 b1X1i b2X2i εi

但是我们估计的模型是:

Yi= a0 a1X1i εi

那么我们的回归模型将被错误指定。该模型有什么问题?如果省略的变量(X2)与其余变量(X1)相关,则模型中的误差项将与(X1)相关,并且回归系数a0和a1的估计值将有偏差且不一致。另外,这些系数的标准误估计值也将不一致,因此我们既不能使用系数估计值也不能使用估计的标准误差来进行统计检验。 案例遗漏变量偏差和买卖价差

在本例中,我们扩展了对买卖价差的研究,以显示从回归中省略重要变量的影响。在此前的案例中,我们证明了[(买卖价差)/价格]的自然对数与做市商数量的自然对数和公司市值的自然对数存在显著相关。

下表显示了结果:

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第1张

请注意,ln(纳斯达克做市商数量)的系数从原始回归(正确结果)的-1.5186变为错误的-3.1027。同样,截距从原始回归中的1.5949变为5.0707。这些结果说明,遗漏回归中应包含的自变量会导致其余回归系数的不一致。

回归模型发生错误指定的第二个常见原因是,对于需要转换的数据,在回归中没有进行转换,或使用了错误的数据形式。例如,有时分析人员无法判断因变量和自变量之间的非线性关系,进而指定了变量之间的线性关系。在指定回归模型时,应考虑经济理论是否暗示了非线性关系。我们通常可以通过绘制数据图表来确认非线性关系,如下面的案例所示。如果当一个或多个变量的比例变化表现出线性关系时,我们可以通过取自然对数来对错误指定进行纠正。在其他时候,分析师更倾向于使用无单位的数据进行回归分析(例如将净收入或现金流量除以销售额)。在此前的案例中,我们用股票价格对买卖差价进行了除法计算,因为对于投资者而言,买卖差价在交易成本方面的意义取决于股票价格;如果我们没有调整买卖差价,那么回归模型就会发生错误指定。

案例 非线性与买卖价差

在此前的案例中,我们的结果表明[(买入-卖出价差)/价格]的自然对数与做市商数量的自然对数和公司市值的自然对数均显著相关。但是,为什么我们在回归中使用的是变量的自然对数呢?

关于[(买入-卖出点差)/价格]及其决定因素(自变量)之间的关系的性质,有什么理论基础吗?Stoll(1978)建立了市场中买卖差价百分比决定因素的理论模型。他的模型如下:

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第2张

其中,c是常数。在初始变量中,买卖差价百分比与做市商数量与市值的关系不是线性的。但是,如果对上述模型等式两边取自然对数,转换后的变量是线性的(对数-对数回归):

Yi= b0 b1X1i b2X2i εi

其中

Yi= 股票i(买入-卖出价差)/价格的自然对数

b0= 常数,ln(c)

X1i= 股票i的做市商数量的自然对数

X2i= 公司i市值的自然对数

εi= 残差

如此前案例所述,对数-对数模型的斜率系数被解释为弹性,准确地说,因变量相对于自变量存在部分弹性(“部分”是指保持其他自变量不变)。

我们可以绘制数据以评估对数转换后变量是否线性相关。例如,下图展示了一个股票的做市商数量自然对数的散点图(X轴)、(买卖价差)/价格的自然对数(Y轴)及回归线。这两个经过转换后的变量之间的关系显然是线性的。

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第3张线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第4张

1、假设对于在纳斯达克上市的特定股票,做市商的数量为50,市值为60亿美元。根据上述模型,该股票的预期买卖差价与价格的比率是多少?

做市商数量的自然对数等于ln50 = 3.9120,股票市值(百万美元)的自然对数等于ln6000 = 8.6995。

在这种情况下,预期买卖差价与价格的比率为0.0674 (-0.0142×3.9120) (-0.0016×8.6995)=-0.0021。因此,该模型预测买卖价差与股票价格之比为-0.0021。

2、上述股票的预期买卖价差是否有意义?如果没有,如何避免这个问题?

预测的买卖差价为负,这在经济上没有意义。

通过使用[(买卖价差)/价格]的对数作为因变量,可以避免此问题。

通常,分析师在比较公司之间的数据之前必须决定是否对变量进行加工。例如,在财务报表分析中,分析师通常会使用百分比财务报表。在百分比利润表中,所有金额都除以了公司的收入。

百分比财务报表使公司之间的可比性更加容易。对于想要使用回归分析来比较一组公司业绩的分析师来说,可能会出现可比性问题。如以下案例所示。

案例 经营现金流和自由现金流之间的关系

假设有一位分析师想解释美国11家服装公司2001年自由现金流与经营现金流量的关系。

为了调查此问题,分析师可能在线性回归中将自由现金流作为因变量,将经营现金流作为自变量。下图显示了回归的结果。请注意,经营活动现金流的斜率系数的t统计量非常高(6.5288),回归的F统计量的显著性水平很低(0.0001),R方值非常高。我们可能会倾向于认为这种回归是准确的。如果经营活动现金流增加1.00美元,我们可以有把握地预测公司的自由现金流量将增加0.3579美元。

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第5张线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第6张

但是这个估计是正确吗?该回归没有考虑样本中公司之间的规模差异。

我们可以通过使用常见的现金流百分比结果来解决规模差异。在使用回归分析之前,我们将经营活动现金流和公司的自由现金流除以公司的销售额。我们将(自由现金流/销售额)作为因变量,并使用(经营活动现金流/销售额)作为自变量。下图显示了回归结果。请注意,(经营活动现金流/销售额)斜率系数的t统计量为1.6262,在0.05水平上不显著。另外,F统计量的显著性水平为0.1383,因此我们不能在0.05水平上拒绝“回归不能解释服装公司(自由现金流/销售额)的差异”该假设。

最后,我们也应该注意到,此回归中的R方比以前的回归低得多。

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第7张

在X和Y的每个数据集中,两个变量之间的相关性几乎为0。由于组合样本中两个数据集的X和Y的均值不同,所以X和Y高度相关。然而,这种相关性是假的,因为它反映了X和Y在两个不同时期的关系的差异。

本文由边际实验室自媒体原创,如需转载请务必注明出处!

线性回归模型的标准差(CFA教材详解数量分析线性回归模型的规范及常见错误)  第8张
取消
扫码支持 支付码