一、引言
计量经济学不仅仅包括着经济学的基本理论,也蕴含着数理统计的基本原理,同时运用真实世界的宏观、微观数据进行定量分析的学科。其中,理论计量经济学的主要目的是对数理统计方法和理论的方法。应用计量经济学是以在经济学理论为指导,以真实数据为基础,应用计量方法探索实证经济规律。
计量经济学是以数学为基础(包括概率与求导,这与机器学习的知识储备是一致的)应用于各个领域。在搭好基础的前提下,计量经济学更深的内容才能得以学习。
在计量经济学的教学过程中,如何打好基础,特别是统计学与概率论,一直是困扰教师们的难点,也是学生学好计量经济学的痛点。计量经济学的着重点是推断和预测,这是计量经济学原理的起点,也是计量经济学应用的终点。
对计量经济学的主要目标,在前文已经给出了解释,在此处着重对机器学习和统计学的基础理论。
预测是机器学习的主要目标,即根据数据集预测。正是基于此目的,上文中提到的目标函数可以是任意形式,甚至是计量经济学中极少使用的三次方形式以及神经网络算法,只要达到预测值接近真实值的目的即可。因此,对实际经济问题的可解释性,机器学习显得很无力。同时,与计量经济学不同,机器学习将视为中间过程,对模型的要求仅仅是预测值接近真实值以及预测效果。
在应用过程中,机器学习的目标与统计学、计量经济学一致,均是最小化某个目标函数(objective function)或损失函数(loss function)。计量经济学中最小二乘法的推断、验证过程,可以很好地解释损失函数的应用,篇幅所限本文不再赘述最小二乘法的推导过程。机器学习的目标是希望预测值与输入值尽可能的接近,而真实值又是可获得可观测的值,因此比较预测值与观测值的接近程度即可(考察均方误差等)。
对于统计学和计量经济学而言,尽管也关注最优化或最小化的过程,但只能使用概率论中的渐近理论对参数和进行比较,以证明当样本量趋近于无穷时,估计量会收敛于。
通过简单的比较我们可以发现,机器学习的研究范式是对预测值和真实值做直接比较,统计学和计量经济学主要关注和的渐近过程。但是,尽管机器学习应用了大量统计学的理论和方法,在应用中机器学习却极少关注统计推断,在这个意义上,机器学习反而比统计学或计量经济学简单。
通过一个简单的例子,我们能看到机器学习在应用中的局限。例如,对某旅游城市宾馆入住率和当天价格进行统计后,希望能够预测挂牌价与入住率之间的关系。如果按照相关关系进行预测,会发现当旅游旺季时,入住率和挂牌价呈正相关关系。如果使用机器学习的方法对此进行预测,会有为提升入住率提升挂牌价的结论,这显然与现实不符。
在计量经济学教学的过程中,学生们认为机器学习是更高级更时尚的方法,因此是万能的。但在因果推断领域,机器学习的说服力显然并没有优于计量经济学的方法。在建模的过程中,首先应厘清问题的本质,进而做方法的选择。
参考文献:
1. 王万珺. 财经类高校本科计量经济学教学改革研究[J]. 湖北经济学院学报(人文社会科学版), 2013(01):181-182.
2. 陈强. 高级计量经济学及Stata应用[M]. 高等教育出版社, 2010.
个人简介:韩仁杰,男,汉族,河南许昌,博士,重庆工商大学经济学院讲师,应用经济统计;