一、引言
对金融市场的预测一直是国内外学者所关注的焦点。由金融学、心理学和行为学等结合派生的行为金融学认为股票价格并非仅取决于企业内在价值,很大程度上受投资者心理和行为的影响。行为金融学的不断发展表明,市场中的众多投资者并非完全的理性人。在投资决策过程中,由于情感喜好和认知偏差等因素,投资者往往无法做出正确合理的判断。换言之,投资者情绪在一定程度上反映了投资者行为并影响最终的投资决策。相比已有的文献,本文可能的贡献主要体现在:梳理了投资者和管理者情绪对金融市场波动的影响,有利于个体理性投资者和监管部门识别不同情绪特征下金融市场变动的行为,丰富了投资者情绪和管理者情绪经济后果的研究文献。情感分类标准是进行情感判别的依据,不同学者提出的分类各有差异。总体而言,现有的分类体系大致上都将情感分成了正面、中性和负面三大类。判断依据是,如果着重于被引文献的优点,则标记为正面;如果指出被引文献的缺点或不足,则标记为负面;如果是描述性的,则标记为中性。从数量上来看,中性情感的占到了大多数,正面情感的次之,负面情感的最少。为了解决由此产生的数据集不平衡的问题,学者们不断进行方法改进,如通过重复操作增加训练集中负面数量或随机减去正面,增大负训练集和正训练集,对引文情感标注训练集里面样本数量较少的类别进行过采样,并通过合成新的样本来缓解引文情 感训练集数据的不平衡问题等。
二、文献综述
国内外学者尝试通过从投资者的角度来解释市场行为。为验证投资者情绪的有效性,Gao和Martin(2021)[1]提出了一个基于利率、指数期权价格和市场估值比率的情绪指标,该情绪指标是作为一个理性投资者具有至少为1的相对风险厌恶度和乐于将全部财富投资于股票市场所理解的预期股息增长的下限。情绪指标衡量的是“泡沫预期”而不是“信心”。估值比率、利率和波动性是内在一致的。这种方法一个新特点是,使用一些理论来推动对波动率和估值比率的定义,并使这种联系量化。以保守的方式做出这些选择,希望该指标在实践中对谨慎的决策者有用。但是这种情绪指标的判断需要借助政策制定者的良好判断且没有解决如何识别给定水平的预期股息增长是否合理这一难题。Chen和Han(2021)[2]探讨了对冲基金如何暴露出情绪波动(即情绪贝塔)与基金业绩相关。一方面,投资者情绪不可预测的波动可能会阻止套利活动。另一方面,熟练的套利者可能能够预测并利用投资者情绪的变化。对冲基金的不同情绪交易策略会导致其情绪敞口的横截面差异。投资者情绪变化有较大积极敞口的对冲基金明显优于其他基金。在风险调整的基础上,按情绪贝塔排名的对冲基金的前10%和后10%之间的回报率差距高达每月0.59%,基于此,可能有两种原因:第一种是基于风险的解释,认为高情绪贝塔对冲基金的优异表现来自于它们持有的高情绪贝塔股票的情绪风险溢价。第二种解释是基于技能的,认为管理技能会推动业绩跑赢大盘。在技术熟练的对冲基金中,情绪波动和基金回报率之间的关系要好得多。因此,尽管情绪波动可以阻止套利活动,但一些熟练的套利者能够从这种通过预测情绪的变化波中获利。获得有关对冲基金持仓的更详细信息后,进一步推进我们对情绪交易者和套利者之间互动的理解将是富有成效的。基于此,可以进一步研究金融市场中全市场情绪风险的定价。DeVault. et.al(2019) [3]提出当情绪增加时,机构总体上从个人投资者那里买入波动的股票,并向个人投资者出售安全的股票。这些结果与个人投资者的情绪引发的需求冲击推动价格脱离基本价值的假说不一致。如果这些指标能捕捉到情绪,并且发现有关情绪的文献中记录的横截面回报模式是由情绪诱发的需求冲击造成的,那么机构,而不是个人投资者,是情绪交易者。即情绪指标捕捉了个人投资者的非理性需求冲击,与投资者情绪假说的传统解释进一步不一致的是,专注于机构客户的经理人比专注于零售客户的经理人对机构情绪交易总量的贡献按比例更高。对冲基金表现出更大的倾向于被归类为短暂性机构。然而,由于对冲基金只占样本中机构的16%,大多数短暂性机构并不是对冲基金。即之前记录的机构交易风格对情绪指标和机构投资者的需求之间的关系有所贡献。个人投资者仍可能在机构情绪交易中发挥间接作用,尽管经理人的决定发挥了主导作用。所以个人投资者、机构和情绪指标之间的关系值得进一步研究。Jiang et. al(2019)[4]发现,在管理者情绪高涨之后,管理者消极地预测了未来市场回报较低的股票回报。管理者情绪的预测能力远远大于常用的宏观经济变量,并且优于现有的投资者情绪指标。同时发现在预测股票收益时,管理者情绪与投资者情绪是互补的,这意味着相对于投资者情绪,管理者情绪对估值有着本质上不同的影响。此外,更高的管理者情绪先于更低的总收益惊喜和更大的总投资增长,这意味着经理对未来现金流和过度投资的偏见有助于解释管理者情绪的可预测性。管理者情绪也强烈预测股票收益的横截面,特别是对于难以估价或套利成本高的股票。但经理情绪指数(包含现有情绪指标的补充信息)也可能在会计和金融领域产生许多未来应用。Hirshleifer et.al(2020)[5]预测投资者情绪的季节性变化是总体和横截面回报季节性的部分原因。与基于情绪的理论一致,记录了工作日和市场状态的各种强烈、新颖的横截面情绪重现和逆转效应。在投资者情绪乐观的过去时期表现优异的资产往往会在预期情绪乐观的未来季节表现优异,而在预期情绪悲观的未来时期表现不佳。理论和实证结果还强调了情绪贝塔的作用,情绪贝塔衡量证券对全因素错误定价的情绪敏感性,并在情绪高涨的季节进行估计,以整合各种情绪复发和逆转效应,以及在主要假期预期、夏令时变化和天气条件引起的情绪状态下的横截面回报。总的来说,高情绪贝塔股票在未来高情绪状态下表现优于低情绪贝塔股票,在未来低情绪状态下表现不佳,其预测能力对市场贝塔、情绪贝塔和一系列公司特征是递增的。投资者情绪的季节性变化,导致因素错误定价的相应季节性变化,投资者情绪在总体和横截面上都是股票回报季节性的重要因素。Dicks和Fulghieri(2021)[6]研究发现不确定性厌恶产生内生的投资者信念(或情绪),导致创新浪潮。由于不确定性对冲,投资者将不同的不确定性投资视为互补,在创业行为中产生战略互补,从而导致创新浪潮。他们研究的模型可以解释为什么在一些时期,创新投资是“热门”的,投资者更愿意投资于受重大不确定性污染的风险投资项目。首先,在企业家是风险和不确定性中性的简化假设下开发模型。创业不确定性风险规避可以引入到分析中,代价是增加额外的复杂性,但不会改变结果的性质。其次,企业家的不确定性厌恶不变,因为企业家独特地暴露于他们的不确定性拥有自己的公司。这意味着企业家会使用他们的“最坏情况”方案为了评估创新第一阶段的成功概率,结果不变。相比之下,厌恶风险的企业家会担心他们在创新中面临的风险,他们将再次需要一个启动创新过程的风险溢价。有趣的是,风险厌恶企业家的风险放大了投资者不确定性厌恶的影响。风险厌恶企业家还会担心,其他企业家是成功的,因为在投资者厌恶不确定性的情况下,其他企业家的存在将会在中期影响他们公司的市场价值。主要结果只依赖于不确定性对冲的好处,这是不确定性厌恶。通过在投资组合中持有不明确的资产,不确定性套期保值为厌恶不确定性的投资者提供了类似于标准投资组合理论中风险分散的好处。
Soo(2018)[7]认为虽然对“动物精神”在房地产危机中的作用有很多讨论和兴趣,但由于缺乏对房地产市场的情绪测量,对这一假设的实证检验有限。任何对期望的衡量自然都很难建立,而且实施调查措施的费用很高,因此在地理范围和频率上受到限制。然而,住房市场是由当地因素驱动的,要理解为什么在上一个住房周期中,一些市场经历了巨大的价格波动,而另一些市场没有,就需要有横截面变化的变量。基于此,他通过量化当地住房新闻的基调,首次对34个主要大都市市场的当地住房情绪进行了实时测量。具体来说,收集了当地房市报纸文章中正面和负面词汇的比例。发现,对媒体住房情绪的衡量模式似乎会导致房价的变动。在房价大起大落的城市,发现媒体情绪大约在2004年达到顶峰,而房价在2006年达到顶峰。这种领先模式也反映在密歇根消费者调查(全国)的住房信心指数中,该指数达到峰值略高于2004年的综合指数。对媒体情绪的衡量标准的变化对未来房价的增长有很大的预测力。媒体住房情绪指数解释了房价变化中的大量变化,这些变化超出了一组观察到的经济因素,这些因素已被证明可以预测历史上的房价。这些传统因素似乎可以解释房价上涨更稳定的城市的更多差异,而媒体情绪则可以解释房价大幅波动的城市的更多差异。这种效应在纳入额外控制或次级贷款以及宽松信贷的情况下依然强劲。媒体情绪指数本身的结构反映了一个向后看的结构,与行为金融理论中提出的推断性预期一致。这些结果与住房媒体对信心指数的两种解释是一致的。住房媒体指数可以代表房地产市场的投资者情绪,也可以代表推动房价的难以衡量的基本面因素。值得注意的是,无论如何解释,住房媒体情绪指数提供了一个有用的方法来衡量住房市场不可观察的因素。尽管如此,媒体信心指数对房价的影响似乎并不是由讨论房地产基本面的新闻报道所驱动的。少数购房者较多、投机性较强的市场以及低价住宅市场中,媒体情绪对房价的影响也较大。随着越来越多的次级贷款获得批准并被取出,这种预测效应也会被放大。这些结果支持了对房地产市场的情绪解读,但不太符合对媒体指数的信息解读。相反,一篇充满信息的报道必须解释,为什么某些未被观察到的基本面因素,会在购房者更容易受到市场情绪影响的市场中产生更大的影响。市场情绪和次级贷款的放大效应,为先前的研究为何无法解释房价随少数族裔买家比例变化的幅度,或者仅仅是宽松信贷的扩张,提供了一个潜在的解释。最近一轮房地产周期的原因很可能不能用一个单一因素来概括,预期和基本面可能有更复杂的关系;例如,在这种情况下,一部分购房者可能对较低利率或信贷供应增加的积极冲击有系统地反应过度。这些结果强烈表明,情绪应被认真对待作为一个潜在的决定因素,房价和值得更多的关注,在未来的研究和政策关注。具体而言,未来的工作可能需要更好地理解是哪些具体因素驱动了市场情绪,媒体是否在延续财务错误中发挥了作用,以及当前的财务教育和扫盲政策是否能够改善这些因素。Davies(2021)[8]使用了一个新的市场环境:杠杆ETF一级市场,为投资者的情绪提供了一个直接而清晰的衡量标准。观察到的套利交易代表了导致初始错误定价的全市场潜在需求冲击。标普500指数的信心指数(SSI)代表的是非基本需求,是市场回报的有力预测指标。鉴于强有力的经验证据和经济动机,SSI很可能将成为未来资产定价和企业信心的重要指标金融研究。Jha等(2021)[9]基于文本的大众对金融情绪的衡量标准来研究金融情绪如何应对罕见的历史灾难和持续的COVID-19大流行。金融情绪在流行病和地震后下降,但在严重干旱,洪水和山体滑坡之后上升。这些异质效应表明,金融情绪对被保险风险和无保险风险的实现的反应不同。金融情绪在COVID-19大流行开始时有所下降,但在经历了高股市回报并以大量财政支出作为回应的国家,金融情绪有所恢复。金融情绪似乎取决于私人市场和公共财政提供的保险。Chen等(2021)[10]利用互联网搜索量捕捉彩票情绪变化,发现当整体赌博情绪强劲时,投资者对彩票股票的需求增加,这些股票获得积极的短期异常回报,经理人更有可能拆分股票以迎合对低价彩票股票的需求增加,而首次公开募股(IPO)获得更高的首日回报。此外,低机构所有权公司的情绪回报关系更强,这些公司总部位于赌博更容易接受和地方偏见更强的地区。这些结果表明,赌博情绪对股市有溢出效应。
Mahmoudi等(2022)[11]投资者行为的行为模型表明,情绪会影响投资者对公司公告的反应。由于信念可能是横截面的异质性,因此公司特定的投资者情绪可能与投资者情绪的总体水平不同,提供了关于公司和市场层面投资者情绪对公司公告回报的解释力的经验证据。公司层面的投资者情绪对企业公告回报、营业额和长期逆转具有超越市场层面投资者情绪的边际解释力。之前的研究侧重于市场层面的投资者情绪指标,可能低估了情绪在企业公告回报中发挥的作用的经济规模。
三、结论
和经典的数据分析方法相比,文本大数据给经济学和金融学的实证研究至少带来了四个变化。第一,经典实证分析采用的数据往往已经是结构化数据,而文本大数据往往是非结构化数据。非结构化数据向结构化数据转换的实现方式并不是一个简单的问题,而不同转换方式会直接影响后续分析结果,因此可以预见的是,高质量的文本大数据分析,需要对这一转换过程做更为详细的介绍。第二,经典实证分析数据中的变量定义往往比较清晰,这种清晰的边界往往是通过在收集数据时设计的问卷已经准确定义了变量的含义来实现的,又或者是根据实际经济和金融活动运行的需要来事先界定好的。而本大数据的数据来源是新闻媒体、网络论坛、公司财报等文本文件,本身并不包含清晰的变量,如何提取信息,并且如何论证作者提取的就是目标信息,也将是文本大数据分析的重要步骤。第三,经典实证方法往往采用获取的全样本数据做回归分析,然后通过不同的设定和变化做稳健性检验。将数据分为训练集、验证集和测试集,展开交叉验证的方法虽然早就是经典方法,在过去的经济和金融实证分析中的应用还不够充分。由于这些方法在文本大数据做预测的分析范式中较为常见,这些做法对于经济和金融实证研究范式也会产生一定影响。第四,使用文本大数据需要有跨学科领域的人才。模型在经济和金融领域的运用,需要研究人员不仅对经济和金融领域有较为深入的掌握,同时对不同算法的特点和优劣都要有较为丰富的知识。
作者简介:石若磐(1997—),男,汉族,河南卫辉市人,硕士在读,研究方向:公司金融,单位:广西大学经济学院。