快生活 - 生活常识大全

引入互联网搜索量的网络借贷成交额预测研究


  彭若弘+宋佳
  【摘 要】隨着近几年互联网金融的快速发展,具有操作便捷、收益率高等优点的P2P网络借贷成为投融资关注的重点。伴随着众多优点,P2P网络借贷也因其存在的风险和监管问题让投融资者望而却步。本研究引入百度指数,通过建立不含P2P网络搜索量和含P2P网络搜索量的ARIMA对比模型预测P2P网络借贷的交易规模。对比研究发现,包含P2P关键词搜索量数据的预测模型比不包含P2P关键词搜索量数据的预测模型预测结果更好,该变量的引入有利于提高模型的预测准确度。
  【关键词】互联网搜索量;百度指数;P2P网络借贷交易额;ARIMA模型
  一、引言
  国外网络借贷平台模式引入中国以来,让很多敢于尝试互联网投资的投资者认识了P2P网络借贷模式。P2P网络借贷作为互联网金融的重要组成部分,发展迅速。但由于我国P2P发展的年限较短,监管和制度法规还在逐步完善,仍存在很多风险和隐患,使得部分用户因为看不到其未来的发展,所以面对操作简单,收益可观的P2P网络借贷望而却步。许多学者研究发现互联网搜索量与实际的市场需求之间具有显著的相关关系,并且在预测模型中引入互联网搜索量有助于提高预测模型的精度。为帮助用户合理预估借贷风险与P2P网络借贷市场的发展趋势,本文引入百度指数,通过预测P2P网络交易规模给用户提供决策参考。
  二、研究理论与模型建立
  随着谷歌公司谷歌趋势和百度公司百度指数的推出,对于某一关键字的互联网搜索量数据不再难于获取,两类产品的推出为互联网环境下预测模型研究的发展奠定了基础。
  Yan Carrière-Swallow ,Felipe Labbé(2010)[1]在智利运用谷歌指数构建一个谷歌汽车趋势指数,以普通自回归移动平均模型为基准,建立了加入谷歌汽车指数的对比模型,通过对模型的研究得出ARMA3b(2,2)模型最优,带有Google参数的拟合度更好。
  在宏观经济预测方面,Simeon Vosen ,Torsten Schmidt(2011)[2]在预测私人消费时引入了互联网搜索变量谷歌指数。学者以自回归模型为基准模型,以加入了谷歌指数的模型作为对比模型,比较两类模型的拟合优度。通过对比两类模型,发现在0.01置信水平下,加入谷歌指数的模型较基本模型拟合优度(R2)提高了0.03。
  (一)不含互联网搜索量的预测模型建立
  本文选取的数据是以月为跨度的P2P网络借贷成交额数据,也称P2P网络借贷成交额的时间序列数据。所谓时间序列就是按照时间的顺序记录的一系列有序数据,通过对时间序列进行观察、研究,寻找其变化发展的规律,预测未来走势[3]。在时间序列的预测中,对于存在波动的时间序列的预测方法有自回归模型,移动平均模型和自回归移动平均模型等。以自回归模型为例,本文构建的基本模型如下:
  其中:
  y为产品或服务的市场需求量;
  t为时间;
  表示随机变量;
  (二)引入互联网搜索量的预测模型建立
  时间序列除了在模型上扩展外,在模型的变量上也有所拓展。在一些研究中,学者们在基本模型中引入外生变量,通过探讨变量之间的相关性,提高预测的准确度。谢蒙萌(2013)[4]在研究多元线性回归模型在ETC客户发展的预测中,引入了本地区ETC网点数量、本地区高速公路入口流量、本地区GDP和本地区机动车新增车辆数等解释变量,研究结果发现结合引入变量能够更好的实现预测效果。随着互联网的不断发展,互联网中蕴含的信息越来越得到学者们的重视。在2006年,谷歌公司推出谷歌趋势后,一些学者的注意力开始转向了互联网搜索量,分析互联网中某个关键词的搜索量与现实社会行为之间的关系。研究发现互联网中用户的相关关键词搜索量数据与客流量、股票价格等存在显著的相关关系[5]。
  基于以上学者的研究成果,本文将探索互联网搜索量与P2P网贷成交额之间的关系,并在预测模型(1)式中引入互联网搜索量,比较其与基本模型的预测效果,建立对比模型如下:
  其中:
  y为产品或服务的市场需求量;
  t为时间;
  s为该产品或服务的搜索量数据;
  表示随机变量;
  三、实证研究
  (一)样本数据
  1.P2P网贷成交额
  (二)P2P网贷成交额数据分析
  根据图1的散点图,可以发现P2P的百度搜索量越高,其实际网贷成交额越大,说明二者之间相关性较强,所以本文我们选用百度指数来预测P2P网贷成交规模。
  1.平稳性分析
  根据图1的散点图可以看出,P2P网贷成交额没有稳定的均值和方差,大体呈现上升趋势,说明该时间序列不具有平稳性,需要对其进行差分变换。
  2.自相关与偏自相关分析
  运用SPSS对P2P网络借贷成交额进行一阶差分自相关和偏自相关分析后可发现,自相关系数和偏自相关系数的值都比较小,没有超过±0.5的置信上限和置信下限,说明一节差分后的数据具有平稳性,可以在此基础上建立预测模型。
  (三)时间序列预测模型分析
  1.不含互联网搜索量的预测模型拟合
  根据拟合结果表2可以看出,R方的值为0.722,说明ARIMA(1,1,0)模型用于预测P2P网贷成交额的拟合结果较好,可以解释实际数据的72.2%。预测模型的均方根误差RMSE为128.570,说明该模型的观测值和真值之间有一定偏差,模型拟合的准确度有待提升。
  根据表3中的参数可以得出不含互联网搜索量的预测模型如下:
  根据P2P网贷成交额数据预测得出的拟合曲线如下:
  2.引入互联网搜索量的预测模型拟合
  从拟合结果表4可以看出,加入互联网搜索量的P2P网贷预测模型R方值为0.794,高出不含互联网搜索量的R方值0.722,说明加入互联网搜索量的预测模型比不加互联网搜索量的预测模型的拟合效果更好,解释度更优。MAPE为5.333,说明原始数据中的误差占比低,从误差角度说明P2P预测模型拟合效果较好。
  预测模型的均方根误差RMSE为100.661,说明该模型的观测值和真值之间有一定偏差,分析原因是2015年7月出台的《关于促进互联网金融健康发展的指导意见》,由此才将P2P的地位合法化。同年8月,最高法出台的《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》中明确指出P2P平台作为提供媒介服务的中介平台,无须履行担保责任。这类良性政策的推出致使2015年7、8月"P2P"互联网搜索量大量增加,影响了预测模型的参数值。
  从表5的参数估计表中得到预测模型的系数为-0.014,P2P网贷月关注度系数为0.001,检验显著性值为0.032,小于0.05,模型系数显著。
  引入互联网搜索量的P2P网贷成交额预测模型如下:
  引入互联網搜索量的预测模型的拟合曲线如下:
  3.模型拟合效果分析
  根据表6,我们可以发现:
  在模型拟合优度(R方),平均绝对误差百分比(MAPE),平均绝对误差(MAE)的对比中,包含互联网搜索量的预测模型的统计量都比不包含互联网搜索量的预测模型的统计量小,因此包含互联网搜索量的预测模型拟合效果更优。在贝叶斯信息准则(BIC)检验中,包含互联网搜索量的预测模型比不包含互联网搜索量的预测模型小0.272,这说明变量的引入并不影响模型的有效性。
  根据上述对比分析结果,可以得出加入互联网搜索量(百度指数)的P2P网贷成交额预测模型比不含互联网搜索量(百度指数)的P2P网贷成交额预测模型拟合效果好,预测的有效性高。
  四、研究结论
  本研究以国内搜索引擎百度搜索提供的百度指数为基础,以P2P网络借贷成交额为研究对象,探索互联网搜索量与市场需求之间的关系。研究发现:
  1.互联网搜索量与产品的市场需求之间存在显著相关关系。在对P2P网络借贷成交额的研究中,其与互联网搜索量之间的相关系数为0.769,关系显著。投融资者很可能在有相关投融资需求之前先上网了解P2P网络借贷的平台、产品和政策等信息,形成一种潜在需求,以确保在信息对等的条件下作出决策。
  2.包含百度指数数据的预测模型比不包含百度指数数据的预测模型预测准确度更高。通过对P2P网络借贷交易额的数据分析,我们发现包含百度指数预测模型的平均百分比误差(MAPE)、平均绝对误差(MAE)都显著低于不包含百度指数的预测模型,这说明传统的预测存在的干扰因素及误差,有一部分可以被包含互联网搜索量数据的预测剔除,因此该变量的引入有利于提高模型的预测准确度,帮投融资决策者降低风险,提供更好的决策参考。
  【参考文献】
  [1]Yan Carriere-Swallow, Felipe Labbe Central Bank of Chile, Santiago, Chile.Nowcasting with Google Trends in an Emerging Market[J]. Journal of Forecasting, J. Forecast, 2013, (32): 289–298.
  [2]Simeon Vosen, Torsten Schmidt Rwi, Essen. Forecasting Private Consumption: Survey-Based Indicators vs. Google Trends[J]. Journal of Forecasting J. Forecast, 2011, (30): 565–578.
  [3]张金艳, 郭鹏江. 确定性时间序列模型及ARIMA模型的应用[J]. 西安邮电学院学报, 2009, (3): 128-132.
  [4]谢蒙萌. 多元线性回归模型在ETC 客户发展预测中的应用研究[J]. 公路交通科技, 2013, (11): 405-408.
  [5]刘颖, 吕本富, 彭赓. 网络搜索对股票市场的预测能力: 理论分析与实证检验[J]. 经济管理, 2011, (1): 172-180.
网站目录投稿:思柔