一种提升时间序列预测效果的方法和系统

文档序号:31136323发布日期:2022-08-13 13:22阅读:277来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种提升时间序列预测效果的方法和系统

1.本发明属于人工智能时间序列预测领域,具体涉及一种提升时间序列预测效果的方法和系统。


背景技术:

2.随着人工智能和时间序列预测方法的发展,时间序列信息在各个领域得到了广泛应用,利用历史数据预测未来数据的变化趋势从而指导决策,对工业界具有重要意义。对于随机高波动的时序数据(如风速、太阳辐射、电力负荷、金融数据等),现有基于信号分解的深度学习的预测效果不尽人意,其主要原因是此类方法存在一定的主观经验性,子序列缺乏明确的物理意义,高频子序列预测困难,且对新数据的输入较为敏感。
3.为提高建模效率和模型预测准确度,本发明创新性地提出了一种“积分-建模-差分”的预测方法,既降低了多个子序列带来的模型复杂度,又具有明确的物理意义,同时提高时间序列预测的准确度。


技术实现要素:

4.本发明为了解决背景技术中存在的技术问题,目的在于提供了一种提升时间序列预测效果的方法和系统,用于时间序列预测过程中实现更快速地建模和更准确的预测。
5.为了解决技术问题,本发明的技术方案是:
6.一种提升时间序列预测效果的方法,包括一个积分预处理子步骤、一个预测模型和一个差分回溯目标变量子步骤。这里所述时间序列数据是按照时间顺序排列的数据点序列,每个数据均为实数值。
7.该预测方法实现预测的基本流程为:将一定长度的历史时间序列进行积分累加,或者进行一定代数处理后进行积分累加,称为历史积分序列;以一组固定长度的历史积分序列作为预测模型输入,经过预测模型计算后输出接下来一个或多个时间点的序列,称为未来积分序列预测值;对未来积分序列进行差分计算,得到未来时间序列预测值。
8.预测模型的目标为:使未来时间序列预测值与未来时间序列真实值的差距尽可能地小。为此,时间序列预测模型需要先根据已有的时间序列数据也就是过去数据训练得到时间序列预测模型的参数,该时间序列预测模型可用于预测未来时间序列。
9.由于本发明的预测模型需要在训练之后才可以使用,所以本发明的具体操作步骤分为:预测模型训练步骤和预测模型测试步骤。其中,训练步骤为学习时间序列预测模型中所有参数;测试步骤为使用时间序列预测模型来输出未来数据。具体步骤如下:
10.步骤1:收集一定长度的时间序列数据,划分训练集和测试集(注:接下来步骤2至步骤4中用到的任意时间序列都来自训练集);
11.步骤2:对历史时间序列进行积分处理,得到历史积分序列,对历史积分序列进行归一化;
12.步骤3:初始化预测模型,将训练集的历史积分序列输入模型进行训练;
13.步骤4:通过网格搜索算法重复训练预测模型,选择预测模型的最优超参数;
14.步骤5:将测试集历史积分序列做归一化处理后,输入训练好的模型,得到测试集的未来积分序列预测值;
15.步骤6:对测试集的未来积分序列预测值进行反归一化和差分运算,得到未来时间序列预测值;
16.步骤7:评估测试集上的预测准确率。
17.步骤1中划分训练集和测试集:将整个数据集以时间顺序按照70%/30%的比例划分训练集和测试集,即前70%为训练集,后30%为训练集。设训练集共包含n条时间序列数据,对于任意一条时间序列数据(y1,y2,

,y
t
),选定参数l(l《t),序列的前l条数据构成的子序列为历史时间序列,第l+1到l+a条数据构成的子序列为未来时间序列,记为(y
l+1
,y
l+2
,

,y
l+a
).
18.步骤2中所述积分处理定义为,某一时间戳的积分量yi等于自第一个时间序列数据y1到该时间戳对应的时间序列y
t
数据对应的所有时间序列数据的累加,即由此可得到积分时间序列(y1,y2,

,yn).积分处理可将波动序列转化为平滑的单调递增序列。归一化方法采用线性归一化,即由此可将积分序列数值范围控制在[0,1],便于后续计算。
[0019]
步骤3中所述预测模型可以采用任意的现有时间序列预测模型,如支持向量回归(svr),bp神经网络(bpnn),长短期记忆神经网络(lstm)和门控循环单元神经网络(gru)等。在本发明中,综合预测的准确度和参数计算量,最终选用gru作为预测模型。该模型包含一层gru层和一层全连接层。gru层的计算单元是以relu为激活函数的多层全连接神经网络,在每个时间节点t,该循环神经网络的输入层维度为输出为该输出表示基于第t个时间点对第t+1时间点的预测。全连接层以relu为激活函数,其输入为gru层的输出,其输出为长度为a的一维向量,即未来积分序列预测值。
[0020]
步骤4中网格搜索算法即穷举搜索,在所有候选的超参数组合中,通过循环遍历,表现最好的参数作为最终的结果。
[0021]
步骤6中反归一化即归一化的逆运算,即yi=y
′i(y
max-y
min
)+y
min
。由所述步骤2中对积分序列的定义可知,某时间戳对应的时间序列的值等于当前时间戳和前一时间戳的积分时间序列值的一阶差分,即y
t
=y
t-y
t-1
。由此可得未来时间序列预测值。
[0022]
步骤7中使用平均绝对误差(mae)和均方根误差(rmse)来评估时间序列预测准确率,mae和rmse越小,则表示预测准确率越高。对于未来时间序列实际值yi及其对应的预测值mae和rmse可分别表示为
[0023]
[0024][0025]
本发明还提供一种提升时间序列预测效果的系统,包括:
[0026]
scada系统,用于采集和传输数据;
[0027]
一个或多个处理器;
[0028]
存储器,用于存储算法程序以及scada系统的传输数据;
[0029]
所述scada系统采集现场数据并传输至存储器中存储,当所述算法程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述一种提升时间序列预测效果的方法。
[0030]
与现有技术相比,本发明的优点在于:
[0031]
(1)本发明采用变上限积分平滑时间序列的高频波动,使得机器学习模型能够更容易学习到平滑曲线的特征;
[0032]
(2)本发明避免将时间序列分解后分别建模,大大减少子模型数量,降低模型复杂度,提升了计算效率;
[0033]
(3)本发明的积分时间序列仍有明确的物理含义,相较于分解模型的子序列,具有更强的可解释性。
附图说明
[0034]
图1为本发明的算法流程图;
[0035]
图2为本发明时间预测系统与emd和persistence方法的预测结果比较图。
[0036]
图3为本发明时间预测系统与emd方法的模型训练时间比较图。
具体实施方式
[0037]
结合实施例说明本发明的具体技术方案。
[0038]
本实施采用gefcom2014风电数据集,通过本发明提出的方法提升时间序列预测系统在未来时间点上的预测准确度。本实施例具体步骤如图1所示,包括:
[0039]
步骤1:收集一定长度的时间序列数据,划分训练集和测试集;
[0040]
步骤2:对历史时间序列进行积分处理,得到历史积分序列,对历史积分序列进行归一化;
[0041]
步骤3:初始化预测模型,将训练集的历史积分序列输入模型进行训练;
[0042]
步骤4:通过网格搜索算法重复训练预测模型,选择预测模型的最优超参数;
[0043]
步骤5:将测试集历史积分序列做归一化处理后,输入训练好的模型,得到测试集的未来积分序列预测值;
[0044]
步骤6:对测试集的未来积分序列预测值进行反归一化和差分运算,得到未来时间序列预测值;
[0045]
步骤7:评估测试集上的预测准确率。
[0046]
所述步骤1划分训练集和测试集:由于数据集包含2012-2013两年的风功率数据,将2012年数据作为训练集,2013年数据作为测试集。训练集共包含8770条时间序列数据,对
于任意一条时间序列数据(y1,y2,

,y
t
),选定参数l(l《t),序列的前l条数据构成的子序列为历史时间序列,第l+1到l+a条数据构成的子序列为未来时间序列,记为(y
l+1
,y
l+2
,

,y
l+a
).
[0047]
所述步骤2所述积分处理定义为,某一时间戳的积分量yi等于自第一个时间序列数据y1到该时间戳对应的时间序列y
t
数据对应的所有时间序列数据的累加,即由此可得到积分时间序列(y1,y2,

,yn).积分处理可将波动序列转化为平滑的单调递增序列。归一化方法采用线性归一化,即由此可将积分序列数值范围控制在[0,1],便于后续计算。
[0048]
所述步骤3所述预测模型采用门控循环单元神经网络(gru),该模型包含一层gru层和一层全连接层。gru层的计算单元是以relu为激活函数的多层全连接神经网络,在每个时间节点t,该循环神经网络的输入层维度为输出为该输出表示基于第t个时间点对第t+1时间点的预测。全连接层以relu为激活函数,其输入为gru层的输出,其输出为长度为a的一维向量,即未来积分序列预测值。
[0049]
所述步骤4网格搜索算法即穷举搜索,在所有候选的超参数组合中,通过循环遍历,表现最好的参数作为最终的结果。
[0050]
所述步骤6反归一化即归一化的逆运算,即yi=y
′i(y
max-y
min
)+y
min
。由所述步骤2中对积分序列的定义可知,某时间戳对应的时间序列的值等于当前时间戳和前一时间戳的积分时间序列值的一阶差分,即y
t
=y
t-y
t-1
。由此可得未来时间序列预测值。
[0051]
所述步骤7本发明中使用平均绝对误差(mae)和均方根误差(rmse)来评估时间序列预测准确率,mae和rmse越小,则表示预测准确率越高。以提前2步预测为例,对于未来时间序列实际值yi及其对应的预测值mae和rmse可分别表示为
[0052][0053][0054]
该算例中,mae=0.06,rmse=0.11。
[0055]
图2为本发明时间预测系统与emd和persistence方法的预测结果比较图。
[0056]
图3为本发明时间预测系统与emd方法的模型训练时间比较图。
[0057]
一种提升时间序列预测效果的系统,包括:
[0058]
scada系统,用于采集和传输数据;
[0059]
一个或多个处理器;
[0060]
存储器,用于存储算法程序以及scada系统的传输数据;
[0061]
所述scada系统采集现场数据并传输至存储器中存储,当所述算法程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上述所述一种提升时间序列预
测效果的方法。
[0062]
上面对本发明优选实施方式作了详细说明,但是本发明不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。不脱离本发明的构思和范围可以做出许多其他改变和改型。应当理解,本发明不限于特定的实施方式,本发明的范围由所附权利要求限定。
完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 数据处理方法和电子设备与流程
  • 一种神经网络图像分类器置信度...
  • 一种托盘定位方法及装置与流程
  • 敏感数据的处理方法、装置及计...
  • 一种工业缺陷检测优化方法、系...
  • 一种红外图像质量综合评价系统...
  • 一种贴片式的无线射频识别系统...
  • 基于多频带融合的TENS信号...
  • 一种异常检测方法、装置、设备...
  • 视频营销的权益转移数字认证方...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

深圳SEO优化公司吉林网络营销价格承德seo海西网站开发潮州百度关键词包年推广哪家好铜川SEO按天计费价格无锡网站优化软件迁安网站制作推荐江门阿里店铺运营推荐张家口建网站公司中山营销型网站建设报价泰安百度seo报价阳泉网站优化按天收费多少钱清远网站优化按天计费随州网站推广工具哪家好武威网站推广方案朝阳百姓网标王推广报价眉山网站制作推荐无锡网站制作设计公司盐田网站seo优化内江网站制作设计公司金昌网站制作哪家好长沙网页制作公司天门优秀网站设计亳州网络广告推广多少钱盘锦建设网站多少钱大运设计网站多少钱盐城网站建设设计哪家好济宁关键词排名包年推广哪家好宁波网站seo优化公司诸城SEO按效果付费价格歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化