R语言优化交易系统:用平行坐标图可视化系统参数优化结果

5 篇文章 0 订阅
订阅专栏

最近我们被客户要求撰写关于优化交易系统的研究报告,包括一些图形和统计输出。

在交互式平行坐标图中,有一个很好的htmlwidgets的例子。你可以交互式地操作平行坐标图来放大有趣的观察结果。

不久前,我读到了关于系统参数优化结果的可视化,使用应用程序来创建和操作回测结果。这个想法是通过改变系统参数来运行多个回测,并使用平行坐标图显示结果。

在如何优化交易系统中描述了一个系统参数优化的好例子。如果你只优化两个参数,三维图是一个非常好的方法,但如果你有两个以上的参数,该怎么做?

平行坐标就来了。假设我们运行一个系统参数优化,改变了3个参数,并将结果存储在数据矩阵中。第一列将包含CAGR,第2:4列将包含参数值。

比如说。

#*****************************************************************
#加载历史数据

getSymbols(tickers, src = 'yahoo', from = '1970-01-01', env = data, auto.assign = T)


# 只选择快 < 中 < 慢
choices = choices[choices$fast < choices$mid & choices$mid < choices$slow,]

# 预先计算所有的移动平均线
mas = list()
for( i in unique(unlist(choices)) )
	mas[[i]] = bt.apply.matrix(prices, SMA, i)

# 对所有组合进行回测
result = choices


for(i in 1:nrow(choices)) {

	data$weight[] = NA
	
	result$CAGR[i] = compute.cagr(model$equity, nyears)



#*****************************************************************
# 平行坐标图

#*****************************************************************
coord(result, col=1:nrow(result))

这张图很难看懂。

理想情况下,你想选择一个参数范围,并检查相应的系统CAGRs,或者选择一个CAGRs范围,看看什么参数产生了它们。R软件可以可视化互动性。

# 交互式平行坐标图

cp(result)

另一种方法是实现这种交互式行为,就是使用交互式平行坐标中的htmlwidgets的一个伟大的例子。 

博客
R语言LDA、CTM主题模型、rjags 吉布斯gibbs采样文本分析论文摘要、通讯社数据
10-19 819
主题模型允许对文档中的术语频率发生进行概率建模。拟合模型可用于估计文档之间以及一组指定关键字之间的相似性,这些关键字使用称为主题的额外潜在变量。R 包主题模型提供了基于文本挖掘包 tm 中的数据结构拟合主题模型的基本基础结构。关键词: 吉布斯采样, R, 文本分析, 主题模型在统计软件杂志(JSS)的摘要集合中进行了演示。为了结果的可重复性,我们仅使用截至2010-08-05发表的摘要,并省略摘要中包含非ASCII字符的摘要。最终数据集包含 348 个文档。
博客
数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
10-19 2139
全文链接:分析师:Enno案例数据集是在线零售业务的交易数据,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并使用Echarts做数据可视化。由于案例公司商业模式类似新零售,或者说有向此方向发展利好的趋势,所以本次基于利于公司经营与发展的方向进行数据分析。用大数据对产品的开发、生产、销售、流通等进行效能升级,优化整合线上线下资源,全方位提升用户体验的零售模式,这就是新零售。除了营销层面,新零售几乎涉及了产品的研发、设计、生产、品控、调度、包装、物流、品牌、服务、体验
博客
python岭回归、Lasso、随机森林、XGBoost、Keras神经网络、kmeans聚类链家租房数据地理可视化分析
10-18 961
1 利用 python 爬取链家网公开的租房数据;2 对租房信息进行分析,主要对房租相关特征进行分析,并搭建模型用于预测房租。
博客
R语言淮河流域水库水质数据相关性分析、地理可视化、广义相加模型GAM调查报告
10-17 789
采样地点:淮河流域一带,昭平台水库、白龟山水库、燕山水库、石漫滩水库、板桥水库、宿鸭湖水库、博山水库、南湾水库、石山口水库、五岳水库、泼河水库、鲶鱼山水库。
博客
检测异常值的4种方法和R语言时间序列分解异常检测
10-14 1575
太少的条柱可以隐藏一些模式,太多的条柱会夸大小的、可接受的数据更改的价值。例如,如果您有一个表示人身高的要素,并且其中一个观测值包含一个字符串,而不是一个字符串,其奇怪值如 = “abc cm”,并且由于高度不能包含此类值,因此可以安全地将其删除。但是,并非所有ML工作都受到异常值的影响,对于某些算法,您可以安全地忽略它们。例如,由于全球经济危机,一个国家的经济表现急剧下降,一段时间内较低的利率成为常态。根据异常值的性质,您可以保留它们或排除它们,例如,在实验错误的情况下,您希望删除它们。
博客
R语言回归模型诊断、离群值分析学生考试成绩、病人医护质量满意度、婴儿死亡率和人均收入、针叶树荫面积数据
10-12 1118
为了进行比较,预测是在所有观测值和省略一个观测值的情况下进行的:要么是有影响力的观测值,要么是有最高杠杆的观测值。在这个特殊的案例中,我们确定具有最大树干尺寸的三棵树的测量是不正确的,它们可以从分析中移除。图1显示了残差与M1的拟合值之间的关系,使用的是通常的残差和 studentized残差的一个版本,ei/ √ 1 - hi。其中一个观测值的库克距离几乎是其他观测值的3倍以上(红色),而其中的e个观测值的平均杠杆率是两倍(蓝色)。这张图上的异常点是最上面的三角形,它对应的是沙特阿拉伯。
博客
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
10-10 795
• 这种不同期限的即期利率的演变情况是一种基础关系的情况。• 因此,强加一个长期关系并使用Engle-Granger程序具有更大的统计能力。• r10Y 和r25Y 系列都有一个单位根。• 事实证明,通过对这些时间序列进行差分,单位根被取消了 ,得到了一个平稳的残差。• 这意味着时间序列是协整的。
博客
R语言MCMC的lme4二元对数Logistic逻辑回归混合效应模型分析吸烟、喝酒和赌博影响数据
10-08 1184
吸烟、喝酒和赌博被认为是由许多因素造成的。Logistic回归分析是一个非常有效的模型,可以检验各种解释变量和二元反应变量之间的关系。同时,双变量模型分析也被用于检验单变量模型之间的相关性。本项目的目的是利用统计方法来检验某个因素是否对吸烟、喝酒或赌博偏好有显著影响。然后用这个结果来预测这些习惯之间的组合。
博客
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法
09-29 934
一些归一化技术,如取对数,在大多数情况下可能有效,但在这种情况下,我决定尝试对任何数据都有效的方法,不管它最初是如何分布的。我下面要介绍的方法是基于反变换取样:主要思想是根据数据的统计特性,构造这样的函数F,所以F(x)是正态分布。例如,上一篇文章中的贝叶斯模型在没有数据归一化的情况下,R²~0.2,而在归一化数据的情况下,R²为0.34。这句话的数学证明超出了本文的范围,但是上述操作本质上只是对所有数值进行排序,并将每个数值替换为其数字,这给了它一个直观的感觉。请注意,最后的变换总是单调的。
博客
数据代码分享|Python用NLP自然语言处理LSTM神经网络Twitter推特灾难文本数据、词云可视化与SVM,KNN,多层感知器,朴素贝叶斯,随机森林,GBDT对比
09-26 639
Twitter是一家美国社交网络及微博客服务的网站,致力于服务公众对话。迄今为止,Twitter的可货币化日活跃用户达1.86亿。与此同时,Twitter也已成为突发紧急情况时人们的重要沟通渠道。由于智能手机无处不在,人们可以随时随地发布他们正在实时观察的紧急情况。因此,越来越多的救灾组织和新闻机构对通过程序方式监视Twitter产生了兴趣。但是,我们并不清楚一个用户在推特上发布的推文是否是真实的正在发生的灾难。举个例子,用户发送了“从正面看昨晚的天空,好像在燃烧一样。
博客
视频|分类模型评估:精确率、召回率、ROC曲线、AUC与R语言生存分析时间依赖性ROC实现
09-22 672
令 Mi为用于死亡率预测的基线(时间0)标量标记。当随时间推移观察到结果时,其预测性能取决于评估时间t。直观地说,在零时间测量的标记值应该变得不那么相关。因此,ROC测得的预测性能(区分)是时间t的函数。
博客
美光科技股票基本分析:经济背景、行业分析财政状况(盈利、EBITDA、PP&E、D&A等)预测计算DCF
09-21 735
本文收集信息和数据,从多方面评估分析美光科技的市场走向,商业前景。解决方案任务/目标从内外部角度分析外部:调查经济大背景(real GDP, Interest rates, inflation等参数)、半导体行业波动情况、外部不可控因素、通过数据分析美光在行业中的表现。内部:调研管理层,分析财政状况(盈利、EBITDA、PP&E、D&A等),利用现有数据预测并计算出DCF。数据源准备各项经济指标、行业指标我们从道琼斯指标美联储官网等权威信息平台收集。
博客
数据分享|函数型数据分析部分省市新冠疫情数据
09-19 2138
统计学中传统的数据类型有截面数据和时间序列数据。这两者都只能在某一纵向或横向上探究数据,且部分前提条件又很难满足。而函数型数据连续型函数与离散型函数长期以来的分离状态,实现了离散和连续的过度。它很少依赖于模型构建及假设条件。通过使用函数型数据,我们可以发掘新冠疫情数据中更多的信息。一、数据的收集与整理选择人口流动较大的北京、上海、广东,以及与武汉相邻的重庆、湖南、江西、安徽、河南,一共八个省级行政区的确诊人数变化数据作为样本。
博客
【视频】为什么要处理缺失数据?如何R语言中进行缺失值填充?
09-15 882
在任何现实世界的数据集中,通常都会有一些数据科学家和机器学习工程师必须处理的缺失数据,否则,它可能会导致开发数据时出现一些问题。因此,在这篇文章中,我将展示一些可用于处理数据驱动项目中丢失数据的技术,并可能消除在构建数据管道时丢失数据可能导致的问题。换句话说,在这种技术中,您只保留与每一列(或行)对应的非空值的数据行(或列),并将数据集视为删除的行从未存在过。然而,在这里,本质上假设丢失的数据点不会在数据管道中造成任何问题,并且所利用的方法擅长处理丢失的数据。但是,在分类列的情况下,均值和中位数没有意义。
博客
数据分享|WEKA用决策树、随机森林、支持向量机SVM、朴素贝叶斯、逻辑回归信贷违约预测报告
09-14 3081
特征转换数据变得越来越重要,其核心应用“预测”也成为互联网行业以及产业变革的重要力量。近年来网络 P2P借贷发展形势迅猛,一方面普通用户可以更加灵活、便快捷地获得中小额度的贷款,另一方面由于相当多数量用户出现违约问题而给 P2P信贷平台以及借贷双方带来诸多纠纷,因此根据用户历史款情况准确预测潜在是否还会发生违约就非常有必要。解决方案任务/目标对于用户贷款是否违约的预测,结果解释。数据源准备。
博客
python可视化探索新冠病毒与失业率是否存在线性关系
09-13 387
对于政府来说,分析确定线性关系是对未来走向进行评估预测的重要基石,但是使用python进行提取数据进行整合并且使用可视化清晰的呈现线性关系并不是一件容易的事情。我利用折线图将费城失业率进行可视化处理,同时利用散点图对新馆病毒案例及检测数进行可视化处理并将检测结果为阳性的案例进行进一步提取(同时借助tableau对新馆病毒进行更加清晰的可视化处理),新冠病毒的病例及检测数与失业率并没有明显的线性关系,但在美国疫情爆发的初期,新冠病毒的爆发的确对经济及就业市场造成了巨大的影响。基于政府提供的线上数据,
博客
代码分享|R语言使用ARIMA模型进行时间序列分析
09-12 3370
时间序列预测是借助对具有历史数据的数据集使用的一些统计工具和方法来预测未来值的过程。第一张图显示了没有预测的 BJsales 的视觉效果,第二张图显示了具有预测值的 BJsales 的视觉效果。中,数据分析和可视化非常容易学习数据的行为。此外,R 语言主要用于 Python 之后的数据科学领域。是一种数据分析,用于检查数据在一段时间内的行为。有许多技术可用于预测绘图图上的时间序列对象,但。使用基于 BJsales 数据集的 ARIMA 模型的函数预测 10 个下一个值。R中ARIMA模型的实现。
博客
【视频】机器学习交叉验证CV原理及R语言主成分PCA回归分析犯罪率|数据共享
09-09 724
这提高了性能的有效性,因为在训练数据集的每个部分上都训练了一个“新”模型。然后,我们将得到一个最终分数,该分数总结了模型在许多验证步骤中的性能——与查看单个迭代的性能相比,这是一种非常可靠的方法!验证集允许我们测试不同的配置并为我们的场景选择最好的配置,而没有过度拟合的风险。一旦我们找到最佳配置,您就可以将具有最佳配置的最佳模型带到“真实”世界——即由模型从未见过的数据组成的测试集。要在数据集上使用的模型时,我们需要了解哪些是最佳的超参数配置。一个可以泛化的模型是一个有用的、强大的模型。
博客
共享单车需求量登记分类及影响因素分析——基于机器学习模型的比较分析
09-08 1564
其次,Xgboost 支持并行处理,众所周知,决策树的学习最耗时的一个步骤是对特征的值进行排序,Xgboost 在训练之前预先对数据进行了排序,然后保存为 block 结构,后面的迭代中重复使用这个结构,大大减小了计算量。分析分类结果以及各因素的重要性发现,时间、风速、湿度、温度四个因素对共享单车使用量存在较高的影响,因此维修部门可以选在凌晨阶段,或者风速较大、温度过低或过高的时期对共享单车进行合理的批量维修,避开市民用车高峰,保证市民出行效率以及用车安全。因此,为了提高结果的准确性,选择删去。
博客
神经网络正则化技术防过拟合和R语言CNN卷积神经网络手写数字图像数据MNIST分类
09-02 769
为了减少模型的偏差,即减少错误假设造成的误差,我们需要一个更复杂的模型。相反,减少模型的方差,即模型在捕捉训练数据变化方面的敏感度,意味着一个更简单的模型。如果神经网络的每一层都是线性的,我们可以证明整个网络的行为是线性的。在探索用于防止神经网络过度拟合的不同技术之前,重要的是要弄清楚高方差或高偏差的含义。λ 直接控制正则化的影响:随着 λ 的增加,对权重收缩的影响更加严重。的网络,一个更简单的网络导致一个不太复杂的模型,也不太容易过拟合。同样,λ 是正则化项,对于 λ=0,L2 正则化的效果为空。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 拓端tecdat|R语言:结构方程模型、潜变量分析 33679
  • 基于R语言混合效应模型(mixed model)案例研究 17041
  • R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究分析案例 15814
  • R语言实现 Copula 算法建模相依性案例分析报告 15743
  • R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断 13577

分类专栏

  • R语言 376篇
  • 医学 4篇
  • Eviews 1篇
  • weka 1篇
  • 机器学习 229篇
  • 行业研究报告
  • 蒙特卡洛 7篇
  • 时间序列 37篇
  • 文本挖掘 6篇
  • 贝叶斯 6篇
  • 聚类 1篇
  • 网络分析 1篇
  • mcmc 1篇
  • excel 1篇
  • RapidMiner 1篇
  • 抽样
  • 模拟 1篇
  • 马尔科夫 2篇
  • stata 1篇
  • 生存分析 2篇
  • 神经网络 5篇
  • 医药 3篇
  • mac 1篇
  • 调查 1篇
  • 回归 15篇
  • 异常检测 1篇
  • 随机森林 1篇
  • rstan 1篇
  • 极值推断 1篇
  • garch 1篇
  • 故障检测 1篇
  • 交易策略
  • 股票 2篇
  • 线性模型 12篇
  • 爬虫数据采集
  • sas 4篇
  • 深度学习 12篇
  • 保险 14篇
  • 可视化 35篇
  • 数理统计 125篇
  • 预测 74篇
  • matlab 24篇
  • python 63篇
  • 图像处理 1篇
  • 大数据 1篇
  • 金融 5篇
  • spss 4篇
  • prophet 1篇
  • 数据分析 36篇
  • 算法 5篇
  • 虎扑论坛 2篇
  • 小波滤波器 19篇
  • 共享汽车

最新评论

  • 【数据分享】学生受欢迎程度评价数据集

    dwusajk: 流行度数据

  • 拓端tecdat|R语言Fama-French三因子模型实际应用:优化投资组合

    m0_56947427: 如果想要达到多只股票最后只出现一个表达式的话 应该如何修改代码呢

  • 【数据分享】糖尿病患者研究数据集

    weixin_52769023: 你好,获取方式在文末未见,请问如何获取

  • R语言逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例

    2301_79116687: 求数据

  • 拓端tecdat|R语言经济学:动态模型平均(DMA)、动态模型选择(DMS)预测原油价格时间序列

    m0_75212389: 请问博主那个DMA的函数是要安装哪个包啊?求!感激不尽

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • R语言LDA、CTM主题模型、rjags 吉布斯gibbs采样文本分析论文摘要、通讯社数据
  • 数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
  • python岭回归、Lasso、随机森林、XGBoost、Keras神经网络、kmeans聚类链家租房数据地理可视化分析
2022年168篇
2021年280篇
2020年150篇
2019年30篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司百色SEO按效果付费价格伊春模板推广泉州百度网站优化排名哪家好西安关键词排名包年推广推荐北海关键词按天扣费价格海南企业网站制作推荐霍邱阿里店铺运营价格温州营销网站价格台州设计公司网站报价丽水企业网站建设推荐宜宾建网站价格嘉兴百搜标王哪家好绥化网站制作荆州网站排名优化哪家好哈密阿里店铺运营报价白城外贸网站建设公司淄博网站设计模板多少钱池州关键词排名推荐张掖优秀网站设计价格上海网站制作设计多少钱贺州外贸网站制作成都百度爱采购多少钱乌海SEO按效果付费推荐海口网站关键词优化哪家好衡水品牌网站设计价格广元网站推广方案兰州网站优化按天计费清徐设计公司网站价格陇南网站优化按天收费毕节百度标王报价歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化