MIC:实战 | 机器学习能否预测加密货币的价格?

作者:Michel?Kana,?Ph.D,翻译:Jeremy

这份实用指南提供了你预测加密货币价格飞速上涨所需的基础知识。

十五年前,我开始探索数字货币的世界,并为一个只使用短信的点对点移动货币平台做了原型。

最近,我的一位合作者问我,人工智能是否可以预测加密货币的价格。她对区块链的炒作很好奇。

经过研究,我发现预测加密货币价格是一个可以解决的问题,但绝对不是针对所有市场条件。

加密资产的典型预测模型将利用时间序列预测、机器学习或深度学习方法。

在本文中,我研究了在预测给定日期的Litecoin平均价格时,片断插值的表现如何。

数据

我们将关注2013年4月至2021年2月期间Litecoin的历史价格。这些数据取自coinmarketcap,并且是可以免费使用的。我将数据分为80%的训练数据集和20%的测试数据集。后者用于评估我们预测收盘价的准确性。

国家邮政局:加快建设亚太地区互联互通邮政快递网络 持续加强国际寄递物流体系建设:11月28日消息,国家邮政局党组书记、局长赵冲久主持召开局党组会议。会议指出,要加快推进行业数字化转型,大力发展智慧邮政和智慧快递,推动大数据、互联网、人工智能、区块链等新技术与行业深度融合,加快产业数字化转型,促进商品和要素流动,不断引领产业链深度融合和高端跃升,更好实现物畅其流。要更好稳固国际产业链供应链,坚持小循环带动大循环,加快建设亚太地区互联互通邮政快递网络,持续加强国际寄递物流体系建设,全面深化电子商务时代跨境合作,支持加强海外分拨中心、海外仓以及地面配送网络建设,更好贯通对外贸易生产端、贸易端、消费端,有效服务促进国际贸易发展。[2022/11/28 21:05:24]

加密货币Litecoin的价格历史(Source:?Kaggle)

中通科技持续探索“区块链+快递”落地应用:金色财经消息,近日,使用中通标快产品的用户,可在运单详情页点击“签收信息区块链存证”链接下载《区块链签收存证证书》。具体而言,系统会将每一条快递签收记录保存到区块链节点上,自动完成一系列上链动作,并永久生成一张“证书”,以此来提升用户对快递产品和服务的信用感知。证书包含区块链标识、快递运单号、签收人、签收时间等信息,数据可靠,并全程透明。(腾讯新闻)[2022/7/12 2:06:49]

短暂的探索性数据分析显示,平均收盘价在年初和年末是最高的。10月份最低。

多项式回归?

你可能听说过多项式回归,这可以说是创建一个阶数为d的基础来近似一个非线性函数的最简单例子。

声音 | 国家邮政局边作栋:区块链等技术在快递行业得到越来越广泛应用:1月20日,国家邮政局召开2020年第一季度例行新闻发布会,通告2019年快递服务满意度调查结果和时限准时率测试结果。数据显示,2019年快递服务总体满意度得分为77.3分,较2018年上升1.4分。国家邮政局市场监管司副司长边作栋表示,企业通过不断优化作业组织,增加运力保障、拓展直发线路等,压缩了运输时限。更重要的是,目前全国已拥有232个大型快件自动化分拣中心,节省人力40%,提高操作效率超过50%,大幅缩短了邮快件的处理时限。电子运单、智能仓、北斗导航技术、区块链技术,以及“无人仓、无人机、无人车”等技术装备均处于世界领先水平,在行业得到越来越广泛应用。[2020/1/20]

我对Litecoin的历史价格进行了简单的多项式回归,使用5、25和80的阶数。在每种情况下,R2值将提供一些关于模型在测试数据集上的拟合度好坏的信息。

从下面的蓝线与训练数据的拟合度来看,我们可以观察到随着多项式阶数的增加,曲线越来越陡峭。这是由于模型复杂性增加,因为高阶多项式试图追逐训练集中的每一个单一数据点。

声音 | Ira Kleiman:想得到有关“保税快递员”的真相 希望尽快开庭审理:Ira Kleiman在14日最新的法庭文件中提及,想得到有关“保税快递员”的真相。Kleiman认为,他们理应得到有关这一新信息的答案,因为他们认为CSW“伪造文件,提交虚假声明,并在公开法庭上作伪证”。Kleiman的法律团队还要求重新安排与伦敦小说家Andrew O’Hagan和CSW妻子的出庭作证时间。此外,原告希望推翻其他事实证人,并获得新的文件发现。Coingeek的所有者Calvin Ayre也在14日的原告文件中被提及。Kleiman正在寻求更多时间进行调查,并在文件中强调,希望此案尽快开庭审理。

据此前报道,此前提及的“保税快递员”中间人已经到来,他“提供了解锁加密文件所需的信息和密钥片段”,表示CSW拥有解锁96亿美元比特币所需的私钥。(Bitcoin.com)[2020/1/16]

第0天代表2013年4月30日,第2800天代表2021年2月28日。

波场TRON账户总数突破9800万:2022年6月16日,TRONSCAN最新数据显示,波场TRON账户总数达到98,182,852,正式突破9800万。波场TRON各项数据稳中前进,波场生态逐渐强大的同时,也将迎来更多交易量。[2022/6/16 4:32:37]

特别是在有离群值的区域,高阶多项式往往会向这些离群值的方向发展。因此,80阶多项式的模型具有最高的方差。

它在训练数据上的偏差也是最低的,这体现在最高的R2值上,相比之下,低阶多项式的R2更低,意味着更高的偏差但更低的方差。低阶多项式对训练数据的敏感性较低。

分片插值?

我发现一个更灵活的方法是使用片断多项式来预测加密货币价格。

分片插值用低阶多项式拟合大量的数据点。由于我们只使用低阶多项式,我们消除了过度的振荡和非收敛性。

给定一组数据点,分片插值的工作原理是在每一部分数据中使用不同的多项式。

特别是,我们使用连接的分片多项式,也称为样条。

样条的一个例子是下面的截断线性函数。它在4的左边是平的,称为函数的结。

给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。

为了检测加密货币价格中存在的高度曲线关系,我使用了一个截断的三次函数,也叫三次样条。

使用三次样条,我们将数据分割成块,并对每个块拟合一个三次样条。每个样条函数在结点处连接到下一个函数。

三次样条是加密货币价格变化的一个非常好的选择,因为连接是平滑的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是3阶的多项式函数,它仍然足够小,以避免差异性。

三次B-样条是三次样条的一个更容易的变体,用于高效计算,因为最多有5个基函数参与贡献插值。下面我们可以看到三次B-样条在Litecoin价格上的表现,将结点放在四分位数上之后。

通过手动选择结点,即在我们有一堆数据点的情况下,与根据四分位数放置结点时的值相比,我们在测试数据集上实现了更好的R2。

在边界附近的三次样条可能表现得很奇怪,你能够在上面的红色图中注意到。所谓的自然三次样条通过在每个极限处将一个三次多项式改为线性来强制要求函数在极限结点之外是线性的。

自然三次样条需要选择一个自由度。对于Litecoin的价格,我通过交叉验证找到了最佳自由度:挑选了合适的174个结点的量子作为预测器的日期。结果与三次B-样条相比,边缘的差异性更小,但测试数据集的R2略差。

最后,我实现了平滑样条,在惩罚价格变化的同时,使均方误差最小化。

平滑样条似乎是Litecoin价格最合适的分片插值。该模型在测试数据集上实现了迄今为止获得的最佳R2值。

三次样条模型令人兴奋的部分是如何超越用于训练模型的数据范围进行推断。

根据以预测和时间序列工作而闻名的著名统计学家RobJhyndman的说法,三次平滑样条模型在预测方面可以作为与ARIMA模型等效的模型,但其参数空间受到限制。Rob声称,样条模型提供了一个平滑的历史趋势以及线性预测函数。

我邀请你进一步试验这个想法。我的计算机代码可以在网上以JupyterPython/RNotebook形式查看。

本文中使用的GoogleColabNotebook

数字货币和加密货币,如Litecoin,是现代全球经济中最具争议和最复杂的技术创新。本文旨在使用一种不太流行的方法:三次样条来预测Litecoin价格的变化。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

[0:0ms0-2:715ms