LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 区块链资产 > 使用机器学习和代理服务器改善财务情绪分析

使用机器学习和代理服务器改善财务情绪分析

2020-06-15 wanbizu AI 来源:区块链网络

代理服务器不仅可以由IT开发人员使用,而且在金融行业中也很有用,即在金融情绪分析中。让我解释。

在金融领域,数据是如此重要:它提供洞察力并有助于做出更好的决策。财务数据无处不在,所以最成功的公司就是那些

FMLS 2020迄今为止最多样化的受众群体-金融与创新相遇

知道如何收集它,并且 知道如何解释它。

情感数据是一个重要的子集,即关于人们如何看待给定产品,事件,想法等的信息。这里的基本类别是“积极感知”和“消极感知”。

直到最近,情感数据还无法量化:无法精确衡量人们的情感。但是,随着自然语言处理和机器学习的出现,这项任务终于可以实现。

在本文中,我们将探讨如何利用情感分析和网络抓取来做出更好的财务决策。

情绪分析概述

即使是最优秀的行业专家也无法跟上所有最新消息,报告,更新和谣言。这些数据通常会决定购买或出售给定公司的股票。这是一个典型的例子:

在对COVID-19的担忧日益增加的情况下,X国政府决定使用视频会议,而不是举行面对面的会议。 视频会议软件Y是市场上最受欢迎的视频会议解决方案之一,因此市场期望软件Y能够吸引大量新用户。 软件Y受欢迎程度的提高反映在其股票价格中。

上面的情况很大程度上借鉴了Zoom的最新成功,如下图所示:

investing.com

在某种程度上,可以自动分析新闻,报告,更新和谣言等数据的过程

。在注意到“ Coronavirus:Zoom Video会随着使用量激增聘请500名新软件工程师”这样的标题后,该软件将按照我们提供的指导方针进行操作(例如,购买Zoom股票)。

特斯拉(Tesla)的股票上涨2.5%。披露与纽约监管机构达成的一项交易后,Ocwen的股票开盘前上涨了12%,该交易将在未来三周内终止对其业务的第三方监控。此外,购买抵押服务权的限制可能会放宽。 Cara Therapeutics的股票在盘前大涨16%,此前这家生物技术公司在尿毒症瘙痒症治疗试验中报告了积极的结果。

另一个很好的例子是埃隆·马斯克(Elon Musk)最近的一条推文:“特斯拉股价太高了。”

这降低了特斯拉的股价。请注意5月1日的下降:

investing.com

使情感分析成为可能的系统称为自然语言处理(简称NLP)。顾名思义,NLP算法旨在分析自然(即人为:英语或中文)文本背后的含义。

尽管建立和实施NLP系统需要大量资源,但是这些好处使这项工作值得:

该算法具有出色的响应时间:它只需几毫秒即可执行命令,并且可以24/7运行。 它还具有可伸缩性:只要有足够的计算资源,它的“专长”就可以应用于每种财务数据源。

情绪分析如何工作?

每个文本都有一定的态度,可以是正面的,负面的或中立的。情感分析旨在通过将给定文本分解为单个词(称为标记),确定其态度,然后确定目标文本的总体态度,来确定给定文本(在大多数情况下为单个短语和句子)的态度。

这个原则似乎令人困惑,所以让我们自己尝试这项技术。

Python编程语言具有一个面向NLP的库,称为NLTK(自然语言工具包)。该网站具有NLTK情绪分析算法的交互式实现。尝试输入不同的句子以查看算法如何理解它们。

让我们测试以下句子:

“该项目是处理原始数据的绝佳工具。”算法确定此文本为正。 “该项目将改变技术前景。”该算法确定此文本是中性的。 “该项目未能发挥其潜力。”该算法确定此文本是否定的。

情感分析算法的缺点

以前,我们在交互式提示中使用了具有相当简单含义的句子:诸如“ great”和“ fail”之类的词通常标记整个上下文。那更复杂的东西呢?让我们尝试一下。

让我们以这个词组为例:“汽车行业的日子已经好过了。”该算法确定此文本是中性的。

这些示例表明,传统的NLP算法很难解析隐式含义:

细微的短语, 成语 隐喻等

通过机器学习增强情感分析

这就是机器学习的目的:我们可以在无数示例中训练ML算法,以使其“理解”文本的上下文。这是此类项目的蓝图:

建议文章

FBS CopyTrade成为2020年最佳复制交易应用程序转到文章>>

收集关注财务情绪文本的数据集。 标记每个文本的情绪。 建立针对“财务语言”进行了优化的情感分析模型。

机器学习算法的基础在于要训练的大量数据:在我们的案例中,该算法将分析新闻标题和社交媒体标题,以尝试查看文本之间的相关性以及其背后的含义。给定足够的培训材料,该算法可以“学习”(围绕其名称)机器周围给定文本的上下文。

各种金融数据抓取工具的创建者David Wallach回应了传统(非深度学习)算法的缺点:

该项目的主要目的是根据经过验证的用户的推文以及知名来源发布的文章对公司的情绪进行分类。使用当前(免费)的基于文本的情绪分析包(例如nltk,textblob等),我无法在投资方面实现体面的情绪分析。

例如,一条推文会说亚马逊是购买产品,您必须立即投资,而这些图书馆会将其归类为负面或中立情绪。这是由于这些分类器建立在训练集上。因此,我决定编写一个脚本(scripts / classify.py),该脚本采用从Firebase控制台下载的数据库的json表示形式(使用export to JSON选项),并允许您手动对每个句子进行分类。

现在,我们在情感分析工作流程中看到了数据的重要性。但是,我们如何获得它呢?

网页抓取概述

在术语“情感分析”中,“分析”部分是指理解数据,而我们在本文前面探讨的NLP算法可以做到这一点。另一方面,Web抓取使我们能够实际获取要分析的数据。

Infatica.io创始人兼首席执行官弗拉基米尔·福缅科(Vladimir Fomenko)

该术语是指从网站提取和组织数据的过程。

网页抓取如何工作?

借助网站组织数据的方式,可以进行Web抓取。每个网站元素(文本,链接,图像,动态功能等等)都属于其各自的类别,并由标准化的HTML标签表示。

网页抓取工具可以轻松浏览这些元素,找到并保存您需要收集的数据。

金融科技中的NLP应用

例如,用于抓取财务数据的软件Stocker遵循我们上面概述的过程:

它生成google查询,获取针对特定公司的最新文章。 然后,它解析文章以获取信息,以尝试检测重要信息是肯定的还是负面的。

我们还可以在其他领域使用情绪分析:

信用评分分析。名为LenddoScore的软件产品可以在线处理有关申请人的可用数据:这可能包括其社交媒体资料,浏览行为,浏览历史记录和其他标记。然后,该软件会评估借款人的信誉。

合同分析。 JP Morgan已为众多任务实施了多种机器学习算法。该公司测试了一种专为合同分析设计的NLP算法-现已成功节省了360,000个工时。

客户服务。聊天机器人是最近几年最流行的技术,它由NLP算法提供支持。金融机构通常以提供出色的客户体验而感到自豪-通过聊天机器人扩展其支持是实现这一目标的好方法。

使用代理确保您的分析成功运行

大多数网站出于各种原因不允许抓取网页。这是一个典型的示例:价格汇总商尝试从多个电子商务企业中收集价格数据。一旦这些数据在聚合器网站上发布,潜在的客户就会看到供应商M提供了最优惠的价格。为了防止这种情况,其他供应商可能会限制刮取其网站的任何内容。

在收到对其网站的请求后,他们尝试检测该请求是来自真实用户还是来自网络抓取机器人。当真正的用户获得通过时,该漫游器将被阻止。

但是,可以避开这些反机器人系统:使用代理,可以使刮板显示为真实用户。

在众多代理类型中,住宅代理是最佳解决方案:顾名思义,它们可以使您的刮板以真实用户的身份出现,即您所选择的国家的居民。这使您可以绕过防刮系统。

结论

每个交易者都决定使用哪种类型的分析以及实施哪种交易技术。但是在我看来,使用AI和代理服务器改善财务情绪分析是交易中的新词。

Vladimir Fomenko是Infatica.io(全球对等企业代理网络)的创始人兼首席执行官

—-

原文链接:https://www.financemagnates.com/fintech/trading/improving-financial-sentiment-analysis-with-machine-learning-proxy-servers/

原文作者:Vladimir Fomenko

编译者/作者:wanbizu AI

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...