基于RoBERTa的股票行业舆情智能排序方法
公开
摘要
本发明公开的基于RoBERTa的股票行业舆情智能排序方法,包括:获取股票行业舆情数据;按照股票所属行业和板块对股票舆情数据分类;预处理股票舆情数据,其中,结构化数值数据采用去极值、填充、标准化方法进行预处理,非结构化文本数据采用去停用词、中文分词方法进行预处理;结构化数据直接作为特征向量输入至模型,非结构化数据分别通过适配金融股票时间序列的时间编码、TF‑IDF和Word2vec算法转换为特征向量再进行融合拼接,然后输入至模型;训练RoBERTa模型,基于模型预测结果分析股票各行业和各板块下一段时间的涨跌趋势。该方法创造性地结合金融股票时序性质、AI自然语言编码优势,大幅提高RoBERTa在股票投资领域的模型性能,实现基于舆情数据对股票的智能而且准确的排序。
基本信息
专利标题 :
基于RoBERTa的股票行业舆情智能排序方法
专利标题(英):
暂无
公开(公告)号 :
CN114565466A
申请号 :
CN202210257314.4
公开(公告)日 :
2022-05-31
申请日 :
2022-03-16
授权号 :
暂无
授权日 :
暂无
发明人 :
肖钢王鑫李剑戈赵天远曹震周能殷宪晨赵瑞
申请人 :
中信建投证券股份有限公司
申请人地址 :
北京市东城区朝内大街188号鸿安国际大厦
代理机构 :
北京卫智易创专利代理事务所(普通合伙)
代理人 :
朱春野
优先权 :
CN202210257314.4
主分类号 :
G06Q40/04
IPC分类号 :
G06Q40/04 G06Q10/04
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06Q
专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q40/00
金融;保险;税务策略;公司或所得税的处理
G06Q40/04
交易,例如,股票、商品、金融衍生工具或货币兑换
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载