一种基于prompt的文本情感原因分析方法和系统
实质审查的生效
摘要
本发明公开一种基于prompt的文本情感原因分析方法和系统,方法包括以下步骤:S1:收集文本数据并进行预处理;S2:在预处理后的文本中先后添加文本提示词和文本待预测词,并针对文本待预测词,设置目标候选词集;S3:对文本添加子句分割符号和文本起始符号与结尾符号;S4:使用BERT预训练模型,对文本和目标候选词集进行特征向量编码,得到文本特征向量和目标候选词集向量;S5:计算文本特征向量和目标候选词集向量之间的编码距离,利用softmax函数计算每个待预测词的编码距离向量的概率,得到待预测词的预测结果;S6:基于具体任务进行预测模块组合,得到适用于具体文本情感原因分析任务的方法。本发明引入prompt解决了微调任务和预训练任务之间的差异性。
基本信息
专利标题 :
一种基于prompt的文本情感原因分析方法和系统
专利标题(英):
暂无
公开(公告)号 :
CN114416991A
申请号 :
CN202210055865.2
公开(公告)日 :
2022-04-29
申请日 :
2022-01-18
授权号 :
暂无
授权日 :
暂无
发明人 :
王甲海郑晓鹏
申请人 :
中山大学
申请人地址 :
广东省广州市海珠区新港西路135号
代理机构 :
广州粤高专利商标代理有限公司
代理人 :
禹小明
优先权 :
CN202210055865.2
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G06F 16/35
申请日 : 20220118
申请日 : 20220118
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载