一种基于词向量和Bert的群体内隐立场分析方法
授权
摘要
本发明公开一种基于词向量和Bert的群体内隐立场分析方法,通过文本语料库训练Bert模型,结合句向量进行群体内隐立场分析;包括数据解析模块、模型训练模块以及内隐立场分析模块;数据解析模块用于解析提取社会群体中用户发表的言论数据,根据内隐联想测试中提到的目标词和属性词对用户的言论分类;对其中抽取的正文文本进行分句得到言论集合A,再提取到既包含目标词又包含属性词的句子集合B,和不包含目标词和属性词的集合C;模型训练模块用于构建学习社会群体语言大数据文本偏见的模型;内隐立场分析模块根据句子的嵌入向量之间的距离远近来测量对应目标词和属性词之间的关系大小,从而量化社会群体用户的内隐立场态度。
基本信息
专利标题 :
一种基于词向量和Bert的群体内隐立场分析方法
专利标题(英):
暂无
公开(公告)号 :
CN112836486A
申请号 :
CN202011451101.2
公开(公告)日 :
2021-05-25
申请日 :
2020-12-09
授权号 :
CN112836486B
授权日 :
2022-06-03
发明人 :
韩旭王博蒋沁学陈根华黄博帆
申请人 :
天津大学
申请人地址 :
天津市南开区卫津路92号
代理机构 :
天津市北洋有限责任专利代理事务所
代理人 :
刘子文
优先权 :
CN202011451101.2
主分类号 :
G06F40/205
IPC分类号 :
G06F40/205 G06F40/284 G06F40/30 G06F40/126 G06F16/35
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/205
解析
法律状态
2022-06-03 :
授权
2021-06-11 :
实质审查的生效
IPC(主分类) : G06F 40/205
申请日 : 20201209
申请日 : 20201209
2021-05-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载