一种跨模态上下文编码的对话情感识别方法及系统
实质审查的生效
摘要
本发明公开一种跨模态上下文编码的对话情感识别方法及系统,该方法包括:步骤S1,将多轮对话中每条语句对应的视频模态、音频模态及文本模态信息分别进行编码,得到各语句对应的视觉模态、语音模态及文本模态表征向量序列;步骤S2,将多轮对话的视觉模态表征向量序列、语音模态表征向量序列及文本模态表征向量序列分别进行模态内的上下文编码,得到对话中各语句的单模态上下文编码表征;步骤S3,将对话中各语句的单模态上下文编码表征进行两两组合编码,得到对话中各语句跨模态融合的上下文编码;步骤S4,将跨模态融合的上下文编码表征进行自适应的信息汇总,并对语句的情感类别进行判断。本发明能够有效提升对话情感的识别精度。
基本信息
专利标题 :
一种跨模态上下文编码的对话情感识别方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114463688A
申请号 :
CN202210377011.6
公开(公告)日 :
2022-05-10
申请日 :
2022-04-12
授权号 :
暂无
授权日 :
暂无
发明人 :
李太豪阮玉平张晓宁黄剑韬郑书凯
申请人 :
之江实验室
申请人地址 :
浙江省杭州市余杭区中泰街道之江实验室南湖总部
代理机构 :
杭州浙科专利事务所(普通合伙)
代理人 :
孙孟辉
优先权 :
CN202210377011.6
主分类号 :
G06V20/40
IPC分类号 :
G06V20/40 G06V40/16 G06V40/20 G06F40/35 G06N3/04 G06N3/08
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G06V 20/40
申请日 : 20220412
申请日 : 20220412
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载