改进Transformer融入知识的端到端对话方法
公开
摘要
本发明公开了改进Transformer融入知识的端到端对话方法,首先收集以对话和知识组成的二元组,将该二元组作为训练数据;对训练数据进行清洗,将训练数据组成包括对话、知识和回复的三元组形式,并对该三元组进行预处理;构建由编码运算模块、知识解码器运算模块和解码器运算模块组成的改进的Transformer模型;利用训练数据与三元组训练改进的Transformer模型,并保存;将以对话和知识组成的二元组输入训练好的改进的Transformer模型中,模型预测输出回复结果;用户对模型输出的回复结果进行回复后,将模型输出的回复结果和用户回复拼接到对话记录串中,并选取新的知识输入训练好的改进的Transformer模型中持续进行端到端对话。该方法充分利用Transformer模型结构将知识细致融合用于生成对话。
基本信息
专利标题 :
改进Transformer融入知识的端到端对话方法
专利标题(英):
暂无
公开(公告)号 :
CN114625861A
申请号 :
CN202210508811.7
公开(公告)日 :
2022-06-14
申请日 :
2022-05-11
授权号 :
暂无
授权日 :
暂无
发明人 :
谢冰宋伟朱世强袭向明金天磊周元海
申请人 :
之江实验室
申请人地址 :
浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼
代理机构 :
杭州求是专利事务所有限公司
代理人 :
邱启旺
优先权 :
CN202210508811.7
主分类号 :
G06F16/332
IPC分类号 :
G06F16/332 G06F16/31 G06F16/215 G06F40/205
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/332
•••查询公式
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载