基于ASR的人机音视频交互逻辑模型设计方法
公开
摘要
本发明涉及一种基于ASR的人机音视频交互逻辑模型设计方法,其包括:流程节点和离散节点的设计与解析;节点脚本的设计与解析;节点脚本的TTS转写与音视频文件的关系标记;单节点脚本最大遍历次数的设计与解析;文本意图的训练与预测;意图样本的正卷云新增与反卷云删除;节点意图路由的设定与解析;节点逃生路由的设定与解析;整体交互模型的数据表达方式,实现了将交互核心组件抽离,由用户自主添加设定,并通过结构性数据表达方式,将逻辑设计结果进行标准存储,并用相应的解析方法,在触发交互的时候,进行解析,从而输出交互内容,使用户快速搭建智能度和强错性高的交互场景,实现机器替代人与用户完成对话和信息交互。
基本信息
专利标题 :
基于ASR的人机音视频交互逻辑模型设计方法
专利标题(英):
暂无
公开(公告)号 :
CN114582314A
申请号 :
CN202210187875.1
公开(公告)日 :
2022-06-03
申请日 :
2022-02-28
授权号 :
暂无
授权日 :
暂无
发明人 :
林雄杰王东徐杨军
申请人 :
江苏楷文电信技术有限公司
申请人地址 :
江苏省常州市武进国家高新技术产业开发区常武南路588号天安数码城B幢乙单元706室
代理机构 :
常州市权航专利代理有限公司
代理人 :
周洁
优先权 :
CN202210187875.1
主分类号 :
G10L13/02
IPC分类号 :
G10L13/02 G10L15/06 G10L15/22 G10L15/26 G06K9/62
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L13/00
语音合成;文本-语音合成系统
G10L13/02
产生合成语音的方法;语音合成设备
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载