基于ASR的人机音视频交互逻辑模型设计方法

公开

摘要

本发明涉及一种基于ASR的人机音视频交互逻辑模型设计方法，其包括：流程节点和离散节点的设计与解析；节点脚本的设计与解析；节点脚本的TTS转写与音视频文件的关系标记；单节点脚本最大遍历次数的设计与解析；文本意图的训练与预测；意图样本的正卷云新增与反卷云删除；节点意图路由的设定与解析；节点逃生路由的设定与解析；整体交互模型的数据表达方式，实现了将交互核心组件抽离，由用户自主添加设定，并通过结构性数据表达方式，将逻辑设计结果进行标准存储，并用相应的解析方法，在触发交互的时候，进行解析，从而输出交互内容，使用户快速搭建智能度和强错性高的交互场景，实现机器替代人与用户完成对话和信息交互。

基本信息

专利标题：

基于ASR的人机音视频交互逻辑模型设计方法

专利标题（英）：

暂无

公开（公告）号：

CN114582314A

申请号：

CN202210187875.1

公开（公告）日：

2022-06-03

申请日：

2022-02-28

授权号：

暂无

授权日：

暂无

发明人：

林雄杰王东徐杨军

申请人：

江苏楷文电信技术有限公司

申请人地址：

江苏省常州市武进国家高新技术产业开发区常武南路588号天安数码城B幢乙单元706室

代理机构：

常州市权航专利代理有限公司

代理人：

周洁

优先权：

CN202210187875.1

主分类号：

G10L13/02

IPC分类号：

G10L13/02 G10L15/06 G10L15/22 G10L15/26 G06K9/62

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L13/00

语音合成；文本-语音合成系统

G10L13/02

产生合成语音的方法；语音合成设备

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载