由多模态用户输入驱动的内容捕获体验

公开

摘要

本文公开了涉及从空间姿势和语音组合的用户输入的系统、方法和软件。例如，在拍照、录制视频或控制远程服务或设备时，组合的用户输入允许用户更流畅地与其周围环境交互。在各种实现方式中，计算设备的一个或多个组件识别组合的用户输入的发生，例如口语话语和至少部分地与口语话语同时发生的利用设备做出的空间姿势。一个或多个组件识别与组合的用户输入相关联的内容捕获体验并在设备上调用内容捕获体验。

基本信息

专利标题：

由多模态用户输入驱动的内容捕获体验

专利标题（英）：

暂无

公开（公告）号：

CN114631140A

申请号：

CN202080076925.8

公开（公告）日：

2022-06-14

申请日：

2020-10-29

授权号：

暂无

授权日：

暂无

发明人：

A·S·李H·A·根茨科J·R·哈里斯A·S·费恩格E·L·梅斯三世L·D·洛

申请人：

微软技术许可有限责任公司

申请人地址：

美国华盛顿州

代理机构：

永新专利商标代理有限公司

代理人：

刘文灿

优先权：

CN202080076925.8

主分类号：

G10L15/22

IPC分类号：

G10L15/22 G10L15/26 G06F1/16 G06F3/01 G06F3/16

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/22

在语音识别过程中使用的程序

法律状态

2022-06-14 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载