一种基于改进时空卷积网络的唇语识别方法
实质审查的生效
摘要

本发明属于图像与视频处理技术领域,具体涉及一种基于改进时空卷积网络的唇语识别方法;该方法包括:实时获取视频数据,视频数据输入到训练好的基于改进时空卷积网络的唇语识别模型中,输出唇语识别结果;本发明在特征提取阶段综合利用视频流数据中局部静态空间特征和时序特征,提取出更有效的特征向量,尽可能的减少语言内容在视觉表征上的歧义性。本发明为唇语的识别提供更可靠、更有力的信息,提升了对于视觉歧义的鲁棒性,同时,通过将时序特征提取网络中的多个不同尺度的卷积操作前加入了一个维度控制层,减少特征图的大小,解决了网络的深度和宽度的问题,更适用于视频流数据的特征提取,具有良好的经济效益。

基本信息
专利标题 :
一种基于改进时空卷积网络的唇语识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114359786A
申请号 :
CN202111483875.8
公开(公告)日 :
2022-04-15
申请日 :
2021-12-07
授权号 :
暂无
授权日 :
暂无
发明人 :
丰江帆周甜李俊材何中鱼
申请人 :
重庆邮电大学
申请人地址 :
重庆市南岸区南山街道崇文路2号
代理机构 :
重庆辉腾律师事务所
代理人 :
卢胜斌
优先权 :
CN202111483875.8
主分类号 :
G06V20/40
IPC分类号 :
G06V20/40  G06V40/16  G06N3/04  G06K9/62  G06V10/774  G06V10/82  G06V10/764  G06V10/80  
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06V 20/40
申请日 : 20211207
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332