一种视频场景检测标注方法及系统
实质审查的生效
摘要

本发明公开了一种视频场景检测标注方法及系统,根据输入视频、音频和文本嵌入的模态信息源,采用预训练模型获取视频、音频和文本的模态特征,将获取的视频、音频和文本的模态特征进行对齐和融合形成窗口基本跨模态表示,根据多时相注意和相邻窗口之间的差异,将窗口基本跨模态表示演化为自适应上下文感知表示,根据获取的自适应上下文感知表示对场景进行检测,通过窗口属性分类器确定窗口的属性,通过位置偏移回归器在该窗口中获取场景边界的准确位置;基于获取的场景边界,为每个场景指定多个标签实现场景标注,将场景检测归结为窗口属性分类和位置偏移回归,并通过两级分类器的集成学习解决多标签标注问题。通过跨模态线索的统一网络解决错误传播和巨大计算成本问题;将场景检测归结为窗口属性分类和位置偏移回归,并通过两级分类器的集成学习解决多标签标注问题。

基本信息
专利标题 :
一种视频场景检测标注方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114332729A
申请号 :
CN202111678887.6
公开(公告)日 :
2022-04-12
申请日 :
2021-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
徐亦飞桑维光罗海伦李斌徐武将朱利
申请人 :
西安交通大学
申请人地址 :
陕西省西安市咸宁西路28号
代理机构 :
西安通大专利代理有限责任公司
代理人 :
李鹏威
优先权 :
CN202111678887.6
主分类号 :
G06V20/40
IPC分类号 :
G06V20/40  G06N3/08  
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G06V 20/40
申请日 : 20211231
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332