一种基于图像识别的打电话行为识别方法与系统
公开
摘要
本发明提供了一种基于图像识别的打电话行为识别方法与系统,本发明通过在训练过程中采用Mosaic和MixUp进行数据增强,极大增加模型的泛化能力;采用BOX、CLS和OBJ预测和LOSS分开计算,进行了不同预测类型的解耦,加快了模型的收敛效率;设置的网络模型架构小,模型参数少,减少了对设备内存和存储的占有;采用逐级放大进行检测,避免对小目标的丢失,提高模型的检测准确率,当不存在人员或不存在打电话行为时不进行下一步,很大程度上节约了程序推理的时间,提高了运行的效率;采用上采样模型,对提取的模型特征进行合并,使得模型检测准确率更高;模型的模块化设计,使得不同模型的检测网络复用,减少网络参数。
基本信息
专利标题 :
一种基于图像识别的打电话行为识别方法与系统
专利标题(英):
暂无
公开(公告)号 :
CN114299605A
申请号 :
CN202111415231.5
公开(公告)日 :
2022-04-08
申请日 :
2021-11-25
授权号 :
暂无
授权日 :
暂无
发明人 :
许博
申请人 :
苏州浪潮智能科技有限公司
申请人地址 :
江苏省苏州市吴中区吴中经济开发区郭巷街道官浦路1号9幢
代理机构 :
济南诚智商标专利事务所有限公司
代理人 :
李伟伟
优先权 :
CN202111415231.5
主分类号 :
G06V40/20
IPC分类号 :
G06V40/20 G06V40/10 G06V20/40 G06T7/20 G06T7/11 G06N3/04 G06V10/82
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载