一种基于bert模型与ngram模型的语句修正方法及装置
实质审查的生效
摘要
本申请提供了一种基于bert模型与ngram模型的语句修正方法及装置,属于数据处理技术领域。所述方法包括确定所述语句中用于替代错误字词的多个候选目标词,并构成多个候选语句;对于每个候选语句,基于预设的bert模型计算该语句的第一困惑度,基于预设的ngram模型计算该语句的第二困惑度;给定所述第一困惑度的第一加权系数,给定所述第二困惑度的第二加权系数;对所述第一困惑度及所述第二困惑度通过加权的方式确定每个候选语句的总困惑度;基于所述总困惑度确定最终语句。本申请bert模型与ngram模型形成互补,提高了语句修正的准确率。
基本信息
专利标题 :
一种基于bert模型与ngram模型的语句修正方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114282523A
申请号 :
CN202111386417.2
公开(公告)日 :
2022-04-05
申请日 :
2021-11-22
授权号 :
暂无
授权日 :
暂无
发明人 :
汪玉珠刘学谦田贺锁
申请人 :
北京方寸无忧科技发展有限公司
申请人地址 :
北京市海淀区彩和坊路8号8层807C2
代理机构 :
北京中政联科专利代理事务所(普通合伙)
代理人 :
郑久兴
优先权 :
CN202111386417.2
主分类号 :
G06F40/216
IPC分类号 :
G06F40/216 G06F40/232
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/216
使用统计方法
法律状态
2022-04-22 :
实质审查的生效
IPC(主分类) : G06F 40/216
申请日 : 20211122
申请日 : 20211122
2022-04-05 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载