生成长文本科技情报模型的优化方法
公开
摘要
本发明提出了一种生成长文本科技情报模型的优化方法,包括:S100:获取模型生成的长文本科技情报;S200:对所述长文本科技情报进行用词准确程度评估;S300:对所述长文本科技情报进行语句连贯程度评估;S400:对所述长文本科技情报进行文章结构合理程度评估;S500:对所述长文本科技情报进行科技情报内容关联程度评估;S600:对词准确程度、句子连贯程度、文章结构合理程度和科技情报内容关联程度的评估结果加权计算得到长文本科技情报质量评估值;S700:根据质量评估值改进所述模型。根据本发明提供的生成长文本科技情报模型的优化方法,对使用者先验知识依赖较少,可对生成预训练模型等多种自然语言处理模型文本生成效果进行评估并对模型进行改进。
基本信息
专利标题 :
生成长文本科技情报模型的优化方法
专利标题(英):
暂无
公开(公告)号 :
CN114298012A
申请号 :
CN202111675398.5
公开(公告)日 :
2022-04-08
申请日 :
2021-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
孙凤松董琦尚晓舟杨焱煜王锦宇
申请人 :
中国电子科技集团公司电子科学研究院
申请人地址 :
北京市石景山区双园路11号
代理机构 :
工业和信息化部电子专利中心
代理人 :
华枫
优先权 :
CN202111675398.5
主分类号 :
G06F40/216
IPC分类号 :
G06F40/216 G06F40/289 G06F40/242
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/216
使用统计方法
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载