一种基于自信息损失补偿的机器生成文本检测方法
授权
摘要

本发明涉及一种基于自信息损失补偿的机器生成文本检测方法,包括首先确定细分领域并对爬取到的数据进行清洗,再对数据集中的文本数据进行分词并处理为固定长度,通过词嵌入工具得到文本数据的初始词向量表示矩阵,基于矩阵进行编码获得文本双向信息,然后拼接双向信息,编码逻辑特征并捕获最大特征,对捕获的特征进行自信息损失补偿输入全连接层,本发明方法学习领域文本中的逻辑信息,包括词序逻辑、上下文承接逻辑、句子间主题一致性逻辑等逻辑信息,提高文本分类的准确性。对学习过程中损失的有价值信息利用文本自身信息进行补偿,补足了词序信息丢失这个短板,提升了文本分类准确率,减少了人为操作的工作量。

基本信息
专利标题 :
一种基于自信息损失补偿的机器生成文本检测方法
专利标题(英):
暂无
公开(公告)号 :
CN112580351A
申请号 :
CN202011631513.4
公开(公告)日 :
2021-03-30
申请日 :
2020-12-31
授权号 :
CN112580351B
授权日 :
2022-04-19
发明人 :
冯翱王维宽宋馨宇张学磊张举蔡佳志
申请人 :
成都信息工程大学
申请人地址 :
四川省成都市西南航空港经济开发区学府路1段24号
代理机构 :
成都智涌知识产权代理事务所(普通合伙)
代理人 :
张洪
优先权 :
CN202011631513.4
主分类号 :
G06F40/289
IPC分类号 :
G06F40/289  G06F40/284  G06F40/30  G06K9/62  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/289
短语分析,例如有限状态技术或分块
法律状态
2022-04-19 :
授权
2021-04-16 :
实质审查的生效
IPC(主分类) : G06F 40/289
申请日 : 20201231
2021-03-30 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332