一种基于深度学习的克隆代码语义检测方法
授权
摘要

本发明公开了一种基于深度学习的语义克隆检测方法,对于给定代码块对,首先将代码块预处理成TPE的基本单元的序列,然后对它们进行词嵌入操作,用于上下文特性组合的BiLSTM模块;接着,用自注意力机制来集中提取神经网络学习到的克隆代码相关有用信息;将每一个代码片段都被转化为一个向量表示,计算向量之间的欧几里得距离作为分类的特征,对它们进行二分类:如果两个代码块相似,则其经过神经网络生成的向量应该相近,即预测克隆/非克隆。与现有技术相比,本发明的更节省时间,同时可以捕获丰富的语法和语义信息;TPE还可以避免词汇量不足(OOV)的问题。

基本信息
专利标题 :
一种基于深度学习的克隆代码语义检测方法
专利标题(英):
暂无
公开(公告)号 :
CN112215013A
申请号 :
CN202011205774.X
公开(公告)日 :
2021-01-12
申请日 :
2020-11-02
授权号 :
CN112215013B
授权日 :
2022-04-19
发明人 :
成肖云王建荣王赞贾勇哲马国宁
申请人 :
天津大学
申请人地址 :
天津市南开区卫津路92号
代理机构 :
天津市北洋有限责任专利代理事务所
代理人 :
李素兰
优先权 :
CN202011205774.X
主分类号 :
G06F40/30
IPC分类号 :
G06F40/30  G06F40/284  G06N3/04  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/30
语义分析
法律状态
2022-04-19 :
授权
2021-05-25 :
专利申请权、专利权的转移
专利申请权的转移IPC(主分类) : G06F 40/30
登记生效日 : 20210512
变更事项 : 申请人
变更前权利人 : 天津大学
变更后权利人 : 天津大学
变更事项 : 地址
变更前权利人 : 300072 天津市南开区卫津路92号
变更后权利人 : 300072 天津市南开区卫津路92号
变更事项 : 申请人
变更后权利人 : 天津泰凡科技有限公司
2021-01-29 :
实质审查的生效
IPC(主分类) : G06F 40/30
申请日 : 20201102
2021-01-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332