一种文本相似度确定方法、装置、设备及介质
公开
摘要
本公开实施例涉及一种文本相似度确定方法、装置、设备及介质,其中该方法包括:获取两个目标文本,目标文本为待处理多媒体的文本信息;确定每个目标文本的结构化标签;根据每个目标文本的结构化标签确定两个目标文本之间的相似度。采用上述技术方案,通过为非结构化的文本添加结构化标签,进而可以根据结构化标签确定两个非结构化的文本的相似度,结合不同粒度的结构化特征进行相似度确定,提升结果的置信度,进而有利于后续数据分析,避免出现分析不置信的问题。
基本信息
专利标题 :
一种文本相似度确定方法、装置、设备及介质
专利标题(英):
暂无
公开(公告)号 :
CN114298007A
申请号 :
CN202111599130.8
公开(公告)日 :
2022-04-08
申请日 :
2021-12-24
授权号 :
暂无
授权日 :
暂无
发明人 :
陈冉李国建刘洋洪进栋
申请人 :
北京字节跳动网络技术有限公司
申请人地址 :
北京市石景山区实兴大街30号院3号楼2层B-0035房间
代理机构 :
北京开阳星知识产权代理有限公司
代理人 :
吴崇
优先权 :
CN202111599130.8
主分类号 :
G06F40/194
IPC分类号 :
G06F40/194 G06F40/258 G06F40/216 G06F40/289 G06K9/62
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/194
计算文件之间的差异
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载