基于内容的文档自动分类入库方法
实质审查的生效
摘要
本发明提供了基于内容的文档自动分类入库方法,属于文档处理技术领域,旨在解决文档进行人工分类管理耗费时间的问题;包括以下步骤:对待分类的电子文档进行内容识别并表示为对应于电子文档的词频向量;根据电子文档的词频向量输出电子文档的内容类别属性;根据电子文档的词频向量计算电子文档在相关联的特征空间中的特征向量占比;根据文档的特征向量占比最大值向对应的特征空间输入电子文档数据;根据文档读取的检索词与特征空间进行匹配,并将相应的特征空间内的电子文档数据进行读取反馈;本发明的设计,能够根据文档内容进行自动分类入库存储,实现了文档的高效存储;便于对文档进行分类管理,节省人工分类时间,提高工作效率。
基本信息
专利标题 :
基于内容的文档自动分类入库方法
专利标题(英):
暂无
公开(公告)号 :
CN114328911A
申请号 :
CN202111477683.6
公开(公告)日 :
2022-04-12
申请日 :
2021-12-06
授权号 :
暂无
授权日 :
暂无
发明人 :
付睿智田苗张建斌
申请人 :
苏州海赛人工智能有限公司;付睿智
申请人地址 :
江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区月亮湾路10号慧湖大厦北楼501室
代理机构 :
北京中政联科专利代理事务所(普通合伙)
代理人 :
李延峰
优先权 :
CN202111477683.6
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06F16/31
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G06F 16/35
申请日 : 20211206
申请日 : 20211206
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载