倒排参考句形分词技术
发明专利申请公布后的驳回
摘要

倒排参考句形分词技术是一种基于参考句形、词语搭配的分词技术。其方法是首先建立某种语言的参考句型(含词语搭配、词组、词语,下同)S数据库,给出句型编号n,统计出参考句型、词语搭配所包含的字符元数k。然后建立包含所有字符元的倒排文件,在每个字符元后列出包含该字符元的所有参考句型编号n,即倒排参考句型。对需要分词的句子T所有字符元P1、P2、P3…Pm,根据倒排文件对参考句型数据库进行累计标示,得到参考句型Sn包含T的字符元个数j。j=k的句型Sn为T的可参考句型,参照这些句型对T进行分词,一般以j值大的句型优先参考。j<k的句型也可以作一定程度的参考。倒排参考句形分词技术本质是基于语义的分词技术,可以提高分词水平,可用于语音输入、机器翻译、搜索引擎等方面。

基本信息
专利标题 :
倒排参考句形分词技术
专利标题(英):
暂无
公开(公告)号 :
CN1963806A
申请号 :
CN200510110079.4
公开(公告)日 :
2007-05-16
申请日 :
2005-11-07
授权号 :
暂无
授权日 :
暂无
发明人 :
徐文新
申请人 :
徐文新
申请人地址 :
200433上海市杨浦区邯郸路220号复旦大学中文系博士后流动站博士后信箱
代理机构 :
代理人 :
优先权 :
CN200510110079.4
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30  G06F17/27  
法律状态
2014-05-14 :
发明专利申请公布后的驳回
号牌文件类型代码 : 1602
号牌文件序号 : 101700819998
IPC(主分类) : G06F 17/30
专利申请号 : 2005101100794
申请公布日 : 20070516
2008-12-24 :
实质审查的生效
2007-05-16 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332