网站导航免费论文 原创论文 论文搜索 原创论文 网学软件 学术大家 资料中心 会员中心 问题解答 原创论文 论文素材 设计下载 最新论文 下载排行 论文上传 在线投稿 联系我们
返回网学首页
网学联系
最新论文 推荐专题 热门论文 素材专题
当前位置: 网学 > 编程文档 > C# > 正文
KTDictSeg 分词组件1.3版本 新增功能列表
来源:Http://myeducs.cn 联系QQ:点击这里给我发消息 作者: 用户投稿 来源: 网络 发布时间: 12/10/14
下载{$ArticleTitle}原创论文样式

 1、 修改字典格式,提高字典加载速度

 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来

 3、 增加词频判断功能,在无法取舍时根据词频取舍

 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst

 5、 增加中文人名前后缀统计和根据该统计定位人名的功能

 6、 增加中文人名和未登录词出现频率统计功能

 7、 增加自动更新字典功能,对超过阈值的人名和未登录词自动插入字典 需打开 AutoInsertUnknownWords 开关 并设置 UnknownWordsThreshold,(不推荐自动插入,推荐手工插入)

 8、 增加定期保存字典和统计结果功能 需设置 AutoSaveInterval

 9、 增加KTDictSeg.xml配置文件来配置分词参数

 10、增加对Lucene.net 的支持,提供 KTDictSegAnalyzer 分析器给Lucene.net

 11、增加字典管理功能,可以添加删除修改字典

 12、字典管理中提供从未登录词中批量插入字典功能,可帮助使用者手工选择合适的未登录词插入字典(推荐)

 13、提供一个新闻搜索的简单例子,采用Lucene.net+KTDictSegAnalyzer+KTDictSeg,项目名为Demo.KTDictSegAnalyzer

网学推荐

免费论文

原创论文

浏览:
设为首页 | 加入收藏 | 论文首页 | 论文专题 | 设计下载 | 网学软件 | 论文模板 | 论文资源 | 程序设计 | 关于网学 | 站内搜索 | 网学留言 | 友情链接 | 资料中心
版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
Copyright 2008-2015 myeducs.Cn www.myeducs.Cn All Rights Reserved
湘ICP备09003080号