﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>语源科技BlogJava-bbmonkey62笨笨猴</title><link>http://www.blogjava.net/bbmonkey62/</link><description>中文分词</description><language>zh-cn</language><lastBuildDate>Thu, 30 Apr 2026 09:41:09 GMT</lastBuildDate><pubDate>Thu, 30 Apr 2026 09:41:09 GMT</pubDate><ttl>60</ttl><item><title>淑珍分词器1.1.9版本源码开放下载</title><link>http://www.blogjava.net/bbmonkey62/archive/2010/08/16/328934.html</link><dc:creator>bbmonkey62笨笨猴</dc:creator><author>bbmonkey62笨笨猴</author><pubDate>Sun, 15 Aug 2010 16:26:00 GMT</pubDate><guid>http://www.blogjava.net/bbmonkey62/archive/2010/08/16/328934.html</guid><wfw:comment>http://www.blogjava.net/bbmonkey62/comments/328934.html</wfw:comment><comments>http://www.blogjava.net/bbmonkey62/archive/2010/08/16/328934.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.blogjava.net/bbmonkey62/comments/commentRss/328934.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/bbmonkey62/services/trackbacks/328934.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要: 这款发布的淑珍分词器版本是1.1.9，完全是基于字典分词，在提供下载的压缩包中含有编译好的jar包和所有的源代码，可以应用于Lucene3.0版本及以上中。<br>为了方便根据自己需要对分词器进行修改，我这里介绍一下淑珍分词器的核心数据结构，这个数据结构也是当初我在写分词器的时候，为了解决词库条目多和索引速度之间的相互制约而想出来的。<br>这个数据结构就是将词库中的每一个条目以一种特定的结构存储在JDBM或内存中，比如，对一个很常见的条目例子：“男女搭配干活不累”来举例子，在这种数据结构中，将被存储为如下key-value键值对：&nbsp;&nbsp;<a href='http://www.blogjava.net/bbmonkey62/archive/2010/08/16/328934.html'>阅读全文</a><img src ="http://www.blogjava.net/bbmonkey62/aggbug/328934.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/bbmonkey62/" target="_blank">bbmonkey62笨笨猴</a> 2010-08-16 00:26 <a href="http://www.blogjava.net/bbmonkey62/archive/2010/08/16/328934.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>解决在lucene中应用高亮显示所遇到的问题及ShuzhenAnalyzer-1.1.8发布</title><link>http://www.blogjava.net/bbmonkey62/archive/2009/04/17/266061.html</link><dc:creator>bbmonkey62笨笨猴</dc:creator><author>bbmonkey62笨笨猴</author><pubDate>Thu, 16 Apr 2009 16:49:00 GMT</pubDate><guid>http://www.blogjava.net/bbmonkey62/archive/2009/04/17/266061.html</guid><wfw:comment>http://www.blogjava.net/bbmonkey62/comments/266061.html</wfw:comment><comments>http://www.blogjava.net/bbmonkey62/archive/2009/04/17/266061.html#Feedback</comments><slash:comments>3</slash:comments><wfw:commentRss>http://www.blogjava.net/bbmonkey62/comments/commentRss/266061.html</wfw:commentRss><trackback:ping>http://www.blogjava.net/bbmonkey62/services/trackbacks/266061.html</trackback:ping><description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp; 摘要: 对于搜索引擎而言，如果是提供一个类似于Google那样的web界面搜索的话，那对搜索结果进行高亮显示就很重要且必要了，不然将是非常不友好的，本篇文章就是介绍在lucene中应用HighLighter时的一些方面；文章分两部分，第一部分是介绍如何在lucene中应用Highlighter进行高亮显示而不影响到搜索速度。第二部分则是对一些高亮错误现象进行分析并给出解决方法，以及纠正对高亮错误存在的认识误区。总之，这篇文章就是希望能彻底解决在lucene中应用高亮显示所遇到的一切问题！另外淑珍分词器也发布了新的版本ShuzhenAnalyzer-1.1.7，也给出了一个淑珍分词器的演示地址<br>&nbsp;&nbsp;<a href='http://www.blogjava.net/bbmonkey62/archive/2009/04/17/266061.html'>阅读全文</a><img src ="http://www.blogjava.net/bbmonkey62/aggbug/266061.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.blogjava.net/bbmonkey62/" target="_blank">bbmonkey62笨笨猴</a> 2009-04-17 00:49 <a href="http://www.blogjava.net/bbmonkey62/archive/2009/04/17/266061.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>