Java天空任我翱翔
语源科技BlogJava \| 首页 \| 发新随笔 \| 发新文章 \| 联系 \| 聚合 \| 管理	随笔：127 文章：27 评论：17 引用：0

Analyzer

Primary analyzers available in Lucene
Analyzer                          Steps taken
WhitespaceAnalyzer         Splits tokens at whitespace
SimpleAnalyzer                Divides text at nonletter characters and lowercases
StopAnalyzer        Divides text at nonletter characters, lowercases, and removes stop words
StandardAnalyzer      Tokenizes based on a sophisticated grammar that recognizes
               e-mail addresses, acronyms, Chinese- Japanese-Korean characters,
    alphanumerics， and more; lowercases;and removes stop words

发表于 2009-07-07 15:59 persister 阅读(258) 评论(0) 编辑收藏所属分类: Lucene/Nutch/Hadoop

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: Hadoop学习笔记（一） Lucene数据存储结构中的VInt（可变长度整型）第一次尝试Nutch PhraseQuery、SpanQuery和PhrasePrefixQuery 搜索引擎中对于输入查询关键词的一些考虑 Analyzer Porter stemming algorithm Lucene倒排索引原理 Lucene学习index Lucene的Query

2009年7月

日

一

二

三

四

五

六

常用链接

留言簿

随笔分类(158)

随笔档案(145)

文章分类(7)

算法(7) (rss)

收藏夹

Java Language (rss)

JAVA

Linux

ofbiz

基于Ofbiz的Web框架

Analyzer

常用链接

留言簿

随笔分类(158)

随笔档案(145)

文章分类(7)

收藏夹

JAVA

Linux

ofbiz

php

Security

sql

test

搜索

最新评论

阅读排行榜

评论排行榜