准备特别版本 jdk
请问这个特别版本的哪儿有下载?
你好,笨笨,我刚刚研究lucene,现在面临的问题也是中文的全文检索,
我的问题正好和你相反,我返回的数据太多了。
比如搜索的keyword是[高考]会被拆分为[高][考]两个字进行检索。
这样的话检索大量数据的时候就会很慢,而且我做了关键字的高亮显示
这样一来,比如标题为【2008年北京考区高考状元】那么被高亮后为
2008年北京[考]区[高][考]状元,这样看起来很不好,怎么样可以按着【词】来
建立索引呢,然后按着【词】进行检索并高亮,头疼的问题,可以和您讨论一下嘛?
其他的朋友也欢迎讨论。希望您能联系我一下,QQ396615834 MSN wind_1121@hotmail.com 十分感谢。
很好的东西啊 呵呵 可惜缺少些jar
能不能送我啊 litao1258@126.com
多谢
re: DTP/XA 规范及XA API调用研究 szwuzh 2008-04-20 23:26
哥们,哪里有中文版的啊?看英文的眼花啊
论文辅导或帮助发表过程中,百分百保证客户隐私,客户委托的内容,其版权属于客户,本站保证不在其它任何地方出现,也不会在网上发布。
值班QQ:871249981 448787015联系电话:13585626361
1、 本站站长毕业于复旦大学中文系,现在上海某高校就职,对论文写作-辅导-发表各环节驾轻就熟。站内服务人员全部具有硕、博士以上学位,部分海归人员加盟。
2、本站联系的期刊均为国家新闻出版署批准的正式公开出版发行的有CN/ISSN刊号的杂志。若因我站原因致使不能发表,全额退款。代写国内外各种论文,论文翻译。
3、论文辅导或帮助发表过程中,百分百保证客户隐私,客户委托的内容,其版权属于客户,本站保证不在其它任何地方出现,也不会在网上发布。
联系地址:上海杨浦区邯郸路220
值班QQ:871249981
448787015
联系电话:13585626361
联系邮箱:lunwenfuwu@163.com
re: DTP/XA 规范及XA API调用研究 kailelv 2008-03-24 17:57
大哥,还有一本中文的啊,我现在在看英文,看起来很吃力
re: Java 与 C 性能比较的一些经验数据 zhengyk 2008-03-17 13:58
netbean作为C/C++开发IDE也不错,而且跨平台,可以在Linux下进行可视化的跟踪调试!
想法其实不错,不过有些说法需要实践来证明。上来就说“ Java跟C语言相比, 代码执行速度其实并不慢”,“实际上C语言访问数据库要比Java访问数据库快1到两个数量级”缺乏税赋力。
其实我反而觉得j2ee访问数据库慢不完全因为jdbc,更多的是数据库本身就慢,设计有问题或者查询策略有问题。
还有一个瓶颈就是对象序列化。目前应用最广的webservice可以说也是最缓慢最消耗资源的,相对的就得到了对各种平台的良好兼容和支持。
j2ee应用还有一个大毛病就是太费内存,当然换来的是程序的可靠性,平台无关性。
分布式事务我没那么多经验,就不发表太多评论。
你说的JSRB可能确实不错,不过我认为还需要再进行论证。至少从阅读了本文之后还没真正感觉到太多惊喜。
我觉得现在的企业应用大多会吧降低程序和设计复杂度放在首位。如果这方面做的比较好可能更吸引人。
"业务系统中用到的概览很小"中的概览是不是概率?
干得好,我试试去,原本以为不能用呢。几个朋友都没成功
谢谢提醒,个人经验是凡是涉及到网络传输的远程调用如JDBC,RMI,它的执行时间,就是从客户端发起请求到获取返回数据,耗费时间一般在N毫秒不等.
而普通方法执行的时间,根据复杂度的不同,最少的可以用纳秒计算(例如log4j的check时间),时间长点的用微秒计算也合适.
因为SERVICE的调用开销非常大(一般的远程调用都是以毫秒记,而普通方法的调用开销是以微秒或纳秒为单位的).
这个结论怎么得出的?
楼主知道微秒和纳秒是什么概念吗?
re: 软件民工与龙芯:另一种视角 benewu 2007-12-06 13:34
分析得好!
re: Java 与 C 性能比较的一些经验数据 blue gene 2007-10-01 19:01
看看这篇文章的时间是05年,而现在是07年,做测试的版本是jdk1.4,而现在已经是jdk1.6了,今非昔比了。
re: 中文全文检索的实现以及一些经验(Java) active1001 2007-08-02 14:04
用lucene检索的时候,结果少的原因,应该是,你查询的时候用的分词器不对。
在查询之前先把每个字直接加一个空格。例如:“中文检索”-》“中 文 检 索”。
笨笨啊,我有点迷茫。能给解答一下吗?
公司的站内搜索OK了,但领导让我继续研究研究搜索,但我不知道该继续去研究什么好了。
中文分词?目前使用的模块(JE)还可以,如果自己研发需要不少时间,还有词库问题。
爬虫?我们是站内搜索,虽然头说站外也是个方向,但很不明确,我对没有明确需求的东西实在不感兴趣。
分布式?目前的量还没必要(几百万),差的很远的,而且如果一直站内搜索的话也很难用上。
缓冲?这个很有用,但目前实在没有太好的想法。
目前站内搜索的状况就是正常运行,没什么错误,也不知道该改些什么。很迷茫。(还有个项目相反,能正常运行,但我还有很多想法,但领导说我在那个项目浪费太多时间了,不许我再做了,能运行就行。-_-!)
最近很怪,我对搜索的研究很迷茫,对用户的需求倒是很感兴趣。我一直在思考自己的东西最终能给用户带来什么,如何让用户更加方便的使用。
嗯。。。就是很迷茫,有啥好的建议吗?
re: 中文全文检索的实现以及一些经验(Java) sitinspring 2007-07-31 17:08
这个有技术含量.
re: 中文全文检索的实现以及一些经验(Java) BruceLuo 2007-07-31 14:59
都是的分布式的,索引和爬取基本上都是用的C++,WEB层用的是PHP,这是完美的结合!
说起来,Lucene的性能似乎不行啊(我没测试过啊,只是网上资料说明)。似乎千万级别就比较慢了。前段日子用Lucene开发了个站内搜索(数据量大概在几百万吧),感觉无论是搜索(其实还好,在可接收范围内)和索引都有点慢。有没更好的实现啊?那些真正的能承受较大压力的搜索都是怎么开发的?谁知道?
TUXEDO/CICIS?靠,全没听说过啊。深了。
页面用java?我觉得现在php、ruby编写页面更快、更灵活啊。那java还有啥用啊?像j2ee这些东西的意义何在呢?迷茫啊。
对了,老大都用啥C的开发工具和编译器啊。感觉比java下少好多。也没个让我喜欢的(java下我最喜欢IDEA、实在不行还有NetBean和Eclipse可用)。vc太大,bcb下载太麻烦,不是注册就是要填调查,填了也不让我下,好不容易下了个cgywin不会用,郁闷。大大把自己的环境发上来,参考参考吧。我算是C、c++初学者吧。咦。
re: 中文全文检索的实现以及一些经验(Java) princegsc 2007-07-31 10:33
用正则表达式啊
Java与C性能的差距,主要差距表现在:
1 IO/数据库访问的效率
2 Web Server(Java Servlet Container)的IO效率
但是C的问题还是出在开发代价高,出问题查找困难,通用基础构架少。在企业级市场中,性能其实不是最主要的关注因素,快速实现需求,缩短开发周期反而是首要目标。
因此在许多大企业中,真正的核心业务采用C/TUXEDO/CICIS写,保证高效。页面采用Java写,保证开发的快速和灵活。
差距这么大?10倍的差距?那如果用C或C++编制多层web应用,应该有更高的效率啊。为啥大家很少用呢?大大详解一下。目前对这方面的研究比较有兴趣。
re: 中文全文检索的实现以及一些经验(Java) BruceLuo 2007-07-31 08:52
看一下。。。。。。
re: 正则表达式说明 wfyang 2007-07-21 11:09
好东西哦,赞一个
re: DC相片压缩小工具 qiang 2007-06-08 11:13
压小
re: Java中文&编码问题小结 loocky 2007-05-25 16:29
说实话我感觉很乱
要分 JDK .
IBM JDK 始终输出 Thread Dump到某个文件中。
Sun/Jrockit JDK 会输出到 stdout 中。
对于 Sun/JRockit JDK,最简单的办法 是重定向 stdout 到某个文件: java xxxx > xxx.out
最复杂的办法是用 JNI 实时修改 STDOUT/STDERR handler。
thread dump的结果太长了,
如何能让thread dump的结果输出在文件中?
re: 正则表达式说明 vchengyun 2007-04-12 12:44
@versa
import java.util.regex.*;
似乎要在 Eclipse 设置中将相关的显示字体设置为“宋体-超大字符集”,可以试一试。
re: JDK 1.5 对超大字符集的支持 扇影丹青 2007-03-19 00:22
请问怎么才能让我的eclipse的editor和console显示unicode增补字符?
好像就只能显示到0xffff
之后的都是问号
谢谢!
Debain Linux for loongson 2E, 32位。
kernel 2.6.18
java hotspot client jvm 1.5
龙芯盒子用的是什么操作系统?linux?跑的动吗? :)
re: DC相片压缩小工具 hth 2006-12-11 12:13
sdadas
re: 正则表达式说明 傻傻 2006-08-09 12:26
好,多谢了,
re: 正则表达式说明 versa 2006-06-29 09:59
你好,非常感谢你提供了这份文档,
但是对Java正则语法的中文扩展方向是不是需要其他的包呢,
对于如下的一小段代码,
String str = "我 爱!";
//\p{InQuqnJiao}
Pattern p = Pattern.compile("\\p{InBig5}\\s");
Matcher m = p.matcher(str);
if(m.find()){
System.out.println(str.substring(0,m.end())+".");
System.out.println(str.substring(m.end(),str.length())+".");
}
系统抛出:
java.util.regex.PatternSyntaxException: Unknown character family {Big5}
希望得到你的回复,谢谢!
re: JVM 内存结构的一张小图 1 2006-05-31 17:29
1111111111111
re: 架构师的工作 Mover 2006-05-10 09:57
我对这玩意真的一窍不通。
re: Java中文&编码问题小结 笨笨 2006-03-16 11:11
文章浏览过了。
东西挺多,但是觉得有点乱。
还有关于 Unicode 部分,看起来主要说的是 UTF-8编码,UTF-16/32 甚少涉及。
re: Java中文&编码问题小结 bbdos 2006-03-16 10:55
--字符集编码
1. 概述
本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。
在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。
2. 编码基本知识
最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。(文章详细内容请访问以下链接
http://china.eceel.com/article/study_for_character_encoding_java.htm )
re: Java中文&编码问题小结 bbdos 2006-03-16 10:52
探讨下啊
re: Java中文&编码问题小结 小飞侠 2006-03-14 18:08
楼主总结的很全啊 看了以后感触很深~~非常感谢!
re: With or Without EJB? Null Lee 2006-03-08 21:44
Rod的观点是即便从性能角度考虑也应该without EJB。
re: JVM 内存结构的一张小图 dudu 2006-02-06 19:13
图片太大, 建议使用摘要方式发布。
re: JVM 内存结构的一张小图 Samuel Cai 2006-02-06 14:49
不错