posts - 23,comments - 66,trackbacks - 0

2006-7-27

  • Compass - Compass #
    建立在lunce之上的搜索引擎
    Compass is a first class open source Java Search Engine Framework, enabling the power of Search Engine semantics to your application stack decoratively. Built on top of the amazing Lucene Search Engine, Compass integrates seamlessly to popular development frameworks like Hibernate and Spring. It provides search capability to your application data model and synchronizes changes with the datasource. With Compass: write less code, find data quicker.
  • 将Java应用注册为后台服务 - JustJava - BlogJava #
    这个将来可能会用得到的
    项目中有一个java应用程序,交付后用户要求要把这个程序做成后台服务程序,即:系统启动后该程序可以自动启动,并且在前台不要出现运行窗口,维护人员只要在“服务管理”(Windows)中选择启动或停止即可.

2006-7-25

  • 采访施瓦茨:Sun在赌什么? Java Sun 施瓦茨 - CSDN 新闻 #
    十多年前,华尔街曾强烈建议当时主要产品为工作站的Sun倒向微软尚在开发的芝加哥计划(Windows 95的开发代号)的怀抱。但是,Sun CEO麦克尼利却在“网络就是计算机”的理念下特立独行,终使Sun成为最大的Unix服务器供应商。  现在,华尔街又力劝Sun应该从Java上获得更多的利益。然而,施瓦茨出任Sun的CEO不足一个月,便做出了将开放Java源代码的承诺。施瓦茨在赌什么?
  • 也许是这个时代变化真得太快-嘟嘟老窝 #
    也许时代在变,现在讲究的是项目层面上软件开发,无论是MVC还是XP还是CMMI,大家都用心在楼宇的总体设计上,至于每个泥瓦匠的摸泥水平还是没颗螺丝的质量已经没人关心了,大家都相信砖混型的建筑已经过去,现在流行的是框架式楼,哪怕这层楼的砖头都掉光也不会倒塌。给项目经理汇报了下上面所述的那个问题,项目经理不在乎的说:部署时客户那儿用的是小型机,还怕这点循环速度吗?............我视为珍品的《计算机程序设计艺术》和《代码大全》准备压箱底了,也许是我老了,也许是这个时代变化真得太快。
  • 中文java技术网::用Java动态代理实现AOP #
    目前整个开发社区对AOP(Aspect Oriented Programing)推崇备至,也涌现出大量支持AOP的优秀Framework,--Spring, JAC, Jboss AOP 等等。AOP似乎一时之间成了潮流。Java初学者不禁要发出感慨,OOP还没有学通呢,又来AOP。本文不是要在理论上具体阐述何为AOP, 为何要进行AOP . 要详细了解学习AOP可以到它老家http://aosd.net去瞧瞧。这里只是意图通过一个简单的例子向初学者展示一下如何来进行AOP.
  • Java EE在SOA世界中的消亡? Java EE SOA - CSDN 新闻 #
    在未来的五年内,Java平台企业版(Java EE)将不再是主流的标准程序设计模型,伯顿集团的高级分析师Richard Monson-Haefel预测说,并且SOA的发展是导致这一结果的原因之一。
  • JR - 业界新闻 - 分析:SOA盈利渐露头角 #
    本周二,IBM 公布了略好于预期的第二季度业绩,很大一部分原因是其软件集团的强劲表现。IBM 的财务总监马克强调了WebSphere 中间件品牌的增长,以及对SOA 的投资。
  • 中文分词和词库 - Ruby on rails - JavaEye #
    前几天读到google研究员吴军的数学之美系列篇,颇有感触。而恰好自己前段时间做了个基于统计语言模型的中文切分系统的课程项目,于是乎,帖出来与大家共同学习。 分词技术在搜索引擎,信息提取,机器翻译等领域的重要地位与应用就不敖述了。步入正题:)
  • 进入 Harmony 世界: Apache Harmony 项目简介 #
    Apache Harmony 是 2005 年 5 月宣布的开放源码 Java SE 实现,本文是一个分 5 部分的系列文章的第一篇,这个系列主要介绍 Apache Harmony 项目的内部实现,最新发展现状和开源 Java 开发的模式,并鼓励和欢迎大家参与到 Harmony 的社区中来。本文是 5 个系列的第一篇,概括介绍了 Harmony 项目的背景,技术架构,社区运作和未来的方向。本文是 5 个系列的第一篇,概括介绍了 Harmony 项目的背景,技术架构,社区运作和未来的方向。
  • JR - 精品文章 - 开发J2EE应用应遵循的几点原则 #
    一般情况下,待开发的目标产品不宜采用过多的Framework。其一,J2EE各个技术发展很快,过多的Framework使得系统的后续升级、维护不利;其二,可以借鉴其中的好的一面,比如研究realMethods实现的相应的设计模式,并改造她以适合我们的项目需求;其三,Framework本身会有变动,如果选用过多,会给开发团队加重负担,从而不利于项目管理。有选择的使用现有的成熟Framework能提升大家的开发效率、开发水平。
  • Lucene in Action 中文版 - 重度研究 #
    不错
  • 东拉西扯:抓虾的机会 - 对牛乱弹琴 | Playin' with IT #
    抓虾的出现和去年豆瓣的出现有点儿像,都是猛不丁就出来一个看上去颇有点想法的网站,都是一看就大致能猜到是技术人员在背后操作,都是先借助口碑传播在一部分用户中取得声誉,都是网站的主人神龙见首不见尾,周围几乎没人知道这网站是谁做的。

2006-7-23

2006-7-22

2006-7-16

2006-7-12

  • UML软件工程组织 #
    JpetStore 4.0是ibatis的最新示例程序,基于Struts MVC框架(注:非传统Struts开发模式),以ibatis作为持久化层。该示例程序设计优雅,层次清晰,可以学习以及作为一个高效率的编程模型参考。本文是在其基础上,采用Spring对其中间层(业务层)进行改造。使开发量进一步减少,同时又拥有了Spring的一些好处…
  • 通过Jpetstore学习WSAD、ROSE、WEBSPHERE - [Matrix - 与 Java 共舞] #
    虽然IBM放弃了WSAD、ROSE的继续发展(取而代之的是Rational Software Architect),但作为一代经典的ROSE,到今天仍然是系统建模的有力工具。
  • 实现小数据量和海量数据的通用分页显示存储过程 - web开发 - CSDN技术中心 #
    建立一个 Web 应用,分页浏览功能必不可少。这个问题是数据库处理中十分常见的问题。经典的数据分页方法是:ADO 纪录集分页法,也就是利用ADO自带的分页功能(利用游标)来实现分页。但这种分页方法仅适用于较小数据量的情形,因为游标本身有缺点:游标是存放在内存中,很费内存。游标一建立,就将相关的记录锁住,直到取消游标。游标提供了对特定集合中逐行扫描的手段,一般使用游标来逐行遍历数据,根据取出数据条件的不同进行不同的操作。而对于多表和大表中定义的游标(大的数据集合)循环很容易使程序进入一个漫长的等待甚至死机。  更重要的是,对于非常大的数据模型而言,分页检索时,如果按照传统的每次都加载整个数据源的方法是非常浪费资源的。现在流行的分页方法一般是检索页面大小的块区的数据,而非检索所有的数据,然后单步执行当前行。  最早较好地实现这种根据页面大小和页码来提取数据的方法大概就是“俄罗斯存储过程”。这个存储过程用了游标,由于游标的局限性,所以这个方法并没有得到大家的普遍认可。

2006-7-10

  • Krugle #
    昨天看到了JExample,今天又看到了这个,看来代码搜索这个事情早就有人在做了,现在看来做的已经很不错了,现在需要做的就算爬遍所有的SVN,加入到我们宝贵的数据库,还要做一些基于主题和分类的提示,对于我们这些程序员来说用起来或许会更方便。
  • java在路上... #
    项目名称简单明了,java的简单持久化。就跟项目名称一样,一切都太简单了,完全可以不知道什么是数据库了。框架提供了一个Java对象/关系映射框架,它设计的目的正是为了使用方便。其中没有编写的XML文件,没有创建的表格,没有生成的ID,也没有主键...
  • XML 与 Java 技术: 用 Castor 进行数据绑定 #
    对于主要关心文档数据内容的应用程序,Java XML 数据绑定是一种代替 XML 文档模型的强大机制。本文中,企业 Java 专家 Dennis Sosnoski 介绍数据绑定,并讨论什么使它如此令人瞩目。然后,他向读者展示了如何利用 Java 数据绑定的开放源代码 Castor 框架来处理日益复杂的文档。如果您的应用程序更多的把 XML 作为数据而不是文档,您就会愿意了解这种处理 XML 和 Java 技术的简单有效的方法。
  • Java Examples - JExamples.com #
    太妙了,如果他的数据库能够再大一些,就更有发展前途咯
    2006-6-18

2006-6-16

  • The World As Best As I Remember It : Broken Windows Theory #
    vista每个程序员每年只有1000行的代码量,而US的平均代码量也只有6200,而在1999年有9000行。小项目考验的是技术,大型工程考验的是管理。上下沟通,会议效率,等等,都是问题。
    1,The original broken windows theory, first coined by Wilson and Kelling, describes the purported phenomenon whereby an abandoned warehouse with no broken windows is mostly left alone, but as soon as one window is broken, it acts as an open invitation to passers-by that it's open-season for rock-throwing.2,# Windows code is too complicated. It's not the components themselves, it's their interdependencies. An architectural diagram of Windows would suggest there are more than 50 dependency layers (never mind that there also exist circular dependencies). After working in Windows for five years, you understand only, say, two of them. Add to this the fact that building Windows on a dual-proc dev box takes nearly 24 hours, and you'll be slow enough to drive Miss Daisy.# Windows process has gone thermonuclear. Imagine each little email you send asking someone else to fill out a spreadsheet, comment on a report, sign off on a decision -- is a little neutron shooting about in space. Your innocent-seeming little neutron now causes your heretofore mostly-harmless neighbors to release neutrons of their own. Now imagine there are 9000 of you, all jammed into a tight little space called Redmond. It's Windows Gone Thermonuclear, a phenomenon by which process engenders further process, eventually becoming a self-sustaining buzz of fervent destructive activity.
  • RDF Site Summary (RSS) 1.0 #
    Rss学习之一-Rss1.0,其实挺简单的,就是一种简单的规定了几个tag的XML而已。
  • 什么是RSS?RSS及其发展历程 #
    什么是RSS呢?RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。发布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的XML格式,所以也能在其他的终端和服务中使用。

2006-6-15

  • BlogJava - 简易java框架 - 庆祝世界杯开幕,EasyJF官网全站源码对外开放! #
    EasyJF官网系统特点及主要功能   1、动态内容自动或手动生成静态htm文件。    2、菜单自动管理  3、在线模板管理  4、AJAX动态菜单  5、强大的网站信息发布功能   6、与官网其它系统的良好集成  7、后台全Java,模板页面便于维护。
  • BlogJava - 简易java框架 - Java Web中的入侵检测及简单实现 #
    在Java Web应用程中,特别是网站开发中,我们有时候需要为应用程序增加一个入侵检测程序来防止恶意刷新的功能,防止非法用户不断的往Web应用中重复发送数据。当然,入侵检测可以用很多方法实现,包括软件、硬件防火墙,入侵检测的策略也很多。在这里我们主要介绍的是Java Web应用程序中通过软件的方式实现简单的入侵检测及防御。  该方法的实现原理很简单,就是用户访问Web系统时记录每个用户的信息,然后进行对照,并根据设定的策略(比如:1秒钟刷新页面10次)判断用户是否属于恶意刷新。
  • BlogJava - 简易java框架 - 编码讨论---乱码问题之终极解决 #
    utf-8也有它的问题,在windows下的文本编辑工具,比如EditPlus,UltraEdit,后者还好些,默认生成的文本,比如是是一个js文件,就会采用默认编码存,而这个默认编码不是utf-8。那么在使用这个js文件的时候,就会出现问题,命名看到是相等的两个字符串,在javascript里比较就是不等,这样的问题,其实也会给开发带来很多麻烦。
  • demo@virushuo: 计算机专业生应该学什么 #
    收到一封mail,是一个计算机系大三学生写来的,想听听我的建议,面临将要毕业的关口,应该学点什么才能对将来有用。随后又有不少朋友通过mail,im等等方式询问我对这个问题的看法。想必是上次csdn视频聊天的节目引起了不少朋友的思考。
  • 指针、引用、数组和字符串,你真的全弄清楚了吗? - - CSDN技术中心 #
    好文啊
    一直以来我都被告知,引用就是一个别名,数组名就是一个常量指针,而字符串就是以'\0'结尾的字符数组,那么事实是否如此呢? 一、指针(pointer): (一)描述: 指针被存放在内存中,它的值是它指向的内存单元的地址。要足够保存这个地址,它的大小自然不会小于该机器的字长(准确来说,这也和编译器的实现有关:若在32位平台上使用16位的TC,则地址和指针仍是16位的)。 它提供了一种通过*运算符(dereference,解引用)来访问内存单元的方式。 ……

2006-6-14

2006-6-13

  • 如何正确选择开放源码的CMS - TechUpdate/技术新知 #
    去年,Builder.com的专栏作家Shelly Doll写过一篇文章,题为“开放源代码将彻底挤垮价值120万美元的CMS?”。这篇文章促使我更多地学习开源CMS,来发掘它们究竟能够带来什么以及其支持程度。
  • CMS内容管理系统概述[CMS帮助指南交流论坛] -- CMS资讯 | CMS研究 | CMS帮助... #
    内容管理系统被分离成以下几个层面:各个层面优先考虑的需求不同1,后台业务子系统管理(管理优先:内容管理):新闻录入系统,BBS论坛子系统,全文检索子系统等,针对不同系统的方便管理者的内容录入:所见即所得的编辑管理界面等,清晰的业务逻辑:各种子系统的权限控制机制等;2,Portal系统(表现优先:模板管理):大部分最终的输出页面:网站首页,子频道/专题页,新闻详情页一般就是各种后台子系统模块的各种组合,这种发布组合逻辑是非常丰富的,Portal系统就是负责以上这些后台子系统的组合表现管理;3,前台发布(效率优先:发布管理):面向最终用户的缓存发布,和搜索引擎spider的URL设计等……内容管理和表现的分离:很多成套的CMS系统没有把后台各种子系统和Portal分离开设计,以至于在Portal层的模板表现管理和新闻子系统的内容管理逻辑混合在一起,甚至和BBS等子系统的管理都耦合的非常高,整个系统会显得非常庞杂。而且这样的系统各个子系统捆绑的比较死,如果后台的模块很难改变。但是如果把后台各种子系统内容管理逻辑和前台的表现/发布分离后,Portal和后台各个子系统之间只是数据传递的关系:Portal只决定后台各个子系统数据的取舍和表现,而后台的各个子系统也都非常容易插拔。 内容管理和数据分发的分离:需要要Portal系统设计的时候注意可缓存性(Cache Friendly)性设计:CMS后台管理和发布机制,本身不要过多考虑“效率”问题,只要最终页面输出设计的比较Cacheable,效率问题可通过更前端专门的缓存服务器解决。 此外,就是除了面向最终浏览器用户外,还要注意面向搜索引擎友好(Search engine Friendly)的URL设计:通过URL REWRITE转向或基于PATH_INFO的参数解析使得动态网页在链接(URI)形式上更像静态的目录结构,方便网站内容被搜索引擎收录;
  • [转帖]CMS系统的演进[CMS帮助指南交流论坛] -- CMS资讯 | CMS研究 | CMS帮助... #
    以后CMS发展的方向我认为很大的一方面是内容的相关组织。目前各大网站最常用的提高访问量的招数就是在文章页底添加相关链接,一般是比较火暴的文章和图片,提升访问量非常显著。但这种方式比较死板,每篇文章下面的内容都一样,用户点了一次就不会点第二次。理想的效果是在文章下面添加相关的文章,而且不仅仅局限于CMS内部,应该将站外的相关内容都添加进去,只要用户觉得方便,别怕他不回来。另外一个方向就是内容来源多样化。例如新浪的CMS,目前似乎只能对手发文章进行比较好的管理,对于iask的内容,对于论坛的内容都是手动的编辑,目前似乎还能满足需要,但从长期来看,是肯定要变的。如果没有RSS的出现,内容来源的多样化还是一句空话,RSS出现后,站内的内容,站外的内容都可以通过RSS来传递。互联网的入口开始是门户,后来成了搜索引擎,就是因为搜索引擎可以提供来源多样化的内容,一个网站再大也只是一个网站,做再多的频道也就是一个网站,无法满足用户对于多样化,个性化的需要。未来的入口是什么,现在还说不定,但肯定是要对用户的胃口,不能我给你什么,你就看什么,而是看谁能提供给我最想看的东西,让我最少的动脑动手。我认为未来内容分化为两部分的趋势会逐渐显现出来。一部分提供底层的内容,博客服务提供商以及社区服务提供商会是主力,门户也是重要组成部分;另外一部分仅仅对内容进行组织,充当入口,只提供内容的链接,并不实质的存放内容。Google的ig是一个例子,微软的Live站略中RSS Live也是重中之重,Yahoo最近也提供了个性化的门户,这些都是引子,慢慢的戏会越来越好看。

2006-6-12

  • Python入门资源收集 - [米随随] s5s5 #
    Python 是一种解释性,面向对象,动态语义,语法优美的通用程序设计编程语言。已经成为世界上发展最快的语言之一!传说中大到OS,小到WEB他都可开发出来,强捍而又无敌!传闻中老外的 Google 、 BitTorrent ,国人的 豆瓣网就是基于Python设计制作出来的!但一般很难找到比较好的教程和文章,我最近收集了一些比较好的入门级的东东,大家共享~
  • 深入Python #
    OK,就学这个了
  • Python入门 #
    原著 Guido van Rossum翻译 李东风 * 第一章 介绍 * 第二章 解释程序的使用 * 第三章 基本使用 * 第四章流程控制 * 第五章 Python数据结构 * 第六章 模块 * 第七章 输入输出 * 第八章 错误与例外 * 第九章 类 * 第十章进一步学习
  • 简明 Python 教程 #
    不错
    版本:1.20A Byte of Python Copyright ?2003-2005 Swaroop C H简明 Python 教程 《简明 Python 教程》为 'A Byte of Python' 的唯一指定简体中文译本,版权 ?2005 沈洁元本书依照创作公用约定(署名-非派生作品-非商业用途) 发布。概要无论您刚接触电脑还是一个有经验的程序员,本书都将有助您学习使用Python语言。

2006-6-11

  • Garden of Evan: Apache HttpClient中文支持 #
    我看还是不要改httpClient,而采用US-ASCII形式处理数据接口
    HttpClient(version 3.0 rc4)的字符集处理在英文操作系统或英文环境中可能造成中文显示为乱码。一个比较简便的解决方法就是跟踪造成问题的源码,修改其字符集并重新编译使用。
  • ASP.NET2.0 的控件状态和视图状态探讨->>网页教学网(http://www.webjx.com)建站指南|网页制作|网页特效|Flash动画|网络编程|素材下载|教程下载|建站|HTML|CSS|JAVASCRIPT|ASP|PHP|JSP|ASP.NET|数据库 #
    原来ViewState持久性机制是用来使.net控件正常工作的,也就使说在EditPost.aspx页面里边显示发文的页面是通过控件实现的,为此使用了ViewState,那么这个ViewState要发回回去才能正常工作。
    控件状态-为了让控件正常工作,有时需要存储控件状态数据。例如,如果编写了一个自定义控件,其中具有显示不同信息的不同选项卡,为使该控件如预期一样工作,控件需要知道在往返过程中选择的是哪个选项卡。ViewState 属性可用于此目的,但开发人员可能在页级别关闭了视图状态,从而有效地中断控件。为解决此问题,ASP.NET 页框架在 ASP.NET 2.0 版中公开了一种称为控件状态的新功能。
  • 欢迎光临 - 琳婕小筑-老猫的理想 - ASP.NET 2.0 页面状态持续程序 - #
    ViewState持久性机制
    ASP.NET 控件的开发人员利用 ViewState 和控件状态来保持浏览器发出的各请求之间的状态信息。通常,该信息作为由页面呈现的 HTML 标记中的隐藏字段传送给客户端。然后,该页面状态作为下一个窗体提交的一部分传回服务器并还原给控件或页面。即使浏览器使用 HTTP 协议(该协议定义为无状态),但利用临时存储状态信息的功能,控件的开发人员能够轻松地提供更丰富的应用程序体验。

2006-6-10

  • 五种常见的ASP.NET应用程序安全缺陷_51CTO.COM--中国最大的网络技术网站 #
    今天试图做一个donews的自动发文功能,发现发文页面里边包含了一个hidden的__VIEWSTATE属性。考虑可能是这个破坏了我的程序的正常运行。后来在我申请的免费空间的上传页面上也发现了这个字段,查了一下,发现是摘要里边的解释。唉,看来简单的技术是突破不了了,难道还要去学加解密吗?
    ◎ 让隐藏域更加安全在ASP.NET应用中,几乎所有HTML页面的__VIEWSTATE隐藏域中都可以找到有关应用的信息。由于__VIEWSTATE是BASE 64编码的,所以常常被忽略,但黑客可以方便地解码BASE 64数据,用不着花什么力气就可以得到__VIEWSTATE提供的详细资料。 ■ 风险分析 默认情况下,__VIEWSTATE数据将包含: ⑴ 来自页面控件的动态数据。 ⑵ 开发者在ViewState中显式保存的数据。 ⑶ 上述数据的密码签字。 ■ 解决方案设置EnableViewStatMAC='true',启用__VIEWSTATE数据加密功能。然后,将machineKey验证类型设置成 3DES,要求ASP.NET用Triple DES对称加密算法加密ViewState数据。
  • Nirvana Studio ?Blog Archive ?Python 不是 Java [Anonymoused] #
    sounds different mind in different language
    我在检查代码的时候发现他们写了很多对Java有意义但是对Python却很恐怖的东西。并不是因为“Python比Java慢”,而是因为在Python中有更方便的方法去完成同样的目标,甚至在Java中不可能的事情。
  • Nirvana Studio ?Blog Archive ?为什么PHP令人不爽(对于大型系统) [Anonymoused] #
    对于非常小的项目,它可以是一个十分符合人意的编程语言。但是对于较大的和更为复杂的项目,PHP就显出他的薄弱了。当你不断地摸索之后,你会发现我提到的某些问题的解决方案。所以,当解决方案已知之后,为什么不能修正他呢?另外为什么这些修补不在手册中提到呢?一个开源的语言十分流行是一件好事。但不幸得是,它不是一个伟大的语言。我希望所有的问题能有一天得到解决(也许在PHP6?),然后我们就将拥有一个开源语言,他既开源,又好用。到现在,当你要启动一个多于5个脚本页面的项目的时候,你最好考虑C#/ASP.Net 或者 Java/JSP或者也许Python同样是一个更好的选择。
  • Python - Wikipedia [Anonymoused] #
    比较一下perl和python吧
    Python也被称为是一门清晰的语言。因为它的作者在设计它的时候,总的指导思想是,对于一个特定的问题,只要有一种最好的方法来解决就好了。这在由Tim Peters写的python格言(称为The Zen of Python)里面表述为:There should be one-- and preferably only one --obvious way to do it. 有意思的是,这正好和Perl语言(另一种功能类似的高级动态语言)的中心思想TMTOWTDI(There's More Than One Way To Do It)完全相反。这似乎是人们常把Perl和Python互相比较的重要原因。
  • Perl - Wikipedia [Anonymoused] #
    感觉用wiki看的更明白
    Perl(Practical Extraction and Report Language)是一种脚本语言。最初的设计者为拉里沃尔(Larry Wall),它於1987年12月18日發表。Perl借取了C、sed、awk、shell scripting以及很多其他程式語言的特性。其中最重要的特性是他内部集成了正则表达式的功能,以及巨大的第三方代码库CPAN。
  • BlogBus 公告板 - BlogBus.Com #
    也许明年就来这儿了
  • Java趋势:脚本语言引领风骚  [Java] #
    只用了短短的8年时间,却好像已经成长了35年,Java已经迅速在广泛的领域中找到了自己的位置:P2P、开放源代码、无线应用、嵌入式应用程序以及将要命名的某些应用。很难追踪Java的具体方向,因为它在每个领域都正处于领导地位。  现在,让我们看看Java领域中日益增长的脚本语言的影响。
  • windows下Perl开发环境的安装和配置|计算机基础教程网|CGI #
    看看perl,用脚本处理文件应该比java效率高些。

2006-6-9

  • Jericho HTML Parser #
    another html parser
    FeaturesThe library distinguishes itself from other HTML parsers with the following major features: * It is neither an event nor tree based parser, but rather uses a combination of simple text search, efficient tag recognition and a tag position cache. The whole source document is first loaded into memory, and then only the relevant segments searched for the relevant characters of each search operation. * Compared to a tree based parser such as DOM, the memory and resource requirements are far better as only nodes relevant to each search are parsed. Incorrect or badly formatted HTML, or any server or client side code, scripts or macros, have little or no influence on the parsing of the elements of interest, unlike tree based parsers which must identify every node in the document from top to bottom. * Compared to an event based parser such as SAX, the interface is on a much higher level and more intuitive, and a tree representation of the document is easily created if required. * The beginning and end positions in the source document of all parsed segments are accessible, allowing modification of only selected segments of the document without having to reconstruct the entire document from a tree. * The row and column number of each position in the source document is easily accessible. * Provides a simple but comprehensive interface for the analysis and manipulation of HTML form controls, including the extraction and population of initial values, and conversion to read-only or data display modes. Analysis of the form controls also allows data received from the form to be stored and presented in an appropriate manner. * ASP, JSP, PSP, PHP and Mason server tags can be registered for recognition by the parser, and are recognised as accurately as is possible without incorporating actual parsers for these languages into the library. The library then allows any of these segments to be ignored when parsing the rest of the document so that they do not interfere with the HTML syntax. (see Segment.ignoreWhenParsing()) * Custom tag types can be easily defined and registered for recognition by the parser.
  • HTMLParser Home Page #
    真的很需要一个好用的html parser,每次从一个response中按照字符串这么找可真是费了劲了

2006-6-8

2006-6-7

2006-6-4

  • JVM的垃圾回收机制详解和调优 — JAVA频道 - 赛迪网 #
    -Xms,-Xmx一般设为同样大小。 800m -Xmn 是将NewSize与MaxNewSize设为一致。320m -XX:PerSize 64m -XX:NewSize 320m 此值设大可调大新对象区,减少Full GC次数 -XX:MaxNewSize 320m -XX:NewRato NewSize设了可不设。4 -XX: SurvivorRatio 4 -XX:userParNewGC 可用来设置并行收集 -XX:ParallelGCThreads 可用来增加并行度 4 -XXUseParallelGC 设置后可以使用并行清除收集器 -XX:UseAdaptiveSizePolicy 与上面一个联合使用效果更好,利用它可以自动优化新域大小以及救助空间比值
  • JVM详解之Java垃圾回收机制详解和调优 — JAVA频道 - 赛迪网 #
    Sun HotSpot 1.4.1使用分代收集器,它把堆分为三个主要的域:新域、旧域以及永久域。Jvm生成的所有新对象放在新域中。一旦对象经历了一定数量的垃圾收集循环后,便获得使用期并进入旧域。在永久域中jvm则存储class和method对象。就配置而言,永久域是一个独立域并且不认为是堆的一部分。默认状态下,HotSpot在新域中使用复制收集器。该域一般分为三个部分。第一部分为Eden,用于生成新的对象。另两部分称为救助空间,当Eden 充满时,收集器停止应用程序,把所有可到达对象复制到当前的from救助空间,一旦当前的from救助空间充满,收集器则把可到达对象复制到当前的to救助空间。From和to救助空间互换角色。维持活动的对象将在救助空间不断复制,直到它们获得使用期并转入旧域。使用-XX:SurvivorRatio 可控制新域子空间的大小。
  • Java 的 HTTP 文件队列下载 #
    destUrl='http://www.ebook.com/java/网络编程001.zip'; url = new URL(destUrl); httpUrl = (HttpURLConnection) url.openConnection(); //连接指定的网络资源 httpUrl.connect(); //获取网络输入流 bis = new BufferedInputStream(httpUrl.getInputStream());
  • 使用Doxygen构建文档系统 #
    Doxygen是一种开源跨平台的,以类似JavaDoc风格描述的文档系统,完全支持C、C++、Java、Objective-C和 IDL语言,部分支持PHP、C#。注释的语法与Qt-Doc、KDoc和JavaDoc兼容。Doxgen可以从一套归档源文件开始,生成HTML格式的在线类浏览器,或离线的LATEX、RTF参考手册。对于未归档的源文件,也可以通过配置Doxygen来提取代码结构。或者借助自动生成的包含依赖图(include dependency graphs)、继承图(inheritance diagram)以及协作图(collaboration diagram)来可视化文档之间的关系。Doxygen生成的帮助文档的格式可以是CHM、RTF、PostScript、PDF、HTML和Unix man page等。

2006-5-31

2006-5-28

2006-5-27

  • BlogJava - 風向逆轉 - 就要爪哇 - [收藏]HTTP代理如何正确处理Cookie #
  • BlogJava - lmsun - HttpClient and FileUpload--Jakarta Commons 下的工具 #
    Upon executing the class PostAFile, the JSP gets invoked, and the output displayed on the server console is as follows:content-type = text/xml; charset=ISO-8859-1user-agent = Jakarta Commons-HttpClient/2.0rc1host = localhost:8080content-length = 279The output shown on the console where the PostAFile class was executed is as follows:File Length = 279statusLine>>>HTTP/1.1 200 OKNote that the output on the server shows the content length as 279 (bytes), the same as the length of the file students.xml that is shown on the application console. Because you are not invoking the JSP using any browser, the User-Agent header that normally states the browser specifics shows the HttpClient version being used instead. NOTE In this example, you sent a single file over HTTP. To upload multiple files, the MultipartPostMethod class is a better alternative. You will look at it later in the “Introducing FileUpload” section.
  • BlogJava - 花钱的年华 - 又到预测时,what will be cool in 2006? #
  • BlogJava - zhaozhao #
  • Jetspeed项目的介绍 [和讯博客] #
    企业门户是一个庞大的系统工程,也许对于成熟的开发团队来讲就像搭积木一样没有技术含量,但对于缺少项目经验的生疏者来说是一个巨大的门槛。Jetspeed这样一个东西给了我们,也不会用,因为不懂里边的概念和业务,所以,还是安心钻研一点技术吧。
  • 什么是Portal [和讯博客] #
    什么是Portal?Portal是一个基于web的应用程序,它主要提供个性化、单点登录、不同来源的内容整合以及存放信息系统的表示层。

2006-5-26

2006-5-25

2006-5-24

2006-5-21

2006-5-20

  • SteveStreeting.com ?Java will be open source #
    java要开源了,这可是个利好的消息,昨天看了金碟技术总监对于J2EE 5.0的看法,感觉java的发展相对于外围的组件显得慢很多,而且组件多起来了,使开发者会选择各种不同的组件实现系统,没有j2ee指导的这种开发模式,在j2ee一旦发布新版本以后就会产生翻天地覆的变化,这对于企业的开发成本来说是很高的,对于技术人员来说也需要熟悉更多的组件以跟踪技术发展。另外,j2ee的版本更新过慢可能会导致主要组件主导开发,而失去j2ee权威性的事情发生,j2ee本身掌控全局的能力可能会越来越差。所以我觉得开源是一件好事儿,用apache式的开发,设立子项目,用不断推出的各方面的组件来主导用户的开发。版本的更新速度也会加快,在新技术方面的更新上可以和微软的.net拼一拼了。

2006-5-20

2006-5-18

2006-5-16

2006-5-11

2006-5-10

2006-5-9

2006-5-8

  • 认识WebService- Run Hubro Run #
    web service
  • 架构Web Service: 为什么需要Web服务? #
    看了上一段的描述,大家可能会认为这需要一个技术上的更本性变革,其实,不然。基于XML技术的Web服务正是解决这一问题的最佳手段。Web服务的使用将改变目前的开发模式和应用部署的费用规模。各种Web服务分表实现了一定的电子商务功能,通过将各种电子商务的Web服务进行组合和集成以创建动态电子商务应用。Web服务能够统一地封装信息、行为、数据表现以及商务流程,而无需考虑应用所在的环境是使用何种系统和设备。
  • HOWTO: Write a Summer of Code application | drupal.org #
    Tell us how to write a SOC application

2006-4-22

只可惜这几篇文章因为最近研究CG框架的原因还都没有时间看,等做完这个一定补上,好好研究一下。

2006-4-19

posted on 2006-06-18 01:38 rd2pm 阅读(2698) 评论(0)  编辑  收藏 所属分类: other

只有注册用户登录后才能发表评论。


网站导航: