FORTUNE

THE WAY TO THE MASTER...
posts - 49, comments - 18, trackbacks - 0, articles - 1
  BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理

关于dom4j

Posted on 2006-03-20 20:08 fortune 阅读(675) 评论(0)  编辑  收藏 所属分类: java技术
今天就简单介绍一下处理XML文档的常用东西,关于xml document的话,w3c的document结构确实让人感到头痛,所以很多开发者都转向使用其他的document对象。其中dom4j是一个成功的开源项目,从java的对象概念的角度出发,按照通常的使用规范来处理xml文档,可以说,在java社区里,dom4j使用的最为广泛了,以下是dom4j的官方地址:http://www.dom4j.org/。如,众所周知的o/r mapping工具hibernate就是使用dom4j来解释xml文档的(ejb3.0就是基于hibernate实现的),由此可见,dom4j的使用广泛之处。dom4j的一个最大的实用之处是支持XPath表达式的查询,这样,我们可以在dom4j的Document结构中使用这种简单的表达式就可以快速找到我们需要的某个元素了。

      下载dom4j开发包:http://sourceforge.net/project/showfiles.php?group_id=16035。在前言我已说过,由于都采用了使用类似的发布框架,所以对程序员来说极为容易上手。下载完dom4j之后,在dom4j的docs/cookbook.html里有详细的入门手册,而在src/samples里面则是一些样例,src/test文件夹里面是JUnit的测试例子。这些东西都已经很详细的介绍了怎样进行入门介绍。这里,我打算小结一下dom4j的Document结构:

      首先,要明白的是dom4j是基于面向接口的样式来实现处理xml文档的,这种方法在面向对象的领域里特别常见。使用的常用接口都封装在org.dom4j包里,而怎样读取xml文档呢?则是使用一系列的api函数,这些常用方法都封装在org.dom4j.io。

(1)从面向对象的角度来看,dom4j对XML的文档结构进行了封装,从一个文档的角度来说(我们不考虑内存中的数据结构的话),可以简单的把一个XML文档就当做一个org.dom4j.Document:

         我们现在使用dom4j的Document结构,而不是使用w3c的Document结构,读取一个文件,在内存中构造一个Document结构:Document doc=new SAXReader().read(new File("...")); 就可以获得一个Document结构。注意,dom4j同时也对w3c的Document结构,SAX Event的支持,具体的使用可以参看docs/cookbook.html中的内容。这里不一一介绍。

(2)获得一个dom4j的Document结构之后,从面向对象的角度,我们自然而然的想起的是XML中的element,dom4j根据这种想法对这些进行了封装org.dom4j.Element类就是对这些进行了封装,从Document中获得Element:

         首先获得一个root元素,Element root=doc.getRootElement();而其他的元素也可以根据这个root元素来获得。

(4)一个元素的属性的话,则是Attribute,在Element类中,有非常容易操作的方法添加于获得Attribute,addAttritue();attribute()等函数原型都提供了操作。

(5)dom4j同时也提供了在内存中的数据结构的构造,不降低处理的灵活性。如:Node就是对一个xml文档树的节点的封装,而Branch则是对一个树的分支的封装,通过使用这些,可以灵活的按照树的结构来处理xml文档。敏感的朋友可能会注意到,Document和Element都是Node与Branch的子类,这种不同功能的领域的封装可以按照对象的处理与数据结构的结合,灵活的处理xml文档。

         以上是一点简单的介绍入门dom4j的Document结构,详细的请看docs/cookbook.html文件,里面太详细了,:-)。


只有注册用户登录后才能发表评论。


网站导航: