jsp程序设计：DOM+SAX操作xml

Posted on 2008-10-24 07:02 梦与桥阅读(767) 评论(0) 编辑收藏所属分类: jsp程序设计

1、操作XML文件的开源软件包括DOM、SAX、JDOM等，程序员需要熟悉并掌握这些常用的接口的使用，能够通过这些接口编写java语句来实现对XML文件的处理。
2、DTD主要有下列几方面的作用：
1）可以验证XML文件数据的有效性。
2）可以为某类XML文件提供统一的格式和相同的结构。
3）可以保证在一定的范围内，XML文件数据的交流和共享。
4）应用程序设计人员根据DTD就能够知道对应XML文件的逻辑结构，从而编写出相应的处理应用程序。
3、在DTD中引进Namespaces这个概念是为了解决命名冲突问题，设置url并不是说真的要到那个网址去读取，仅仅作为一种区别的标志而已。
4、DOM
1）DOM的类
目前主流的解析器有：JAXP(Java Api for XML Processing)、Xerces(Apache)、XML4J(IBM)和xalan等，主流的解析器都支持SAX和DOM，支持JDOM的解析器目前只有SUN公司发布的jdom包。DOM即文件对象模型。在应用程序中，基于DOM的XML分析器将一个XML文件转换成了一个对象模型的集合（通常被称为DOM树），应用程序可以通过对该对象模型的操作，实现对XML文件中数据的操作。
    §Document类，描述了整个XML的文件语法结构，它包含了一系列Node类形成的树形结构。程序员可以先扫描XML源文件，得到相应的Document对象，遍历这颗树来得到XML文件的所有内容，这是对XML文件操作的起点。
    §Node对象，Node类是DOM结构中最为基本的类，经描述了文件树中的一个抽象的节点。它包含类型为Element、Attr、Text和其他类的特征。Node对象引用其成员的变量来操作XML文件。
    §NodeList对象，代表了一个包含了一个或者多个Node的列表。
    §Element对象，Element类描述XML文件中的标志元素，继承于Node，也是Node的最主要的子对象。标志中要以包含属性，因而Element对象中有存取其属性的方法，而任何Node中定义的方法，Element都继承下来。
    §Attribute对象，它代表了某个标志的属性。继承Node，但因为Attr实际上包含在Element中，不能被看作Element的子对。在DOM中Attributer并不是DOM树的一个节点，所以Node中的getparentNode()、getpreviousSibling()和getnextSibling()返回的都将是null。即，Attribute是Element类的一部分，并不作为DOM树中单独的一个节点出现。
DOM类在DOM中都是用接口语言IDL定义的，因而，DOM可以映射到任何面向对象的语言，只要它实现了DOM所定义的接口就可以了。许多公司和厂家都提供了符合DOM规范的DOM接口和程序包。以微软的DOM接口为例：
2）DOM读取XML文件，通常用到以下5个基本步骤：
    建立一个解析器工厂。

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstace();

‚利用工厂获得一个具体的解析器对象。

DocumentBuilder builder=factory.newDocumentBuilder();

ƒ利用DocumentBuilder的parse()方法接受一个XML文件名作为输入参数，返回一个Document对象。Document对象代表了一个XML文件的树模型。

Document doc=builder.parse("file.xml");

„使用Document对象的getElementsByTagName()方法，我们可以得到一个NodeList对象，它是XML文件中的标签元素列表，可以使用NodeList对象的item()方法来得到列表中的每一个Node对象。

NodeList nl=doc.getElementsByTagName("person");

Element node=(Element)nl.item(i);

…通过Node对象的getNodeValue()方法提取某个标签内的内容。

node.getElementsByTagName("NAME").item(0).getFirstChild().getNodeValue();

3）DOM读取XML文件实例：本实例有两个文件（book.xml与bookDisplay.jsp）
book.xml的代码如下：

<?xml version="1.0" encoding="gb2312"?>

<books>

<book>

<name>J2EE编程技术</name>

<publish>清华大学出版社</publish>

<date>

</date>

</book>

<book>

<name>JSP大学实用教程</name>

<publish>电子工业出版社</publish>

<date>

</date>

</book>

<book>

<author>Thomas Petchel</author>

<publish>清华大学出版社</publish>

<date>

</date>

</book>

<book>

<name>JSP应用开发</name>

<publish>机械工业出版社</publish>

<date>

</date>

</book>

</books>

bookDisplay.jsp的代码如下：

<%@ page contentType="text/html;charset=gb2312"%>

<%@ page import="javax.xml.parsers.*,org.w3c.dom.*"%>

<html>

<head>

<title> DOM读取book.xml</title>

</head>

<body>

</tr>

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

DocumentBuilder builder=factory.newDocumentBuilder();
//此处用的是绝对路径，相对路径不太好使。

Document doc=builder.parse("C:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/readXml/book.xml");

doc.normalize();

NodeList books=doc.getElementsByTagName("book");

for(int i=0;i<books.getLength();i++){

Element book=(Element)books.item(i);

out.print("<tr>");

out.print("<td>"+book.getElementsByTagName("name").item(0).getFirstChild().getNodeValue()+"</td>");

out.print("<td>"+book.getElementsByTagName("author").item(0).getFirstChild().getNodeValue()+"</td>");

out.print("<td>"+book.getElementsByTagName("price").item(0).getFirstChild().getNodeValue()+"</td>");

out.print("<td>"+book.getElementsByTagName("publish").item(0).getFirstChild().getNodeValue()+"</td>");

Element bookdate=(Element)book.getElementsByTagName("date").item(0);

String day=bookdate.getElementsByTagName("day").item(0).getFirstChild().getNodeValue();

String month=bookdate.getElementsByTagName("month").item(0).getFirstChild().getNodeValue();

String year=bookdate.getElementsByTagName("year").item(0).getFirstChild().getNodeValue();

out.print("<td>"+year+"年"+month+"月"+day+"日"+"</td>");

out.println();

}

</table>

</body>

</html>

4）DOM修改XML文件
修改XML文件就是在修改了DOM树后重新写入到XML文件中去，通常会遇到两个方面的问题：
Œ在XML文件中增加记录：首先要在DOM树中增加一个节点元素，然后在这个节点元素上增加子节点元素，并给相应的叶节点赋值，最后把DOM树保存到XML文件中。
在XML文件中修改节点的值，要修改XML文件中节点的值，需要先将XML文件读入到DOM树中，再遍历DOM树，并在遍历的过程中找到相应的节点并修改其值，并把修改的DOM保存到XML文件中。
5）DOM修改XML文件实例，所操作的XML文件依然是book.xml，用以创修改book.xml文件的文件是bookChange.jsp，代码如下：

<%@ page contentType="text/html;charset=gb2312"%>

<%@ page import="javax.xml.parsers.*, javax.xml.transform.*,javax.xml.transform.dom.*"%>

<%@ page import="javax.xml.transform.stream.*,java.io.*, org.w3c.dom.*"%>

<html>

<head>

<title>DOM修改XML文件实例</title>

</head>

<body>

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

DocumentBuilder builder=factory.newDocumentBuilder();

Document doc=builder.parse("C:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/readXml/book.xml");

doc.normalize();

//---取得变量---

String name="精通Java EE项目案例";

String author="刘乃丽";

String price="85.00元";

String publish="人民邮电出版社";

//---创建一个book对象---

Text textseg;

Element book=doc.createElement("book");

//XML文件中添加一个book项目的具体元素

Element bookname=doc.createElement("name");

textseg=doc.createTextNode(name);

bookname.appendChild(textseg);

book.appendChild(bookname);

Element bookauthor=doc.createElement("author");

textseg=doc.createTextNode(author);

bookauthor.appendChild(textseg);

book.appendChild(bookauthor);

Element bookprice=doc.createElement("price");

textseg=doc.createTextNode(price);

bookprice.appendChild(textseg);

book.appendChild(bookprice);

Element bookpublish=doc.createElement("publish");

textseg=doc.createTextNode(publish);

bookpublish.appendChild(textseg);

book.appendChild(bookpublish);

String day="01";

String month="01";

String year="2008";

Element bookdate=doc.createElement("date");

Element bookdateday=doc.createElement("day");

textseg=doc.createTextNode(day);

bookdateday.appendChild(textseg);

Element bookdatemonth=doc.createElement("month");

textseg=doc.createTextNode(month);

bookdatemonth.appendChild(textseg);

Element bookdateyear=doc.createElement("year");

textseg=doc.createTextNode(year);

bookdateyear.appendChild(textseg);

bookdate.appendChild(bookdateday);

bookdate.appendChild(bookdatemonth);

bookdate.appendChild(bookdateyear);

book.appendChild(bookdate);

//创建好的节点添加到DOM树中

doc.getDocumentElement().appendChild(book);

//用xslt把DOM树输出

TransformerFactory tFactory=TransformerFactory.newInstance();

Transformer transformer=tFactory.newTransformer();

DOMSource source=new DOMSource(doc);

StreamResult result=new StreamResult(new File("C:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/readXml/book.xml"));

transformer.transform(source,result);

</tr>

//修改后读取数据

NodeList books=doc.getElementsByTagName("book");

for(int i=0;i<books.getLength();i++){

book=(Element)books.item(i);

out.print("<tr>");

out.print("<td>"+book.getElementsByTagName("name").item(0).getFirstChild().getNodeValue()+"</td>");

out.print("<td>"+book.getElementsByTagName("author").item(0).getFirstChild().getNodeValue()+"</td>");

out.print("<td>"+book.getElementsByTagName("price").item(0).getFirstChild().getNodeValue()+"</td>");

out.print("<td>"+book.getElementsByTagName("publish").item(0).getFirstChild().getNodeValue()+"</td>");

bookdate=(Element)book.getElementsByTagName("date").item(0);

day=bookdate.getElementsByTagName("day").item(0).getFirstChild().getNodeValue();

month=bookdate.getElementsByTagName("month").item(0).getFirstChild().getNodeValue();

year=bookdate.getElementsByTagName("year").item(0).getFirstChild().getNodeValue();

out.print("<td>"+year+"年"+month+"月"+day+"日"+"</td>");

out.println();

}

</table>

</body>

</html>

5、SAX
1）. SAX ( Simple Application interface for XML ), 是一组程序设计接口，采用 observer 模式，将XML文件视为一个文字流的数据，在读取XML 元素时触发一系列的事件

2）. 使用DOM 时是将xml 文件解析为一个树状结构，并对树中的节点进行操作
使用SAX 加载XML文件时，他的操作像打开一个“顺序的文件字符流”，在读到XML元素的开始标记，结尾标记和内容标记时将产生一系列的事件
如一个简单的XML文件：<hello><message>hello XML!</message></hello>
会相应的触发：startDocument, startElement, characters, endElement, endDocument, 只需编写这些事件处理程序就可以解析XML文件了

3）. SAX 可以高效的使用内存，因为SAX 只是顺序的读取XML 文件的内容，并不会将XML 文件完全加载，这样就比DOM 的处理效率高
但SAX 只能读取XML 文件的内容，而不能更改XML 的内容，也不能随机访问XML 元素

4）. 在SAX 中有4个处理器是要实现的：ContentHandler，DTDHandler，EntityResolver，ErrorHandler，以处理不同的事件，这是比较麻烦的，
幸好SAX 定义了一个 DefaultHandler 类把这几个实现了，我们只需在 DefaultHandler中定义事件处理方法，然后注册到XMLReader，而SAXParser封装了XMLReader的实现类，
SAXParser又是由SAXParserFactory提供的，所以我们实际用到的类只有：SAXParserFactory，SAXParser，DefaultHandler

5）. SAX 的解析步骤：
（1）写一个类继承 DefaultHandler, 实现自己的事件处理方法
（2）在主程序中建立 SAXParserFactory
（3）可以设置这个factory 的参数
（4）从这个factory 得到SAXParser
（5）解析XML文件
6）SAX解析XML实例，被解析的文件依然是book.xml，用以解析的文件是bookSaxDisplay.jsp，其代码如下：

<%@ page contentType="text/html;charset=GB2312" %>

<%@ page import="javax.xml.parsers.*,

org.xml.sax.*,

org.xml.sax.helpers.*,

org.xml.sax.helpers.DefaultHandler,

java.io.*"%>

<html>

<head><title>用SAX解析并遍历user.xml</title></head>

<body>

<%!

static class SAXParseUser extends DefaultHandler{

StringBuffer tempString=new StringBuffer();

//文档解析开始

public void startDocument() throws SAXException {

tempString.append("开始解析xml文件

<br>");

}

//标签解析开始

public void startElement(String namespaceURI, String localName,String qName, Attributes atts) throws SAXException{

tempString.append("开始解析结点，结点名称："+qName+"<br>");

//解析得到标签所有的属性

for(int i=0;i<atts.getLength();i++){

tempString.append("  属性"+atts.getQName(i)+",值为："+atts.getValue(i)+"<br>");

}

//标签解析结束

public void endElement(String namespaceURI,String localName,String qName) throws SAXException{

tempString.append("解析结点结束，结点名称："+qName+"<br>");

}

//字符串解析

public void characters(char[] ch,int start,int length){

tempString.append("  解析出字符串,值为：'"+(new String(ch,start,length))+"'<br>");

}

//文档解析结束

public void endDocument() throws SAXException {

tempString.append("解析xml文件结束!<br>");

}

//得到解析结果

public StringBuffer getPrintXML(){

return tempString;

}

<% //生成SAX解析器工厂长

SAXParserFactory spf = SAXParserFactory.newInstance();

XMLReader xmlReader = null;

SAXParser saxParser=null;

SAXParseUser saxParseUser=new SAXParseUser();

String filename=pageContext.getServletContext().getRealPath("/book.xml");

try {

// 创建一个解析器SAXParser对象

saxParser = spf.newSAXParser();

// 得到SAXParser中封装的SAX XMLReader

xmlReader = saxParser.getXMLReader();

//设置解析时处理事件的对象

xmlReader.setContentHandler(saxParseUser);

//开始解析XML文件

xmlReader.parse(filename);

}catch (Exception ex) {

System.out.println(ex);

}

<tr >

</tr>

out.println("<td>"+saxParseUser.getPrintXML()+"</td>");

</table>

</body>

</html>

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: jsp程序设计：Web图表开发之JavaReport组件 jsp程序设计：Web图表开发之JFreeChart组件 jsp程序设计：jstl之JSTL标签库(下) jsp程序设计：jstl之JSTL标签库(中) jsp程序设计：jstl之JSTL标签库(上) jsp程序设计：jstl之el jsp程序设计：JavaMail jsp程序设计：JDOM操作xml jsp程序设计：DOM+SAX操作xml jsp程序设计：分页显示数据

梦与桥java之家

导航

常用链接

留言簿(2)

随笔分类

随笔档案

我的友情链接

搜索

最新评论

阅读排行榜

评论排行榜

jsp程序设计：DOM+SAX操作xml