网管联盟 | 网管论坛 | 网管u家 | 网管博客 | 网管软件 | 网管求职 | 小游戏 | 网管搜索 | 网管原创 | 网管聚合 | 网管读摘 | 网管焦点 | 世界素材 | 会员投稿 | 会员中心 
中国网管联盟
Windows Linux Cisco 网络技术 数据库 黑客攻防 DotNet Java PHP 认证 新闻资讯 服务器 存储资讯 网络设备 网管学堂 技术专题 焦点 网吧频道
 当前位置: > bitsCN.com > JAVA > Java&XML > XMLBeans > Java解析XML文档――dom解析xml  

Java解析XML文档――dom解析xml

2007-10-22  作者:bitsCN整理  来源:中国网管联盟  点评 投稿 收藏

  一、前言

  用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM.Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。 网管bitscn_com

  JAXP接口包含了三个包:

中国网管联盟bitsCN.com

  (1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。

网管u家u.bitscn@com

  (2)org.xml.sax  用于对XML进行语法分析的事件驱动的XML简单API(SAX)

网管u家u.bitscn@com

  (3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。

网管bitscn_com

  二、前提

网管bitscn_com

  DOM编程不要其它的依赖包,因为JDK里自带的JDK里含有的上面提到的org.w3c.dom、org.xml.sax 和javax.xml.parsers包就可以满意条件了。

中国网管联盟bitsCN.com

  三、使用DOM解析XML文档 网管网www.bitscn.com

  我们现在来看看DOM是如何解析XML的吧!同样的,我将从一个简单的不能再简单的例子来说明DOM是如何解析XML文档的,先让我们看看XML是什么内容吧:

网管u家u.bitsCN.com

  rjzjh

网管联盟bitsCN@com

  jjjjjj 网管u家u.bitsCN.com

  简单的不能再简单了。但是该有的都有了,根元素、属性、子节点。好了,能反应问题就行了,下面来看看解析这个XML文件的Java代码吧!

网管联盟bitsCN_com

  1 public class DomParse {

中国网管论坛bbs.bitsCN.com

  2   public DomParse(){ 网管网www.bitscn.com

  3      DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance(); 网管联盟bitsCN_com

  4      try {

网管联盟bitsCN_com

  5          DocumentBuilder dombuilder=domfac.newDocumentBuilder();

网管联盟bitsCN@com

  6          InputStream is=new FileInputStream("bin/library.xml"); 网管联盟bitsCN_com

  7          Document doc=dombuilder.parse(is); 网管网www.bitscn.com

  8

网管论坛bbs_bitsCN_com

  9          Element root=doc.getDocumentElement(); 中国网管联盟bitsCN.com

  10         NodeList books=root.getChildNodes();

中国网管联盟bitsCN.com

  11         if(books!=null){

网管bitscn_com

  12             for(int i=0;i 网管联盟bitsCN@com

  13                Node book=books.item(i);

网管联盟bitsCN_com

  14                if(book.getNodeType()==Node.ELEMENT_NODE){

网管下载dl.bitscn.com

  15        String email=book.getAttributes()。getNamedItem("email")。getNodeValue(); 网管网www.bitscn.com

  16                    System.out.println(email); 中国网管论坛bbs.bitsCN.com

  17       for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()){

网管网www.bitscn.com

  18                if(node.getNodeType()==Node.ELEMENT_NODE){ 中国网管论坛bbs.bitsCN.com

  19                  if(node.getNodeName()。equals("name")){ 网管联盟bitsCN_com

  20                    String name=node.getNodeValue(); 中国网管论坛bbs.bitsCN.com

  21                    String name1=node.getFirstChild()。getNodeValue(); 网管网www.bitscn.com

  22                          System.out.println(name); 网管网www.bitscn.com

  23                          System.out.println(name1); 网管联盟bitsCN@com

  24                           }

网管论坛bbs_bitsCN_com

  25                   if(node.getNodeName()。equals("price")){

网管联盟bitsCN_com

  26                    String price=node.getFirstChild()。getNodeValue(); 网管联盟bitsCN@com

  27                              System.out.println(price);

网管网www.bitscn.com

  28                           }

网管u家u.bitscn@com

  29                       } 网管论坛bbs_bitsCN_com

  30                    } 网管下载dl.bitscn.com

  31                } 网管联盟bitsCN_com

  32             } 网管论坛bbs_bitsCN_com

  33         }

网管网www.bitscn.com

  34      } catch (ParserConfigurationException e) {

网管论坛bbs_bitsCN_com

  35         e.printStackTrace(); 网管u家u.bitsCN.com

  36      } catch (FileNotFoundException e) {

网管联盟bitsCN@com

  37         e.printStackTrace(); 网管网www_bitscn_com

  38      } catch (SAXException e) {

网管联盟bitsCN@com

  39         e.printStackTrace(); 中国网管联盟bitsCN.com

  40      } catch (IOException e) {

网管联盟bitsCN_com

  41         e.printStackTrace(); 网管bitscn_com

  42      } 网管下载dl.bitscn.com

  43  }

网管网www.bitscn.com

  44  public static void main(String[] args) { 网管联盟bitsCN@com

  45      new DomParse();

网管联盟bitsCN_com

  46  } 网管u家u.bitsCN.com

  47 }

中国网管联盟bitsCN.com

  四、代码解释

中国网管论坛bbs.bitsCN.com

  先看看这个程序引用类:

网管论坛bbs_bitsCN_com

  import java.io.FileInputStream; 网管联盟bitsCN@com

  import java.io.FileNotFoundException;

网管u家u.bitsCN.com

  import java.io.IOException;

网管联盟bitsCN@com

  import java.io.InputStream;

网管论坛bbs_bitsCN_com

  import javax.xml.parsers.DocumentBuilder; 网管网www_bitscn_com

  import javax.xml.parsers.DocumentBuilderFactory;

网管bitscn_com

  import javax.xml.parsers.ParserConfigurationException;

中国网管论坛bbs.bitsCN.com

  //下面主要是org.xml.sax包的类 网管下载dl.bitscn.com

  import org.w3c.dom.Document; 网管u家u.bitsCN.com

  import org.w3c.dom.Element;

网管u家u.bitsCN.com

  import org.w3c.dom.Node; 网管u家u.bitscn@com

  import org.w3c.dom.NodeList;

网管网www_bitscn_com

  import org.xml.sax.SAXException;

网管u家u.bitsCN.com

  上面那么简单的代码一看就明白了,但是为了介绍个DOM编程的大概还是来看看这个程序吧: 中国网管论坛bbs.bitsCN.com

  (1)得到DOM解析器的工厂实例

网管网www.bitscn.com

  DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance(); 网管网www.bitscn.com

  得到javax.xml.parsers.DocumentBuilderFactory;类的实例就是我们要的解析器工厂

网管u家u.bitsCN.com

  (2)从DOM工厂获得DOM解析器

网管u家u.bitscn@com

  DocumentBuilder dombuilder=domfac.newDocumentBuilder(); 中国网管联盟bitsCN.com

  通过javax.xml.parsers.DocumentBuilderFactory实例的静态方法newDocumentBuilder()得到DOM解析器

网管bitscn_com

  (3)把要解析的XML文档转化为输入流,以便DOM解析器解析它

网管联盟bitsCN_com

  InputStream is=new FileInputStream("bin/library.xml"); 中国网管论坛bbs.bitsCN.com

  InputStream是一个接口。

网管下载dl.bitscn.com

  (4)解析XML文档的输入流,得到一个Document

网管下载dl.bitscn.com

  Document doc=dombuilder.parse(is);

网管u家u.bitsCN.com

  由XML文档的输入流得到一个org.w3c.dom.Document对象,以后的处理都是对Document对象进行的 网管网www_bitscn_com

  (5)得到XML文档的根节点 网管联盟bitsCN@com

  Element root=doc.getDocumentElement();

网管网www.bitscn.com

  在DOM中只有根节点是一个org.w3c.dom.Element对象。 中国网管论坛bbs.bitsCN.com

  (6)得到节点的子节点

网管网www_bitscn_com

  NodeList books=root.getChildNodes(); 网管联盟bitsCN_com

  for(int i=0;i

网管网www_bitscn_com

  Node book=books.item(i);

网管下载dl.bitscn.com

  }

网管联盟bitsCN_com

  这是用一个org.w3c.dom.NodeList接口来存放它所有子节点的,还有一种轮循子节点的方法,后面有介绍 网管联盟bitsCN_com

  (7)取得节点的属性值 网管u家u.bitscn@com

  String email=book.getAttributes()。getNamedItem("email")。getNodeValue();

网管u家u.bitsCN.com

  System.out.println(email);

网管u家u.bitsCN.com

  注意,节点的属性也是它的子节点。它的节点类型也是Node.ELEMENT_NODE 中国网管联盟bitsCN.com

  (8)轮循子节点

网管网www_bitscn_com

  for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()){

网管论坛bbs_bitsCN_com

  if(node.getNodeType()==Node.ELEMENT_NODE){

网管论坛bbs_bitsCN_com

  if(node.getNodeName()。equals("name")){

网管网www.bitscn.com

  String name=node.getNodeValue();

网管联盟bitsCN@com

  String name1=node.getFirstChild()。getNodeValue();

网管网www_bitscn_com

  System.out.println(name);

网管下载dl.bitscn.com

  System.out.println(name1);

网管论坛bbs_bitsCN_com

  } 网管u家u.bitsCN.com

  if(node.getNodeName()。equals("price")){ 网管联盟bitsCN_com

  String price=node.getFirstChild()。getNodeValue();

网管论坛bbs_bitsCN_com

  System.out.println(price); 网管网www_bitscn_com

  }

网管网www.bitscn.com

  }

网管u家u.bitsCN.com

  这段代码的打印输出为: 中国网管联盟bitsCN.com

  null

中国网管联盟bitsCN.com

  alterrjzjh

网管bitscn_com

  jjjjjj

网管网www.bitscn.com

  从上面可以看出 网管u家u.bitsCN.com

  String name=node.getNodeValue();  是一个空值。而 网管u家u.bitscn@com

  String name1=node.getFirstChild()。getNodeValue(); 才是真正的值,这是因为DOM把rjzjh也当作是两层结构的节点,其父节点为节点本身,且它只有一个子节点(如果有属性的话就不止一个了!),子节点是它的值“rjzjh”,所以我们看到上面的结果。 中国网管联盟bitsCN.com

  还有,子节点的节点类型也是Node.ELEMENT_NODE型的,node.getNextSibling()方法是取下一个相邻的节点。 网管下载dl.bitscn.com

  五、DOM结点 网管u家u.bitsCN.com

  DOM是一些节点的集合,由于文档中可能包含有不同类型的信息,所以定义了几种不同类型的节点。DOM中最常见的节点类型有: 网管联盟bitsCN@com

  (1)元素:

网管网www_bitscn_com

  元素是XML的基本构件。元素的子节点可以是其它元素、文本节点或两者都有。元素节点还可以只含有属性这一唯一类型的节点。 网管bitscn_com

  (2)属性:

网管bitscn_com

  属性节点包含关于元素节点的信息,但它不是元素的子节点

网管联盟bitsCN@com

  (3)文本:

网管论坛bbs_bitsCN_com

  文本节点文本信息,或干脆是空白的文本。 网管联盟bitsCN_com

  (4)文档: 网管网www.bitscn.com

  文档节点是整个文档中所有其它节点的父节点 网管u家u.bitscn@com

  元素是一种很重要的类型节点,元素节点可以是其他节点的容器。 网管bitscn_com

  六、DOM解析XML文档的步骤:

网管u家u.bitsCN.com

  主要几步见第四点的(1),(2),(3),(4)步骤

中国网管论坛bbs.bitsCN.com


TAGs
 上一篇:没有了   下一篇:Digester解析XML文档Sample
Java解析XML文档――dom解析xml 评论:
loading.. 评论加载中…
评论:请自觉遵守互联网相关政策法规,评论不得超过250字。

验证码: 注册用户
本类热门排行:
最新推荐文章:
网管论坛交流: