首页 > 学技术 > 技术网文 > Web开发 > 正文

[精华] 用JDOM处理XML文档


来源 chinaunix.net 酷勤网整理

[这个贴子最后由eclipse在 2002/11/19 11:13pm 编辑]

 用JDOM处理XML文档(转载)
关键词:Java、JDOM、XML、JAXB 

(一)JDOM的介绍以及与JAXB的比较 

Java + XML = JDOM ! 
这就是JDOM设计者的目标。如果你曾经使用过烦人的SAX或是DOM来处理XML,你就会知道为什么要有JDOM或者是JAXB。在今年(2002)的JavaOne会议上JDOM的主要创始人Jason Hunter有一篇精彩的演讲介绍了JDOM技术,题目就是JDOM Makes XML Easy。 
在那篇文档里,JDOM被拿来与DOM比较,而我更愿意拿它同JAXB比较。因为JAXB和JDOM都是为了在Java中提供比DOM和SAX更为方便的XML处理接口而开发的,并且通过完全不同的途径来解决这个问题。JDOM的处理方式是与DOM类似的树操作。而JAXB通过DTD和绑定模式来生成访问XML文档的Java代码,将XML映射成了Java对象来操作。你可以根据项目的需要和个人喜好来决定采用哪一个。 
JDOM与JAXB的比较,从本身的特点来看: 
1) JDOM比JAXB更容易上手。使用JAXB首先要会编写DTD,然后还要会编写绑定模式。JDOM没有这样的要求,如果你会Java和XML,甚至可以说光是看JDOM的javadoc文档就能够使用JDOM。 
2) JAXB编写好DTD和绑定模式以后,XML文档被映射成了Java对象,其数据就是Java对象的属性,连数据类型都做好了转换,因此,访问XML文档比JDOM要简便,可以说是一劳永逸。 
3) JAXB由某个DTD和绑定模式生成的代码只能访问该DTD所约束的文档。如果想要访问其他XML文档,需要再编写DTD和绑定模式。JDOM可以处理任何XML文档,包括受约束的和不受约束的。 

目前JDOM和JAXB都没有正式版本。JDOM的最新版本是beta8,JAXB是1.0 early access,其规范版本是0.21。相对而言,JDOM更成熟一些。例如JAXB不支持名字空间、不能向XML文档写入处理指令,有时我们需要保留的换行符和首尾空格在JAXB中自动过滤掉了,就连放在<![CDATA[ 和 ]]>;里面也不能幸免。JDOM就没有这些限制。如果说以上的3点比较是JDOM和JAXB本身的特点所决定的,几乎不可能改变,那么这里表明,JAXB还需要更多的工作。 

(二)获得并安装JDOM 
在http://jdom.org可以下载JDOM的最新版本。以JDOM beta8的2进制版本为例。下载后解压缩,JDOM的jar文件就是build目录下的文件jdom.jar,将之加入类路径。另外JDOM还需要lib目录下那些jar文件如xerces.jar的支持。如果在使用中出现以下错误: 
java.lang.NoSuchMethodError 
或 
java.lang.NoClassDefFoundError: org/xml/sax/SAXNotRecognizedException 
你需要保证xerces.jar文件在CLASSPATH中位于其他XML类,如JAXP或Crimson之前,这些类文件,包括以前老版本的xerces,可能不支持SAX2.0或DOM Level 2。于是导致了上面的错误。 

(三)一个简单的例子 
JDOM的处理方式有些类似于DOM,但它主要是用SAX实现的,你不必担心处理速度和内存的问题。另外,JDOM中几乎没有接口,的类全部是实实在在的类,没有类工厂类的。其最重要的一个包org.jdom中主要有以下类: 
? Attribute 
? CDATA 
? Comment 
? DocType 
? Document 
? Element 
? EntityRef 
? Namespace 
? ProcessingInstruction 
? Text 
数据输入要用到XML文档要通过org.jdom.input包,反过来需要org.jdom.output。如前面所说,关是看API文档就能够使用。 
我们的例子读入XML文件exampleA.xml,加入一条处理指令,修改第一本书的价格和作者,并添加一条属性,然后写入文件exampleB.xml: 
//exampleA.xml 
<?xml version=&quot;1.0&quot; encoding=&quot;GBK&quot;?>; 
<bookList>; 
   <book>; 
       <name>;Java编程入门</name>; 
       <author>;张三</author>; 
       <publishDate>;2002-6-6</publishDate>; 
       <price>;35.0</price>; 
   </book>; 
   <book>; 
       <name>;XML在Java中的应用</name>; 
       <author>;李四</author>; 
       <publishDate>;2002-9-16</publishDate>; 
       <price>;92.0</price>; 
   </book>; 
</bookList>; 

 
 
---------------------------------------------------
import org.jdom.*&#59;
import org.jdom.input.*&#59;
import org.jdom.output.*&#59;
import java.io.*&#59;
public class cute{

public static void main(String args[]){
try{

org.jdom.input.SAXBuilder sb=new org.jdom.input.SAXBuilder()&#59;
//创建文档
org.jdom.Document    doc=sb.build(new FileInputStream(&quot;c:\\example.xml&quot;))&#59;
//加入一条处理指令
org.jdom.ProcessingInstruction pi = new ProcessingInstruction(&quot;xml-stylesheet&quot;,&quot;href=\&quot;bookList.html.xsl\&quot; type=\&quot;text/xsl\&quot;&quot;)&#59;
//把这条处理指令,加入文档中
doc.addContent(pi)&#59;
//获得这个文档得跟元素
org.jdom.Element el=doc.getRootElement()&#59;
//获得这个跟元素,的所有子元素
java.util.List ls=el.getChildren()&#59;
//得到第一个子元素
org.jdom.Element book=(Element)ls.get(0)&#59;
//给这个字元素添加一条属性
org.jdom.Attribute attr=new Attribute(&quot;hot&quot;,&quot;true&quot;)&#59;
book.setAttribute(attr)&#59;

//获得这个元素的子元素,(指定)
org.jdom.Element el2=book.getChild(&quot;author&quot;)&#59;
//输出这个元素的值
System.out.println(el2.getName())&#59;
//给这个元素的值改个名字
el2.setText(&quot;cute&quot;)&#59;

//再指定元素获得这个值
org.jdom.Element el3=book.getChild(&quot;price&quot;)&#59;
//给这个值换个值
el3.setText(Float.toString(50.0f))&#59;
String a=&quot;&quot;&#59;
boolean bool=true&#59;

org.jdom.output.XMLOutputter xml= new org.jdom.output.XMLOutputter(a,bool,&quot;gb2312&quot;)&#59;
xml.output(doc,new FileOutputStream(&quot;c:\\cute.xml&quot;))&#59;

}catch(Exception e){
System.out.println(e.getMessage())&#59;

}



}
}





 sq1 回复于:2003-06-10 15:43:27

我发现一个问题,用楼上的方法对XML进行分析,很慢,就是这段代码就很慢 org.jdom.Document doc = sb.build(new FileInputStream(filename));

疑惑,寻求帮助。


 zlzj2010 回复于:2003-08-05 10:18:53

建议大家用jdom8

jdom9写得XML文件自动加入了控制字符!




原文链接:http://bbs.chinaunix.net/viewthread.php?tid=15908
转载请注明作者名及原文出处



收藏本页到: