JAVA网站制作之Java编程中更新XML文档的经常使用办法
微软什么都提供了。你可以试想一下,如果你是新手,你是希望你点一下按钮程序就能运行那,还是想自己一点一点的组织结构,然后打包发部,调错再打包......xml|编程本文扼要的会商了Java言语编程中更新XML文档的四种经常使用办法,而且剖析这四种办法的好坏。其次,本文还对怎样把持Java程序输入的XML文档的格局做了睁开叙述。JAXP是JavaAPIforXMLProcessing的英笔墨头缩写,中文寄义是:用于XML文档处置的利用Java言语编写的编程接口。JAXP撑持DOM、SAX、XSLT等尺度。为了加强JAXP利用上的天真性,开辟者出格为JAXP计划了一个PluggabilityLayer,在PluggabilityLayer的撑持之下,JAXP既能够和详细完成DOMAPI、SAXAPI的各类XML剖析器(XMLParser,比方ApacheXerces)团结事情,又能够和详细实行XSLT尺度的XSLT处置器(XSLTProcessor,比方ApacheXalan)团结事情。使用PluggabilityLayer的优点在于:我们只必要熟习JAXP各个编程接口的界说便可,而不必要对所接纳的详细的XML剖析器、XSLT处置器有很深切的懂得。好比在某个Java程序中,经由过程JAXP挪用XML剖析器ApacheCrimson对XML文档举行处置,假如我们但愿利用其余XML剖析器(好比ApacheXerces),以便进步该程序的功能,那末原程序代码大概不必要任何改动,间接就能够利用(你所必要做的事变只是将包括ApacheXerces代码的jar文件到场到情况变量CLASSPATH中,而将包括ApacheCrimson代码的jar文件在情况变量CLASSPATH中删除)。
今朝JAXP已使用的非常广泛了,能够说是Java言语中处置XML文档的尺度API。有些初学者在进修利用JAXP的过程当中,常常会提出如许的成绩:我编写的程序对DOMTree做了更新,可是当程序加入今后,原始的XML文档并没有改动,仍是老模样,怎样完成对原始XML文档和DOMTree的同步更新呢?咋一看来,在JAXP中仿佛没有供应响应的接口/办法/类,这是良多初学者都感应狐疑的成绩。本文的大旨就在于办理这个成绩,复杂的先容几种经常使用的同步更新原始XML文档和DOMTree的办法。为了减少会商的局限,本文所触及的XML剖析器仅包含ApacheCrimson和ApacheXerces,而XSLT处置器仅仅利用ApacheXalan。
办法一:间接读写XML文档
这大概是最笨最原始的举措了。当程序猎取DOMTree以后,使用DOM模子的Node接口的各个办法对DOMTree举行更新,下一步应当对原始的XML文档举行更新了。我们能够使用递回的举措大概是使用TreeWalker类,遍历全部DOMTree,与此同时,将DOMTree的每个节点/元素顺次写进到事后翻开的原始XML文档中,当DOMTree被遍历完整以后,DOMTree和原始的XML文档就完成了同步更新。实践中,这个办法少少利用,不外假如你要编程完成本人的XML剖析器,这类办法仍是有大概用得上的。
办法二:利用XmlDocument类
利用XmlDocument类?JAXP平分明没有这个类呀!是否是作者弄错了?没有错!就是利用XmlDocument类,切实的说,是利用XmlDocument类的write()办法。
在上文已提到过,JAXP能够和林林总总的XML剖析器团结利用,此次我们选用的XML剖析器是ApacheCrimson。XmlDocument(org.apache.crimson.tree.XmlDocument)是ApacheCrimson的一个类,其实不包括于尺度的JAXP中,难怪在JAXP的文档中找不到XmlDocument类的芳踪呢。如今成绩出来了,怎样使用XmlDocument类来完成更新XML文档的功效?在XmlDocument类中供应了上面三个write()办法(依据Crimson最新的版本------ApacheCrimson1.1.3):
publicvoidwrite(OutputStreamout)throwsIOException
publicvoidwrite(Writerout)throwsIOException
publicvoidwrite(Writerout,Stringencoding)throwsIOException
上述三个write()办法的次要感化就是输入DOMTree中的内容到特定的输入介质中,好比文件输入流、使用程序把持台等等。那末又怎样利用上述三个write()办法呢?请看上面的Java程序代码片段:
Stringname="fancy";
DocumentBuilderparser;
DocumentBuilderFactoryfactory=DocumentBuilderFactory.newInstance();
try
{
parser=factory.newDocumentBuilder();
Documentdoc=parser.parse("user.xml");
Elementnewlink=doc.createElement(name);
doc.getDocumentElement().appendChild(newlink);
((XmlDocument)doc).write(newFileOutputStream(newFile("xuser1.xml")));
}
catch(Exceptione)
{
//tologit
}
在下面的代码中,起首创立了一个Document对象doc,猎取完全的DOMTree,然后使用Node接口的appendChild()办法,在DOMTree的最初追加了一个新节点(fancy),最初挪用XmlDocument类的write(OutputStreamout)办法,把DOMTree中的内容输入到xuser.xml中(实在也能够输入到user.xml,更新原始的XML文档,在这里为了便于做对照,故而输入到xuser.xml文件中)。必要注重的是不克不及间接对Document对象doc间接挪用write()办法,由于JAXP的Document接口并没有界说任何write()办法,以是必需将doc由Document对象强迫转换为XmlDocument对象,然后才干挪用write()办法,在下面的代码中利用的是write(OutputStreamout)办法,这个办法利用缺省的UTF-8编码输入DOMTree中的内容到特定的输入介质中,假如DOMTree中包括中笔墨符,那末输入的了局有多是乱码,亦即存在所谓的"汉字成绩",办理的举措是利用write(Writerout,Stringencoding)办法,显式指定输入时的编码,比方将第二个参数设为"GB2312",这时候即不存在"汉字成绩",输入了局可以一般显现中笔墨符。
完全的例子请参考以下文件:AddRecord.java(见附件)、user.xml(见附件)。该例子的运转情况为:WindowsXPProfessional、JDK1.3.1。为了可以一般编译运转AddRecord.java这个程序,你必要到网址http://xml.apache.org/dist/crimson/往下载ApacheCrimson,并将所猎取的crimson.jar文件到场到情况变量CLASSPATH中。
注重:
ApacheCrimson的前身是SunProjectXParser,厥后不知何以,由XParser演化为ApacheCrimson,至今ApacheCrimson的良多代码都是从XParser中间接移植过去的。好比上文用到的XmlDocument类,它在XParser中是com.sun.xml.XmlDocument,到了ApacheCrimson中摇身一变,就酿成了org.apache.crimson.tree.XmlDocument类,实在它们的尽年夜部分代码是一样的,大概就package语句和import语句和文件开首的一段lience有所分歧罢了。初期的JAXP是和XParser绑缚在一同的,因而一些老的程序利用了com.sun.xml包,假如你如今从头编译它们,有大概不克不及经由过程,一定就是由于这个缘故原由。厥后的JAXP和ApacheCrimson绑缚在一同,好比JAXP1.1,假如你利用JAXP1.1,那末不必要分外下载ApacheCrimson,也可以一般编译运转下面的例子(AddRecord.java)。最新的JAXP1.2EA(EarlyAccess)改弦更张,接纳功能更好的ApacheXalan和ApacheXerces分离作为XSLT处置器和XML剖析器,不克不及间接撑持ApacheCrimson了,以是假如你的开辟情况接纳了JAXP1.2EA大概是JavaXMLPack(内含JAXP1.2EA),那末将没法间接编译运转下面的例子(AddRecord.java),你必要分外下载并安装ApacheCrimson。
办法三:利用TransformerFactory和Transformer类
在JAXP中所供应的尺度的更新原始XML文档的办法就是挪用XSLT引擎,亦即便用TransformerFactory和Transformer类。请看上面的Java代码片段:
//起首创立一个DOMSource对象,该机关函数的参数能够是一个Document对象
//doc代表变动后的DOMTree。
DOMSourcedoms=newDOMSource(doc);
//创立一个File对象,代表DOMTree所包括的数据的输入介质,这是一个XML文件。
Filef=newFile("XMLOutput.xml");
//创立一个StreamResult对象,该机关函数的参数能够取为File对象。
StreamResultsr=newStreamResult(f);
//上面挪用JAXP中的XSLT引擎来完成输入DOMTree中的数据到XML文件中的功效。
//XSLT引擎的输出为DOMSource对象,输入为StreamResut对象。
try
{
//起首创立一个TransformerFactory对象,再由此创立Transformer对象。Transformer
//类相称于一个XSLT引擎。一般我们利用它来处置XSL文件,可是在这里我们使
//用它来输入XML文档。
TransformerFactorytf=TransformerFactory.newInstance();
Transformert=tf.newTransformer();
//关头的一步,挪用Transformer对象(XSLT引擎)的transform()办法,该办法的第一
//个参数是DOMSource对象,第二个参数是StreamResult对象。
t.transform(doms,sr);
}
catch(TransformerConfigurationExceptiontce)
{
System.out.println("TransformerConfigurationException
-----");
tce.printStackTrace();
}
catch(TransformerExceptionte)
{
System.out.println("TransformerException
---------");
te.printStackTrace();
}
在实践的使用中,我们能够使用传统的DOMAPI从XML文档中猎取DOMTree,然后依据实践的需求对DOMTree实行各类操纵,失掉终极的Document对象,接上去能够由此Document对象创立DOMSource对象,剩下的事变就是照搬下面的代码了,程序运转终了后,XMLOutput.xml就是你所必要的了局(固然了,你能够随便变动StreamResult类机关函数的参数,指定分歧的输入介质,而不用是一模一样的XML文档)。
这个办法最年夜的优点在于能够为所欲为的把持DOMTree中的内容输入到输入介质中的格局,可是光靠TransformerFactory类和Transformer类其实不能完成这个功效,还必要依附OutputKeys类的匡助。完全的例子请参考以下文件:AddRecord2.java(见附件)、user.xml(见附件)。该例子的运转情况为:WindowsXPProfessional、JDK1.3.1。为了可以一般编译运转AddRecord2.java这个程序,你必要到网址http://java.sun.com往下载安装JAXP1.1大概JavaXMLPack(JavaXMLPack已内含JAXP了)。
OutputKeys类
javax.xml.transform.OutputKeys类和java.util.Properties类共同利用,能够把持JAXP的XSLT引擎(Transformer类)输入XML文档的格局。请看上面的代码片段:
//起首创立一个TransformerFactory对象,再由此创立Transformer对象。
TransformerFactorytf=TransformerFactory.newInstance();
Transformert=tf.newTransformer();
//猎取Transformser对象的输入属性,亦即XSLT引擎的缺省输入属性,这是一个
//java.util.Properties对象。
Propertiesproperties=t.getOutputProperties();
//设置新的输入属性:输入字符编码为GB2312,如许能够撑持中笔墨符,XSLT引擎所输入
//的XML文档假如包括了中笔墨符,能够一般显现,不会呈现所谓的"汉字成绩"。
//请寄望OutputKeys类的字符串常数OutputKeys.ENCODING。
properties.setProperty(OutputKeys.ENCODING,"GB2312");
/更新XSLT引擎的输入属性。
t.setOutputProperties(properties);
//挪用XSLT引擎,依照输入属性中的设置,输入DOMTree中的内容到输入介质中。
t.transform(DOMSource_Object,StreamResult_Object);
从下面的程序代码,我们不丢脸出,经由过程设置XSLT引擎(Transformer类)的输入属性,能够把持DOMTree中的内容的输入格局,这关于我们定制输入内容是很有匡助的。那末JAXP的XSLT引擎(Transformer类)有那些输入属性能够设置呢?javax.xml.transform.OutputKeys类界说了良多字符串常数,它们都是能够自在设置的输入属性,经常使用的输入属性以下所示:
publicstaticfinaljava.lang.StringMETHOD
能够设为"xml"、"html"、"text"等值。
publicstaticfinaljava.lang.StringVERSION
所遵守标准的版本号,假如METHOD设为"xml",那末它的值应当设为"1.0",假如METHOD设为"html",那末它的值应当设为"4.0",假如METHOD设为"text",那末这个输入属性会被疏忽。
publicstaticfinaljava.lang.StringENCODING
设置输入时所接纳的编码体例,好比"GB2312"、"UTF-8"等等,假如将其设置为"GB2312",能够办理所谓的"汉字成绩"。
publicstaticfinaljava.lang.StringOMIT_XML_DECLARATION
设置输入到XML文档中时是不是疏忽XML声明,亦即相似于:
<?xmlversion="1.0"standalone="yes"encoding="utf-8"?>
如许的代码。它可选的值有"yes"、"no"。
publicstaticfinaljava.lang.StringINDENT
IDENT设定XSLT引擎在输入XML文档时,是不是主动增加分外的空格,它可选的值为"yes"、"no"。
publicstaticfinaljava.lang.StringMEDIA_TYPE
MEDIA_TYPE设定输入文档的MIME范例。
假如设定XSLT引擎的输入属性呢?上面我们来总结一下:
起首是猎取XSLT引擎(Transformer类)的缺省输入属性的汇合,这必要利用Transformer类的getOutputProperties()办法,前往值是一个java.util.Properties对象。
Propertiesproperties=transformer.getOutputProperties();
然后是设定新的输入属性,好比:
properties.setProperty(OutputKeys.ENCODING,"GB2312");
properties.setProperty(OutputKeys.METHOD,"html");
properties.setProperty(OutputKeys.VERSION,"4.0");
………………………………………………………
最初是更新XSLT引擎(Transformer类)的缺省输入属性的汇合,这必要利用Transformer类的setOutputProperties()办法,参数是一个java.util.Properties对象。
我们编写了一个新的程序,个中使用了OutputKeys类,用以把持XSLT引擎的输入属性,该程序的架构和前一个程序(AddRecord3.java)大抵不异,不外输入了局略有分歧。完全的代码请参考以下文件:AddRecord3.java(见附件)、user.xml(见附件)。该例子的运转情况为:WindowsXPProfessional、JDK1.3.1。为了可以一般编译运转AddRecord3.java这个程序,你必要到网址http://java.sun.com往下载安装JAXP1.1大概JavaXMLPack(JavaXMLPack内含JAXP了)。
办法四:利用XalanXMLSerializer
办法四实际上是办法三的一个变种,它必要ApacheXalan和ApacheXerces的撑持才干够运转。例子代码以下所示:
//起首创立一个DOMSource对象,该机关函数的参数能够是一个Document对象
//doc代表变动后的DOMTree。
DOMSourcedomSource=newDOMSource(doc);
//创立一个DOMResult对象,一时保留XSLT引擎的输入了局。
DOMResultdomResult=newDOMResult();
//上面挪用JAXP中的XSLT引擎来完成输入DOMTree中的数据到XML文件中的功效。
//XSLT引擎的输出为DOMSource对象,输入为DOMResut对象。
try
{
//起首创立一个TransformerFactory对象,再由此创立Transformer对象。Transformer
//类相称于一个XSLT引擎。一般我们利用它来处置XSL文件,可是在这里我们使
//用它来输入XML文档。
TransformerFactorytf=TransformerFactory.newInstance();
Transformert=tf.newTransformer();
//设置XSLT引擎的属性(必不成少,不然会发生"汉字成绩")。
Propertiesproperties=t.getOutputProperties();
properties.setProperty(OutputKeys.ENCODING,"GB2312");
t.setOutputProperties(properties);
//关头的一步,挪用Transformer对象(XSLT引擎)的transform()办法,该办法的第一
//个参数是DOMSource对象,第二个参数是DOMResult对象。
t.transform(domSource,domResult);
//创立缺省的XalanXMLSerializer,利用它将一时寄存在DOMResult对象
//(domResult)中的内容以输入流的情势输入到输入介质中。
Serializerserializer=SerializerFactory.getSerializer
(OutputProperties.getDefaultMethodProperties("xml"));
//设置XalanXMLSerializer的输入属性,这一步必不成少,不然也大概发生
//所谓的"汉字成绩"。
Propertiesprop=serializer.getOutputFormat();
prop.setProperty("encoding","GB2312");
serializer.setOutputFormat(prop);
//创立一个File对象,代表DOMTree所包括的数据的输入介质,这是一个XML文件。
Filef=newFile("xuser3.xml");
//创立文件输入流对象fos,请寄望机关函数的参数。
FileOutputStreamfos=newFileOutputStream(f);
//设置XalanXMLSerializer的输入流。
serializer.setOutputStream(fos);
//串行化输入了局。
serializer.asDOMSerializer().serialize(domResult.getNode());
}
catch(Exceptiontce)
{
tce.printStackTrace();
}
这个办法不太经常使用,并且仿佛有点多此一举,以是我们就不睁开会商了。完全的例子请参考以下文件:AddRecord4.java(见附件)、user.xml(见附件)。该例子的运转情况为:WindowsXPProfessional、JDK1.3.1。为了可以一般编译运转AddRecord4.java这个程序,你必要到网址http://xml.apache.org/dist/往下载安装ApacheXalan和ApacheXerces。
大概是到网址http://java.sun.com/xml/download.html往下载安装JavaXMLPack。由于最新的JavaXMLPack(Winter01版)包括了ApacheXalan和ApacheXerces手艺在内。
结论:
本文大略的会商了Java言语编程中更新XML文档的四种办法。第一种办法是间接读写XML文件,这类办法非常烦琐,并且对照简单堕落,少少利用,除非你必要开辟本人的XMLParser,不然不会利用这类办法。第二种办法是利用ApacheCrimson的XmlDocument类,这类办法极其复杂,利用便利,假如你选用ApacheCrimson作为XML剖析器,那末无妨利用这类办法,不外这类办法仿佛效力不高(源于效力低下的ApacheCrimson),别的,高版本的JAXP大概是JavaXMLPack、JWSDP不间接撑持ApacheCrimson,亦即这类办法欠亨用。第三种办法是利用JAXP的XSLT引擎(Transformer类)来输入XML文档,这类办法大概是尺度的办法了,利用起来非常天真,出格是能够自若把持输入格局,我们保举接纳这类办法。第四种办法是第三种办法的变种,接纳了XalanXMLSerializer,引进了串行化操纵,关于大批文档的修正/输入有优胜性,惋惜的是要反复设置XSLT引擎的属性和XMLSerializer的输入属性,对照贫苦,并且依附于ApacheXalan和ApacheXerces手艺,通用性略显不敷。
除下面会商的四种办法之外,实践上使用其余API(好比JDOM、Castor、XML4J、OracleXMLParserV2)也有良多举措能够更新XML文档,限于篇幅,在这里就纷歧一会商了。
参考文献和材料来历:
TheJavaWebServicesTutorial,SunMicrosystemsInc.
http://xml.apache.org,ApacheXMLProject(Crimson、Xerces、Xalan)
http://www.jguru.com,XMLForum
http://forum.java.sun.com,JavaTechnology&XMLForum
从一个编程语言的普及程度来将,一个好的IDE是至关中要的,而现在的java的IDE虽然已经很好了,但是和.net比起来还是稍微差一些的,这是个客观事实。java要想普及的更好。DE是必须加以改进的。 关于设计模式的资料,还是向大家推荐banq的网站 http://www.jdon.com/,他把GOF的23种模式以通俗易懂的方式诠释出来,纯Java描述,真是经典中的经典。 象、泛型编程的特性,广泛应用于企业级Web应用开发和移动应用开发。 是一种使用者不需花费很多时间学习的语言 其实说这种话的人就如当年小日本号称“三个月拿下中国”一样大言不惭。不是Tomjava泼你冷水,你现在只是学到了Java的骨架,却还没有学到Java的精髓。接下来你得研究设计模式了。 Sun公司看见Oak在互联网上应用的前景,于是改造了Oak,于1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。 Java自面世后就非常流行,发展迅速,对C++语言形成了有力冲击。Java 技术具有卓越的通用性、高效性、平台移植性和安全性,广泛应用于个人PC、数据中心、游戏控制台 是一种由美国SUN计算机公司(Sun Microsystems, Inc.)所研究而成的语言 Java自面世后就非常流行,发展迅速,对C++语言形成了有力冲击。Java 技术具有卓越的通用性、高效性、平台移植性和安全性,广泛应用于个人PC、数据中心、游戏控制台 是一种突破用户端机器环境和CPU 你就该学一学Servlet了。Servlet就是服务器端小程序,他负责生成发送给客户端的HTML文件。JSP在执行时,也是先转换成Servlet再运行的。虽说JSP理论上可以完全取代Servlet,这也是SUN推出JSP的本意,可是Servlet用来控制流程跳转还是挺方便的,也令程序更清晰。接下来你应该学习一下Javabean了,可能你早就看不管JSP在HTML中嵌Java代码的混乱方式了,这种方式跟ASP又有什么区别呢? 让你能够真正掌握接口或抽象类的应用,从而在原来的Java语言基础上跃进一步,更重要的是,设计模式反复向你强调一个宗旨:要让你的程序尽可能的可重用。 是一种由美国SUN计算机公司(Sun Microsystems, Inc.)所研究而成的语言 我大二,Java也只学了一年,觉得还是看thinking in java好,有能力的话看英文原版(中文版翻的不怎么好),还能提高英文文档阅读能力。 你就该学一学Servlet了。Servlet就是服务器端小程序,他负责生成发送给客户端的HTML文件。JSP在执行时,也是先转换成Servlet再运行的。虽说JSP理论上可以完全取代Servlet,这也是SUN推出JSP的本意,可是Servlet用来控制流程跳转还是挺方便的,也令程序更清晰。接下来你应该学习一下Javabean了,可能你早就看不管JSP在HTML中嵌Java代码的混乱方式了,这种方式跟ASP又有什么区别呢? 当然你也可以参加一些开源项目,一方面可以提高自己,另一方面也是为中国软件事业做贡献嘛!开发者在互联网上用CVS合作开发,用QQ,MSN,E-mail讨论联系,天南海北的程序员分散在各地却同时开发同一个软件,是不是很有意思呢? 科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。 Pet Store.(宠物店)是SUN公司为了演示其J2EE编程规范而推出的开放源码的程序,应该很具有权威性,想学J2EE和EJB的朋友不要 错过了。 是一种使网页(Web Page)由静态(Static)转变为动态(Dynamic)的语言 至于JDBC,就不用我多说了,你如果用java编过存取数据库的程序,就应该很熟悉。还有,如果你要用Java编发送电子邮件的程序,你就得看看Javamail 了。
页:
[1]