public void endDocument() throws SAXException {
Enumeration e = tags.keys();
while (e.hasMoreElements()) {
String tag = (String)e.nextElement();
int count = ((Integer)tags.get(tag)).intValue();
System.out.println("Tag <" + tag + "> occurs " + count
+ " times");
}
}
//程序入口,用來完成解析工作
static public void main(String[] args) {
String filename = null;
boolean validation = false;
filename="links.xml";
SAXParserFactory spf = SAXParserFactory.newInstance();
XMLReader xmlReader = null;
SAXParser saxParser=null;
try {
// 創(chuàng)建一個(gè)解析器SAXParser對象
saxParser = spf.newSAXParser();
// 得到SAXParser中封裝的SAX XMLReader
xmlReader = saxParser.getXMLReader();
} catch (Exception ex) {
System.err.println(ex);
System.exit(1);
}
try {
//使用指定的ContentHandler,解析給XML文件,這兒要注意的是,為了
//程序的簡單起見,這兒將主程序和ContentHandler放在了一起。實(shí)際上
//main方法中所作的所有事情,都與ContentHandler無關(guān)。
xmlReader.parse(new File(filename),new SAXCounter());
} catch (SAXException se) {
System.err.println(se.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}
}
}
我們來看看這段程序作了些什么,在main()方法中,主要做的就是創(chuàng)建解析器,然后解析文檔。實(shí)際上,在這兒創(chuàng)建SAXParser對象的時(shí)候,為了使程序代碼于具體的解析器無關(guān),使用了同DOM中一樣的設(shè)計(jì)技巧:通過一個(gè)SAXParserFactory類來創(chuàng)建具體的SAXParser對象,這樣,當(dāng)需要使用不同的解析器的時(shí)候,要改變的,只是一個(gè)環(huán)境變量的值,而程序的代碼可以保持不變。這就是FactoryMethod模式的思想。在這兒不再具體講了,如果還有不明白的,可以參看上面DOM中的解釋,原理是一樣的。
不過在這兒還有一點(diǎn)點(diǎn)要注意的地方,就是SAXParser類和XMLReader類之間的關(guān)系。你可能有些迷糊了吧,實(shí)際上SAXParser是JAXP中對XMLReader的一個(gè)封裝類,而XMLReader是定義在SAX2.0種的一個(gè)用來解析文檔的接口。你可以同樣的調(diào)用SAXParser或者XMLReader中的parser()方法來解析文檔,效果是完全一樣的。不過在SAXParser中的parser()方法接受更多的參數(shù),可以對不同的XML文檔數(shù)據(jù)源進(jìn)行解析,因而使用起來要比XMLReader要方便一些。
這個(gè)例子僅僅涉及了SAX的一點(diǎn)皮毛,而下面的這個(gè),可就要高級一些了。下面我們要實(shí)現(xiàn)的功能,在DOM的例子中已經(jīng)有實(shí)現(xiàn)了,就是從XML文檔中讀出內(nèi)容并格式化輸出,雖然程序邏輯看起來還是很簡單,但是SAX可不比DOM哦,看著吧。
前面說過,當(dāng)遇到一個(gè)開始標(biāo)簽的時(shí)候,在startElement()方法中,我們并不能夠得到這個(gè)標(biāo)簽在XML文檔中所處的位置。這在處理XML文檔的時(shí)候是個(gè)大麻煩,因?yàn)樵赬ML中標(biāo)簽的語義,有一部分是由其所處的位置所決定的。而且在一些需要驗(yàn)證文檔結(jié)構(gòu)的程序中,這更是一個(gè)問題。當(dāng)然,沒有解決不了的問題了,我們可以使用一個(gè)棧來實(shí)現(xiàn)對文檔結(jié)構(gòu)的紀(jì)錄。
棧的特點(diǎn)是先進(jìn)先出,我們現(xiàn)在的想法是,在startElemnt()方法中用push將這個(gè)標(biāo)簽的名字添加到棧中,在endElement()方法中在把它pop出來。我們知道對一個(gè)結(jié)構(gòu)良好的XML而言,其嵌套結(jié)構(gòu)是完備的,每一個(gè)開始標(biāo)簽總會對應(yīng)一個(gè)結(jié)束標(biāo)簽,而且不會出現(xiàn)標(biāo)簽嵌套之間的錯位。因而,每一次startElement()方法的調(diào)用,必然會對應(yīng)一個(gè)endElement()方法的調(diào)用,這樣push和pop也是成對出現(xiàn)的,我們只需要分析棧的結(jié)構(gòu),就可以很容易的知道當(dāng)前標(biāo)簽所處在文檔結(jié)構(gòu)中的位置了。
相關(guān)推薦:計(jì)算機(jī)等級考試二級Java經(jīng)典算法大全匯總
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |