public void endDocument() throws SAXException {
Enumeration e = tags.keys();
while (e.hasMoreElements()) {
String tag = (String)e.nextElement();
int count = ((Integer)tags.get(tag)).intValue();
System.out.println("Tag <" + tag + "> occurs " + count
+ " times");
}
}
//程序入口,用來完成解析工作
static public void main(String[] args) {
String filename = null;
boolean validation = false;
filename="links.xml";
SAXParserFactory spf = SAXParserFactory.newInstance();
XMLReader xmlReader = null;
SAXParser saxParser=null;
try {
// 創(chuàng)建一個解析器SAXParser對象
saxParser = spf.newSAXParser();
// 得到SAXParser中封裝的SAX XMLReader
xmlReader = saxParser.getXMLReader();
} catch (Exception ex) {
System.err.println(ex);
System.exit(1);
}
try {
//使用指定的ContentHandler,解析給XML文件,這兒要注意的是,為了
//程序的簡單起見,這兒將主程序和ContentHandler放在了一起。實際上
//main方法中所作的所有事情,都與ContentHandler無關。
xmlReader.parse(new File(filename),new SAXCounter());
} catch (SAXException se) {
System.err.println(se.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}
}
}
我們來看看這段程序作了些什么,在main()方法中,主要做的就是創(chuàng)建解析器,然后解析文檔。實際上,在這兒創(chuàng)建SAXParser對象的時候,為了使程序代碼于具體的解析器無關,使用了同DOM中一樣的設計技巧:通過一個SAXParserFactory類來創(chuàng)建具體的SAXParser對象,這樣,當需要使用不同的解析器的時候,要改變的,只是一個環(huán)境變量的值,而程序的代碼可以保持不變。這就是FactoryMethod模式的思想。在這兒不再具體講了,如果還有不明白的,可以參看上面DOM中的解釋,原理是一樣的。
不過在這兒還有一點點要注意的地方,就是SAXParser類和XMLReader類之間的關系。你可能有些迷糊了吧,實際上SAXParser是JAXP中對XMLReader的一個封裝類,而XMLReader是定義在SAX2.0種的一個用來解析文檔的接口。你可以同樣的調(diào)用SAXParser或者XMLReader中的parser()方法來解析文檔,效果是完全一樣的。不過在SAXParser中的parser()方法接受更多的參數(shù),可以對不同的XML文檔數(shù)據(jù)源進行解析,因而使用起來要比XMLReader要方便一些。
這個例子僅僅涉及了SAX的一點皮毛,而下面的這個,可就要高級一些了。下面我們要實現(xiàn)的功能,在DOM的例子中已經(jīng)有實現(xiàn)了,就是從XML文檔中讀出內(nèi)容并格式化輸出,雖然程序邏輯看起來還是很簡單,但是SAX可不比DOM哦,看著吧。
前面說過,當遇到一個開始標簽的時候,在startElement()方法中,我們并不能夠得到這個標簽在XML文檔中所處的位置。這在處理XML文檔的時候是個大麻煩,因為在XML中標簽的語義,有一部分是由其所處的位置所決定的。而且在一些需要驗證文檔結構的程序中,這更是一個問題。當然,沒有解決不了的問題了,我們可以使用一個棧來實現(xiàn)對文檔結構的紀錄。
棧的特點是先進先出,我們現(xiàn)在的想法是,在startElemnt()方法中用push將這個標簽的名字添加到棧中,在endElement()方法中在把它pop出來。我們知道對一個結構良好的XML而言,其嵌套結構是完備的,每一個開始標簽總會對應一個結束標簽,而且不會出現(xiàn)標簽嵌套之間的錯位。因而,每一次startElement()方法的調(diào)用,必然會對應一個endElement()方法的調(diào)用,這樣push和pop也是成對出現(xiàn)的,我們只需要分析棧的結構,就可以很容易的知道當前標簽所處在文檔結構中的位置了。
相關推薦:北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |