ContentHandler實際上是一個接口,當(dāng)處理特定的XML文件的時候,就需要為其創(chuàng)建一個實現(xiàn)了ContentHandler的類來處理特定的事件,可以說,這個實際上就是SAX處理XML文件的核心。下面我們來看看定義在其中的一些方法:
void characters(char[] ch, int start, int length):
這個方法用來處理在XML文件中讀到字符串,它的參數(shù)是一個字符數(shù)組,以及讀到的這個字符串在這個數(shù)組中的起始位置和長度,我們可以很容易的用String類的一個構(gòu)造方法來獲得這個字符串的String類:String charEncontered=new String(ch,start,length)。
void startDocument():
當(dāng)遇到文檔的開頭的時候,調(diào)用這個方法,可以在其中做一些預(yù)處理的工作。
void endDocument():
和上面的方法相對應(yīng),當(dāng)文檔結(jié)束的時候,調(diào)用這個方法,可以在其中做一些善后的工作。
void startElement(java.lang.String namespaceURI, java.lang.String localName, java.lang.String qName, Attributes atts)
當(dāng)讀到一個開始標(biāo)簽的時候,會觸發(fā)這個方法。在SAX1.0版本中并不支持名域,而在新的2.0版本中提供了對名域的支持,這兒參數(shù)中的namespaceURI就是名域,localName是標(biāo)簽名,qName是標(biāo)簽的修飾前綴,當(dāng)沒有使用名域的時候,這兩個參數(shù)都未null。而atts是這個標(biāo)簽所包含的屬性列表。通過atts,可以得到所有的屬性名和相應(yīng)的值。要注意的是SAX中一個重要的特點(diǎn)就是它的流式處理,在遇到一個標(biāo)簽的時候,它并不會紀(jì)錄下以前所碰到的標(biāo)簽,也就是說,在startElement()方法中,所有你所知道的信息,就是標(biāo)簽的名字和屬性,至于標(biāo)簽的嵌套結(jié)構(gòu),上層標(biāo)簽的名字,是否有子元屬等等其它與結(jié)構(gòu)相關(guān)的信息,都是不得而知的,都需要你的程序來完成。這使得SAX在編程處理上沒有DOM來得那么方便。
void endElement(java.lang.String namespaceURI, java.lang.String localName, java.lang.String qName)
這個方法和上面的方法相對應(yīng),在遇到結(jié)束標(biāo)簽的時候,調(diào)用這個方法。
因為ContentHandler是一個接口,在使用的時候可能會有些不方便,因而,SAX中還為其制定了一個Helper類:DefaultHandler,它實現(xiàn)了這個接口,但是其所有的方法體都為空,在實現(xiàn)的時候,你只需要繼承這個類,然后重載相應(yīng)的方法即可。
到這兒SAX的基本知識已經(jīng)差不多講完了,下面我們來看看兩個具體的例子,以更好的理解SAX地用法。
SAX編程實例
我們還是沿用講DOM的時候使用的那個文檔例子,但首先,我們先看一個簡單一些的應(yīng)用,我們希望能夠統(tǒng)計一下XML文件中各個標(biāo)簽出現(xiàn)的次數(shù)。這個例子很簡單,但是足以闡述SAX編程的基本思路了。
一開始當(dāng)然還是import語句了:
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.*;
import org.xml.sax.*;
import org.xml.sax.helpers.*;
import java.util.*;
import java.io.*;
然后,我們創(chuàng)建一個繼承于DefaultHandler的類,具體的程序邏輯在這兒可以暫且放在一邊,要注意的是程序的結(jié)構(gòu):
public class SAXCounter extends DefaultHandler {
private Hashtable tags; //這個Hashtable用來記錄tag出現(xiàn)的次數(shù)
// 處理文檔前的工作
public void startDocument() throws SAXException {
tags = new Hashtable();//初始化Hashtable
}
//對每一個開始元屬進(jìn)行處理
public void startElement(String namespaceURI, String localName,
String rawName, Attributes atts)
throws SAXException
{
String key = localName;
Object value = tags.get(key);
if (value == null) {
// 如果是新碰到的標(biāo)簽,這在Hastable中添加一條記錄
tags.put(key, new Integer(1));
} else {
// 如果以前碰到過,得到其計數(shù)值,并加1
int count = ((Integer)value).intValue();
count++;
tags.put(key, new Integer(count));
}
}
//解析完成后的統(tǒng)計工作
相關(guān)推薦:北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |