在 XML 對(duì)象模型中如何處理空白字符?
有些時(shí)候,XML 對(duì)象模型將顯示包含空白字符的 TEXT 節(jié)點(diǎn)??瞻鬃址唤?cái)嗪螅喟霑?huì)帶來一些混亂。例如下面的 XML 例子:
]>
Smith
John
生成下列樹:
Processing Instruction: xml
DocType: person
ELEMENT: person
TEXT:
ELEMENT: lastname
TEXT:
ELEMENT: firstname
TEXT:
名字和姓氏兩邊是只包含空白字符的 TEXT 節(jié)點(diǎn),因?yàn)椤皃erson”元素的內(nèi)容模型是 MIXED;它包含 #PCDATA 關(guān)鍵字。MIXED 內(nèi)容模型指定元素之間可以有文本存在。因此,下面的內(nèi)容也是正確的:
My last name is Smith and my first name is
John
結(jié)果是類似于下面的樹:
ELEMENT: person
TEXT: My last name is
ELEMENT: lastname
TEXT: and my first name is
ELEMENT: firstname
TEXT:
如果沒有單詞“is”之后和 之前的空白字符,以及 之后和單詞“and”之前的空白字符,那么句子便無法理解。因此,對(duì)于 MIXED 內(nèi)容模型來說,文字組合、空白字符和元素都是相關(guān)的。對(duì)于非 MIXED 內(nèi)容模型來說則不是這樣。
要使只有空白字符的 TEXT 節(jié)點(diǎn)消失,請(qǐng)從“person”元素聲明中刪除 #PCDATA 關(guān)鍵字:
結(jié)果是下面清晰的樹:
Processing Instruction: xml
DocType: person
ELEMENT: person
ELEMENT: lastname
ELEMENT: firstname
XML 聲明做什么?
XML 聲明必須列在 XML 文檔的頂部:
它指定下面的項(xiàng)目:
該文檔是 XML 文檔。在丟失或者還沒有指定 MIME 類型時(shí) MIME 探測器可以用它來檢測文件是否為類型 text/xml。
文檔符合 XML 1.0 規(guī)范。在以后 XML 有其他版本時(shí)這一點(diǎn)很重要。
文檔字符編碼。編碼屬性是可選的,默認(rèn)為 UTF-8。
注意:XML 聲明必須在 XML 文檔的第一行,因此下面的 XML 文件:
產(chǎn)生下面的分析錯(cuò)誤:
無效的 xml 聲明。
行 0000002:
位置 0000007: ------^
注意:XML 聲明是可選的。如果需要在頂部指定注釋或者處理指令,那么請(qǐng)不要放入 XML 聲明。但是,默認(rèn)的編碼將為 UTF-8。
如何以可讀格式打印我的 XML 文檔?
在用 DOM 從零開始構(gòu)造文檔以產(chǎn)生 XML 文件時(shí),任何內(nèi)容都在一行上,相互之間沒有空格。這是默認(rèn)的行為。
構(gòu)造在 Internet Explorer 5 中的默認(rèn) XSL 樣式表,以可讀格式顯示和打印 XML 文檔。例如,如果已經(jīng)安裝了 IE5,請(qǐng)嘗試查看 nospace.xml 文件。瀏覽器中應(yīng)該顯示下面的樹:
-
-
XYZ
12.56
在 XML 中沒有插入空白字符。
打印可讀 XML 是非常有趣的,特別是有定義不同類型內(nèi)容模型的 DTD 時(shí)。例如,在混合內(nèi)容模型 (#PCDATA) 下不能插入空格,因?yàn)樗赡芨淖儍?nèi)容的含義。比如請(qǐng)考慮下面的 XML:
Elephant
這最好不輸出為:
E
lephant
因?yàn)閱卧~邊界不再正確。
所有這些都使自動(dòng)化打印成為問題。如果不需要打印可讀 XML,那么可以使用 DOM 在適當(dāng)?shù)奈恢貌迦肟瞻鬃址鳛槲谋竟?jié)點(diǎn)。
如何在 DTD 中使用名稱空間? 要在 DTD 中使用名稱空間,請(qǐng)?jiān)谑褂盟脑氐?ATTLIST 聲明中聲明它,如下所示:
名稱空間類型必須為 #FIXED。屬性的名稱空間也是這樣:
名稱空間和 XML 架構(gòu)
DTD 和 XML 架構(gòu)不能混合。例如,下面的
xmlns:x CDATA #FIXED "x-schema:myschema.xml"
將不導(dǎo)致使用在 myschema.xml 中定義的架構(gòu)定義。對(duì) DTD 和 XML 架構(gòu)的使用是互斥的。
如何在 Visual Basic 中使用 XMLDSO?
使用下面的 XML 作為例子:
Mark Hanson
206 765 4583
Jane Smith
425 808 1111
可以按如下方式綁定到 ADO 記錄集:
創(chuàng)建新的 VB 6.0 項(xiàng)目。
添加對(duì) Microsoft ActiveX Data Objects 2.1 或更高版本、Microsoft Data Adapter Library 和 Microsoft XML 2.0 版的引用。
用下面的代碼將 XML 數(shù)據(jù)加載到 XML DSO 控件中:
Dim dso As New XMLDSOControl
Dim doc As IXMLDOMDocument
Set doc = dso.XMLDocument
doc.Load ("d:\test.xml")
用下面的代碼將 DSO 映射到使用 DataAdapter 的新記錄集對(duì)象中:
Dim da As New DataAdapter
Set da.Object = dso
Dim rs As New ADODB.Recordset
Set rs.DataSource = da
訪問數(shù)據(jù):
MsgBox rs.Fields("name").Value
結(jié)果顯示字符串“Mark Hanson”
如何在 Java 中使用 XML DOM?
必須已經(jīng)安裝 MSXML.DLL 的 IE5 版本。在 Visual J++ 6.0 中,從項(xiàng)目菜單選擇添加 COM 包裝程序,然后從 COM 對(duì)象列表中選擇“Microsoft XML 1.0”。該操作將把所需的 Java 包裝程序構(gòu)造到稱為“msxml”的新軟件包中。這些預(yù)先構(gòu)造的 Java 包裝程序也可以下載。類可以按如下方法使用:
import com.ms.com.*;
import msxml.*;
public class Class1
{
public static void main (String[] args)
{
DOMDocument doc = new DOMDocument();
doc.load(new Variant("file://d:/samples/ot.xml"));
System.out.println("Loaded " + doc.getDocumentElement().getNodeName());
}
}
代碼示例將從 sun religion 示例中加載 3.8MB 測試文件“ot.xml”。Variant 類用于包裝 Win32 VARIANT 基本類型。
因?yàn)樵诿看螜z索節(jié)點(diǎn)時(shí)實(shí)際上都獲得了新的包裝程序,因此不能在節(jié)點(diǎn)上使用指針比較。因此,不要使用下面的代碼,
IXMLDOMNode root1 = doc.getDocumentElement();
IXMLDOMNode root2 = doc.getDocumentElement();
if (root1 == root2)...
而要使用下面的代碼:
if (ComLib.isEqualUnknown(root1, root2)) ....
.class 包裝程序的總大小大約為 160KB。但是,為了與 W3C 規(guī)范完全符合,應(yīng)該只使用 IXMLDOM* 包裝程序。下面的類是舊的 IE 4.0 XML 接口,可以從 msxml 文件夾中刪除它們:
IXMLAttribute*,
IXMLDocument*, XMLDocument*
IXMLElement*,
IXMLError*,
IXMLElementCollection*,
tagXMLEMEM_TYPE*
_xml_error*
這使大小減少為 147KB。同時(shí)還可以刪除下面的項(xiàng)目:
DOMFreeThreadedDocument
在 Java 應(yīng)用程序中從多個(gè)線程訪問 XML 文檔。
XMLHttpRequest
用 XML DAV HTTP 擴(kuò)展與服務(wù)器通信。
IXTLRuntime
定義 XSL 樣式表腳本對(duì)象。
XMLDSOControl
綁定到 HTML 頁面中的 XML 數(shù)據(jù)。
XMLDOMDocumentEvents
在分析過程中返回回調(diào)。
這可以將大小減少到 116KB。要使它更小,請(qǐng)考慮 DOM 本身有兩層的事實(shí):核心層包括:
DOMDocument, IXMLDOMDocument
IXMLDOMNode*
IXMLDOMNodeList*
IXMLDOMNamedNodeMap*
IXMLDOMDocumentFragment*
IXMLDOMImplementation
IXMLDOMParseError
和用戶可能需要保留的 DTD 信息:
IXMLDOMDocumentType
IXMLDOMEntity
IXMLDOMNotation
XML 文檔中的所有節(jié)點(diǎn)類型都是 IXMLDOMNode,它提供全部功能,但是存在每種節(jié)點(diǎn)類型的更高級(jí)別的包裝程序。因此,如果修改 DOMDocument 包裝程序并將這些特定類型更改為使用 IXMLDOMNode,那么所有下面的接口都可以刪除:
IXMLDOMAttribute
IXMLDOMCDATASection
IXMLDOMCharacterData
IXMLDOMComment
IXMLDOMElement
IXMLDOMProcessingInstruction
IXMLDOMEntityReference
IXMLDOMText
刪除這些將使大小減少到 61KB。但是,對(duì) IXMLDOMElement 來說,getAttribute 和 setAttribute 方法都是有用的。否則需要使用:
IXMLDOMNode.getAttributes().setNamedItem(...)