主頁(yè) > 知識(shí)庫(kù) > xml中的空格之完全解說

xml中的空格之完全解說

熱門標(biāo)簽:本地電話機(jī)器人 高德地圖地圖標(biāo)注服務(wù)中心 如何修改多個(gè)百度地圖標(biāo)注 400電話辦理包年 東營(yíng)電銷 南寧網(wǎng)絡(luò)外呼系統(tǒng)運(yùn)營(yíng)商 隨州外呼調(diào)研系統(tǒng) r語言數(shù)據(jù)可視化地圖標(biāo)注 微信地圖標(biāo)注合并了
提示:我提取了《xslt從入門到精通》中關(guān)于空格解釋的核心部分,借以拋磚引玉,希望大家踴躍參與討論。談?wù)勀銓?duì)空格的理解。

只適合對(duì)xml文件結(jié)構(gòu)有一定了解的學(xué)者,不適合初學(xué)者。請(qǐng)按從上至下的順序閱讀。


對(duì)html文件而言,空格不重要;然而,對(duì)xml而言,默認(rèn)立場(chǎng)就是要保留空格結(jié)點(diǎn)(空格結(jié)點(diǎn)的解釋見下文)。


根據(jù)xml規(guī)范的規(guī)定,所謂空格是四種字符的任意組合序列:
-----------------------
空格字符(space),對(duì)應(yīng)字符值為 #x20
返回字符(Carriage Return),對(duì)應(yīng)字符值為 #xD
新行字符(Newline),對(duì)應(yīng)字符值為 #xA
跳格字符(Tab),對(duì)應(yīng)字符值為 #x9。

xml文件的空格也會(huì)形成結(jié)點(diǎn),也就是空格結(jié)點(diǎn)。空格結(jié)點(diǎn)屬于文字結(jié)點(diǎn)類型。

對(duì)xml和xslt而言,空格結(jié)點(diǎn)會(huì)牽涉到兩個(gè)議題:
-----------------------
1。在xml輸入文件中決定哪些空格是重要的,xslt處理器要看見這些空格結(jié)點(diǎn)。而決定的密鑰就是xml:space屬性。
2。在xsl模板文件中決定哪些空格是重要的,xslt處理器應(yīng)將它復(fù)制到結(jié)果樹中,而決定的密鑰就是xsl:strip-space
和xsl:preserve-space這兩個(gè)命令。


“重要和不重要的空格結(jié)點(diǎn)”
-----------------------
若某組件的內(nèi)容只能放組件,則該組件中的空格結(jié)點(diǎn)就是不重要的(Insignificant);
如果某組件的內(nèi)容是#PCDATA的類型,則其內(nèi)的空格結(jié)點(diǎn)應(yīng)視為重要的(Signficant)。
至于組件內(nèi)容混雜了文字內(nèi)容和組件的情況則無從評(píng)判,應(yīng)視組件及其內(nèi)容之語意而定。


xslt處理器接觸到xml輸入文件之前,會(huì)先由xml分析器進(jìn)行分析
-----------------------
(1)xml:space屬性可以改變后續(xù)接手的xml應(yīng)用程序處理空格結(jié)點(diǎn)的模式,例如,xslt處理器就會(huì)受xml:space屬性影響。
(2)xml文件中任何一列標(biāo)記或內(nèi)容尾端的結(jié)尾的結(jié)尾符號(hào)全部會(huì)換成單一新行字符(#xA)。
(3)屬性值交給xml應(yīng)用程序之前,xml分析器也應(yīng)該先對(duì)屬性值做規(guī)范化的操作。這是因?yàn)椴煌牟僮飨到y(tǒng)每一行文字列的結(jié)尾字符有不同的組合,例如,windows系統(tǒng)會(huì)由返回字符呵新行字符組成結(jié)尾符號(hào),而Unix系統(tǒng)則僅由新行字符組
     成結(jié)尾符號(hào)。xml分析器在讀取xml文件之后,便先行將所有結(jié)尾符號(hào)換成單一新行字符,不僅統(tǒng)一了不同系統(tǒng)間不同結(jié)尾符號(hào)設(shè)計(jì)的差異性,同時(shí)也簡(jiǎn)化了后續(xù)xml應(yīng)用程序的的操作難度。這樣一個(gè)處理過程稱為“規(guī)范化(Normalization)”。
 a,每一文字列的結(jié)尾符號(hào)都要規(guī)范化成單一的新行字符(#xA)。
 b,任何一個(gè)空格符(#x20、#xD、#xA、#x9)都應(yīng)換成一個(gè)空格字符(#x20)。
 c,屬性值中若含有字參碼,則應(yīng)替換成該參考字符,例如,#xA;會(huì)換成新行字符(#xA)。
 d,屬性值若含有實(shí)體參考,則應(yīng)以其替換文字替換。
 e,除此之外,任何字符都應(yīng)直接放入規(guī)范化屬性值中。
 f,最后,如果屬性類型不是CDATA,則xml分析器應(yīng)該再進(jìn)一步把屬性值前后的空格字符序列刪除,而且屬性值中間若有空格序列,也應(yīng)該替換成單一空格字符。

    
xslt處理器把xml輸入文件和xsl模板文件的結(jié)構(gòu)樹建好之后,會(huì)現(xiàn)把組件中相鄰的文字結(jié)點(diǎn)合并成單一的文字結(jié)點(diǎn),然后再把一些文字結(jié)點(diǎn)抽掉。然而,如果文字結(jié)點(diǎn)符合下列條件之一,就會(huì)被保留下來:
-----------------------
(1)文字結(jié)點(diǎn)的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結(jié)點(diǎn)中至少有一個(gè)非空格符。
(3)文字結(jié)點(diǎn)的某個(gè)祖先組件中有xml:space屬性,其值為preserve,而且較近的祖先組件中沒有其他xml:space屬性值為default。除此之外的文字結(jié)點(diǎn)逗會(huì)被抽掉。


對(duì)xsl模板而言,所謂的空格保留組件名稱集只有一個(gè)xsl:text組件可用。xsl模板文件的空格結(jié)點(diǎn)都會(huì)被刪除,但是,如果空格結(jié)點(diǎn)出現(xiàn)在xsl:text組件中就會(huì)被保留下來。

標(biāo)簽:黃石 拉薩 寧夏 宿遷 西雙版納 益陽 德州 果洛

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《xml中的空格之完全解說》,本文關(guān)鍵詞  xml,中的,空格,之,完全,解說,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《xml中的空格之完全解說》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于xml中的空格之完全解說的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章