主頁 > 知識庫 > 整理HTML5中支持的URL編碼與字符編碼

整理HTML5中支持的URL編碼與字符編碼

熱門標簽:外呼系統(tǒng)電話怎么投訴 pageadm實現(xiàn)地圖標注 呼和浩特外呼電銷系統(tǒng)排名 外呼線穩(wěn)定線路 地圖標注位置能賺錢嗎 邢臺縣地圖標注app 南通數(shù)據(jù)外呼系統(tǒng)推廣 阜陽企業(yè)外呼系統(tǒng) 申請400電話流程簡介

URL 編碼
URL 編碼就是將 URLs 中不宜打印的字符或者具有特殊意義的字符轉(zhuǎn)換為 Web 瀏覽器和服務(wù)器明白且普遍接受的表示法。 這些字符包括:

ASCII 控制字符 - 不宜打印的字符通常用于輸出控制。字符范圍是十六進制的 00-1F(十進制的 0-31)和 7F(十進制的 127)。下面提供了完整的編碼表。

非 ASCII 控制字符 - 這些字符超出了 128 個 ASCII 字符集的范圍。這個范圍是 ISO-拉丁字符集的一部分以及包含整個十六進制的 ISO-拉丁字符集 00-FF (十進制的 128-255)的“前半部分”。下面提供了完整的編碼表。

保留字符 - 諸如美元符號,和號,加號,通用符號,正斜杠,冒號,分好,等號,問號以及 “at”這類符號。所有這些符號在 URL 內(nèi)都有不同的意義,因此需要編碼。下面提供了完整的編碼表。

不安全字符 - 包括空格,問號,小于符號,大于符號,磅字符,百分比符號,大括號左邊部分,大括號右邊部分,管道符,反斜杠,插入符號,波浪線。左方括號,右方括號,沉音符。出于某些原因,這些字符出現(xiàn)在 URLs 中存在被誤解的可能性。這些字符也應(yīng)該始終被編碼。下面提供了完整的編碼表。
編碼表示法需要三個字符替換期望的字符:一個百分號,兩個在 ASCII 字符集中表示字符位置的十六進制數(shù)字、

示例
最常見的特殊字符之一便是空格。我們不能在 URL 中直接輸入一個空格??崭裨谧址芯褪鞘M制的 20。因此請求服務(wù)器時可以使用 %20 表示空格。


復(fù)制代碼
代碼如下:
http://www.example.com/new%20pricing.html

這個 URL 實際上是從 www.example.com 檢索一個名為 new pricing.html 的文檔。

ASCII 控制字符編碼
包括十六進制的 00-1F(十進制的 0-31)和 7F(十進制的 127)字符碼。

十進制格式 十六進制值 字符 URL 編碼
0 00 %00
1 01 %01
2 02 %02
3 03 %03
4 04 %04
5 05 %05
6 06 %06
7 07 %07
8 08 退格符 %08
9 09 tab %09
10 0a 換行符 %0a
11 0b %0b
12 0c %0c
13 0d 回車符 %0d
14 0e %0e
15 0f %0f
16 10 %10
17 11 %11
18 12 %12
19 13 %13
20 14 %14
21 15 %15
22 16 %16
23 17 %17
24 18 %18
25 19 %19
26 1a %1a
27 1b %1b
28 1c %1c
29 1d %1d
30 1e %1e
31 1f %1f
127 7f %7f

非 ASCII 控制字符編碼
包括整個十六進制的 ISO-拉丁字符集 80-FF(十進制的 128-255)編碼的“前半部分”。
十進制格式 十六進制值 字符 URL 編碼
128 80 %80
129 81 ? %81
130 82 ? %82
131 83 ? %83
132 84 ? %84
133 85 %85
134 86 ? %86
135 87 ? %87
136 88 ? %88
137 89 %89
138 8a ? %8a
139 8b ? %8b
140 8c ? %8c
141 8d ? %8d
142 8e ? %8e
143 8f ? %8f
144 90 ? %90
145 91 %91
146 92 %92
147 93 %93
148 94 %94
149 95 ? %95
150 96 %96
151 97 %97
152 98 ? %98
153 99 ? %99
154 9a ? %9a
155 9b ? %9b
156 9c ? %9c
157 9d ? %9d
158 9e ? %9e
159 9f ? %9f
160 a0 %a0
161 a1 ? %a1
162 a2 %a2
163 a3 %a3
164 a4 ¤ %a4
165 a5 %a5
166 a6 | %a6
167 a7 § %a7
168 a8 ¨ %a8
169 a9 ? %a9
170 aa a %aa
171 ab ? %ab
172 ac ? %ac
173 ad - %ad
174 ae ? %ae
175 af ˉ %af
176 b0 ° %b0
177 b1 ± %b1
178 b2 2 %b2
179 b3 3 %b3
180 b4 %b4
181 b5 μ %b5
182 b6 ? %b6
183 b7 · %b7
184 b8 ? %b8
185 b9 1 %b9
186 ba o %ba
187 bb ? %bb
188 bc ? %bc
189 bd ? %bd
190 be ? %be
191 bf ? %bf
192 c0 à %c0
193 c1 á %c1
194 c2 ? %c2
195 c3 ? %c3
196 c4 ? %c4
197 c5 ? %c5
198 c6 ? %v6
199 c7 ? %c7
200 c8 è %c8
201 c9 é %c9
202 ca ê %ca
203 cb ? %cb
204 cc ì %cc
205 cd í %cd
206 ce ? %ce
207 cf ? %cf
208 d0 D %d0
209 d1 ? %d1
210 d2 ò %d2
211 d3 ó %d3
212 d4 ? %d4
213 d5 ? %d5
214 d6 ? %d6
215 d7 × %d7
216 d8 ? %d8
217 d9 ù %d9
218 da ú %da
219 db ? %db
220 dc ü %dc
221 dd Y %dd
222 de T %de
223 df ? %df
224 e0 à %e0
225 e1 á %e1
226 e2 a %e2
227 e3 ? %e3
228 e4 ? %e4
229 e5 ? %e5
230 e6 ? %e6
231 e7 ? %e7
232 e8 è %e8
233 e9 é %e9
234 ea ê %ea
235 eb ? %eb
236 ec ì %ec
237 ed í %ed
238 ee ? %ee
239 ef ? %ef
240 f0 e %f0
241 f1 ? %f1
242 f2 ò %f2
243 f3 ó %f3
244 f4 ? %f4
245 f5 ? %f5
246 f6 ? %f6
247 f7 ÷ %f7
248 f8 ? %f8
249 f9 ù %f9
250 fa ú %fa
251 fb ? %fb
252 fc ü %fc
253 fd y %fd
254 fe t %fe
255 ff ? %ff

保留字符編碼
下表用于編碼保留字符。
十進制格式 十六進制值 字符 URL 編碼
36 24 $ %24
38 26 & %26
43 2b + %2b
44 2c , %2c
47 2f / %2f
58 3a : %3a
59 3b ; %3b
61 3d = %3d
63 3f ? %3f
64 40 @ %40

不安全字符編碼
下表用于編碼不安全字符。
十進制格式 十六進制值 字符 URL 編碼
32 20 space %20
34 22 " %22
60 3c < %3c
62 3e > %3e
35 23 # %23
37 25 % %25
123 7b { %7b
125 7d } %7d
124 7c | %7c
92 5c \ %5c
94 5e ^ %5e
126 7e ~ %7e
91 5b [ %5b
93 5d ] %5d
96 60 ` %60

字符編碼

字符編碼就是將字節(jié)轉(zhuǎn)換為字符的一種方法。要驗證或者顯示一個 HTML 文檔,程序必須選擇一個字符編碼。HTML5 作者有三種方式設(shè)置字符編碼:

HTTP Content-Type 頭:
如果你在編寫 cgi 程序或者類似的程序,那么可以使用 HTTP Content-Type 頭設(shè)置任意字符編碼:

下面是一個簡單的例子:

XML/HTML Code復(fù)制內(nèi)容到剪貼板
  1. print "Content-Type: text/html; charset=utf-8\r\n";  

<meta> 元素:
可以使用帶有 charset 屬性的 <meta> 元素指定 HTML5 文檔前 512 個字節(jié)的編碼:

下面是簡化的例子:

XML/HTML Code復(fù)制內(nèi)容到剪貼板
  1. <meta charset="UTF-8">  

盡管這種語法是被允許的,但上述語法需要使用 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 替換。

Unicode 字節(jié)順序標記(BOM)
一個字節(jié)順序標記(BOM)由數(shù)據(jù)流開頭的 U+FEFF 字符碼組成,它可以用作定義字節(jié)順序和編碼形式的簽名,主要是未標記的明文文件。

許多 Windows 程序(包括 Windows 記事本)都會在保存為 UTF-8 的任意文檔開頭添加 0xEF, 0xBB, 0xBF。這就是 Unicode 字節(jié)順序標記(BOM)的 UTF-8 編碼,通常被稱為 UTF-8 BOM,盡管它和字節(jié)順序沒有關(guān)系。

對于 HTML5 文檔,我們可以在文件的開頭使用 Unicode 字節(jié)順序標記(BOM)字符。這個字符為使用的編碼提供了簽名。

標簽:撫順 鶴崗 辛集 楊凌 內(nèi)蒙古 黃山 德州 蚌埠

巨人網(wǎng)絡(luò)通訊聲明:本文標題《整理HTML5中支持的URL編碼與字符編碼》,本文關(guān)鍵詞  整理,HTML5,中,支持,的,URL,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《整理HTML5中支持的URL編碼與字符編碼》相關(guān)的同類信息!
  • 本頁收集關(guān)于整理HTML5中支持的URL編碼與字符編碼的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章