亚洲色无码专区在线播放,国产精品视频每日更新,免费中文字幕在在线不卡

主頁 > 知識庫 > 關于html字符串正則判斷和匹配的具體使用

關于html字符串正則判斷和匹配的具體使用

前言

最近在寫一個組件，需要傳入html字符串，里面用到了很多正則來判斷是否是html標簽或者匹配標簽內的文本等，這里記錄下。

如何判斷傳入的字符串包含一個閉合html標簽

/<\/?[a-z][\s\S]*>/i

這個其實并不能判斷標簽閉合的完整性或者順序等，只是判斷字符串中是否有html標簽(包含自定義標簽)，這對我來說足夠了。這給正則里面需要學習的就是[\s\S]可以代表一切字符串。

/<([a-z][\s\S]*)>.*<\/\1>/i

這個就更加規(guī)范一些可以匹配一個完整閉合的標簽，\1代表前面的圓括號內捕獲的內容，是正則的比較高級的用法。

如何匹配出一個標簽內的文本內容

str = str.replace(/<title>[\s\S]*?<\/title>/, '<title>' + newTitle + '<\/title>');

最好用一個語義化標簽或者自定義標簽來做匹配，如果使用div這種一段字符串中可能有好多個的，問題會很多。
[sS]*代表任意字符
*后面的?代表非貪婪模式，因為正則匹配默認都是貪婪模式的

總結

用正則從html標簽中匹配文字其實是一種很低效的方式，不到必要時候也沒必要去使用，有篇文章深刻的批判了這種行為有興趣可以看一下。

常見正則表達式

匹配中文字符的正則表達式： [u4e00-u9fa5]
評注：匹配中文還真是個頭疼的事，有了這個表達式就好辦了
匹配雙字節(jié)字符(包括漢字在內)：[^x00-xff]
評注：可以用來計算字符串的長度（一個雙字節(jié)字符長度計2，ASCII字符計1）
匹配空白行的正則表達式：ns*r
評注：可以用來刪除空白行
匹配HTML標記的正則表達式：<(S*?)[^>]*>.*?|<.*? />
評注：網(wǎng)上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對于復雜的嵌套標記依舊無能為力
匹配首尾空白字符的正則表達式：^s*|s*$
評注：可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等)，非常有用的表達式
匹配Email地址的正則表達式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
評注：表單驗證時很實用
匹配網(wǎng)址URL的正則表達式：^(http|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?$
評注：網(wǎng)上流傳的版本功能很有限，上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭，允許5-16字節(jié)，允許字母數(shù)字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注：表單驗證時很實用
匹配國內電話號碼：d{3}-d{8}|d{4}-d{7}
評注：匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號：[1-9][0-9]{4,}
評注：騰訊QQ號從10000開始
匹配中國郵政編碼：[1-9]d{5}(?!d)
評注：中國郵政編碼為6位數(shù)字
匹配身份證：d{15}|d{18}
評注：中國的身份證為15位或18位
匹配ip地址：d+.d+.d+.d+
評注：提取ip地址時有用
匹配特定數(shù)字：
　　^[1-9]d*$　　 //匹配正整數(shù)
　　^-[1-9]d*$ 　 //匹配負整數(shù)
　　^-?[1-9]d*$　　 //匹配整數(shù)
　　^[1-9]d*|0$　 //匹配非負整數(shù)（正整數(shù) + 0）
　　^-[1-9]d*|0$　　 //匹配非正整數(shù)（負整數(shù) + 0）
　　^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮點數(shù)
　　^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配負浮點數(shù)
　　^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮點數(shù)
　　^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非負浮點數(shù)（正浮點數(shù) + 0）
　　^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮點數(shù)（負浮點數(shù) + 0）
評注：處理大量數(shù)據(jù)時有用，具體應用時注意修正
匹配特定字符串：
　　^[A-Za-z]+$　　//匹配由26個英文字母組成的字符串
　　^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串
　　^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串
　　^[A-Za-z0-9]+$　　//匹配由數(shù)字和26個英文字母組成的字符串
　　^w+$　　//匹配由數(shù)字、26個英文字母或者下劃線組成的字符串
在使用RegularExpressionValidator驗證控件時的驗證功能及其驗證表達式介紹如下:
只能輸入數(shù)字：“^[0-9]*$”
只能輸入n位的數(shù)字：“^d{n}$”
只能輸入至少n位數(shù)字：“^d{n,}$”
只能輸入m-n位的數(shù)字：“^d{m,n}$”
只能輸入零和非零開頭的數(shù)字：“^(0|[1-9][0-9]*)$”
只能輸入有兩位小數(shù)的正實數(shù)：“^[0-9]+(.[0-9]{2})?$”
只能輸入有1-3位小數(shù)的正實數(shù)：“^[0-9]+(.[0-9]{1,3})?$”
只能輸入非零的正整數(shù)：“^+?[1-9][0-9]*$”
只能輸入非零的負整數(shù)：“^-[1-9][0-9]*$”
只能輸入長度為3的字符：“^.{3}$”
只能輸入由26個英文字母組成的字符串：“^[A-Za-z]+$”
只能輸入由26個大寫英文字母組成的字符串：“^[A-Z]+$”
只能輸入由26個小寫英文字母組成的字符串：“^[a-z]+$”
只能輸入由數(shù)字和26個英文字母組成的字符串：“^[A-Za-z0-9]+$”
只能輸入由數(shù)字、26個英文字母或者下劃線組成的字符串：“^w+$”
驗證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為：以字母開頭，長度在6-18之間，只能包含字符、數(shù)字和下劃線。
驗證是否含有^%&'',;=?$"等字符：“[^%&'',;=?$x22]+”
只能輸入漢字：“^[u4e00-u9fa5],{0,}$”
驗證Email地址：“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
驗證電話號碼：“^((d{3,4})|d{3,4}-)?d{7,8}$”
正確格式為：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”，
“XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。
驗證身份證號（15位或18位數(shù)字）：“^d{15}|d{}18$”
驗證一年的12個月：“^(0?[1-9]|1[0-2])$”正確格式為：“01”-“09”和“1”“12”
驗證一個月的31天：“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正確格式為：“01”“09”和“1”“31”。
匹配中文字符的正則表達式： [u4e00-u9fa5]
匹配雙字節(jié)字符(包括漢字在內)：[^x00-xff]
匹配空行的正則表達式：n[s| ]*r
匹配HTML標記的正則表達式：/<(.*)>.*|<(.*) />/
匹配首尾空格的正則表達式：(^s*)|(s*$)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

標簽：盤錦綏化萍鄉(xiāng) 聊城中山金昌阿壩赤峰

巨人網(wǎng)絡通訊聲明：本文標題《關于html字符串正則判斷和匹配的具體使用》，本文關鍵詞關于,html,字符串,正則,判斷,；如發(fā)現(xiàn)本文內容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡，涉及言論、版權與本站無關。