本文實(shí)例講述了php使用curl獲取header檢測(cè)開(kāi)啟GZip壓縮的方法。分享給大家供大家參考,具體如下:
獲得網(wǎng)頁(yè)header信息,是網(wǎng)站開(kāi)發(fā)人員和維護(hù)人員常用的技術(shù)。網(wǎng)頁(yè)的header信息,非常豐富,非專業(yè)人士一般較難讀懂和理解各個(gè)項(xiàng)目的含義。
獲取網(wǎng)頁(yè)header信息,方法多種多樣,就php語(yǔ)言來(lái)說(shuō),我作為一個(gè)菜鳥(niǎo),知道的方法也有4種那么多。下面逐一獻(xiàn)上。
方法一:使用get_headers()
函數(shù)
這個(gè)方法很多人使用,也很簡(jiǎn)單便捷,只需要兩行代碼即可搞定。如下:
$thisurl = "https://www.jb51.net/";
print_r(get_headers($thisurl, 1));
得到的結(jié)果為:
Array
(
[0] => HTTP/1.1 200 OK
[Content-Type] => text/html
[Last-Modified] => Wed, 15 Aug 2018 01:23:03 GMT
[ETag] => "99a921833634d41:0"
[Server] => Microsoft-IIS/7.5
[X-Powered-By] => jb51.net
[Date] => Wed, 15 Aug 2018 01:31:48 GMT
[Connection] => close
[Content-Length] => 89251
)
方法二:使用http_response_header
代碼也很簡(jiǎn)單,僅需三行:
$thisurl = "https://www.jb51.net/";
$html = file_get_contents($thisurl );
print_r($http_response_header);
得到的結(jié)果為:
Array
(
[0] => HTTP/1.1 200 OK
[1] => Content-Type: text/html
[2] => Last-Modified: Wed, 15 Aug 2018 01:33:04 GMT
[3] => ETag: "7b9757e93734d41:0"
[4] => Server: Microsoft-IIS/7.5
[5] => X-Powered-By: jb51.net
[6] => Date: Wed, 15 Aug 2018 01:34:15 GMT
[7] => Connection: close
[8] => Content-Length: 89282
)
方法三:使用stream_get_meta_data()
函數(shù)
代碼也只有三行:
$thisurl = "https://www.jb51.net/";
$fp = fopen($thisurl, 'r');
print_r(stream_get_meta_data($fp));
得到的結(jié)果為:
Array
(
[wrapper_data] => Array
(
[0] => HTTP/1.1 200 OK
[1] => Content-Type: text/html
[2] => Last-Modified: Wed, 15 Aug 2018 01:38:45 GMT
[3] => ETag: "ecc8f8b43834d41:0"
[4] => Server: Microsoft-IIS/7.5
[5] => X-Powered-By: jb51.net
[6] => Date: Wed, 15 Aug 2018 01:39:35 GMT
[7] => Connection: close
[8] => Content-Length: 89421
)
[wrapper_type] => http
[stream_type] => tcp_socket/ssl
[mode] => r
[unread_bytes] => 7945
[seekable] =>
[uri] => https://www.jb51.net/
[timed_out] =>
[blocked] => 1
[eof] =>
)
上述三種方法都可以輕松獲得網(wǎng)頁(yè)header信息,且包含的信息都已經(jīng)相當(dāng)豐富,滿足一般要求,不過(guò)比較遺憾的是,上述三種方法都不能用來(lái)檢測(cè)網(wǎng)頁(yè)是否啟用了GZip壓縮。要檢測(cè)GZip壓縮,還需其他的方法才行。這里介紹的是用curl()
函數(shù)來(lái)檢測(cè)。
使用curl獲得header可以檢測(cè)GZip壓縮
先貼出代碼:
?php
$szUrl = 'http://www.webkaka.com/';
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $szUrl);
curl_setopt($curl, CURLOPT_HEADER, 1); //輸出header信息
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); //不顯示網(wǎng)頁(yè)內(nèi)容
curl_setopt($curl, CURLOPT_ENCODING, ''); //允許執(zhí)行g(shù)zip
$data=curl_exec($curl);
if(!curl_errno($curl))
{
$info = curl_getinfo($curl);
$httpHeaderSize = $info['header_size']; //header字符串體積
$pHeader = substr($data, 0, $httpHeaderSize); //獲得header字符串
$split = array("\r\n", "\n", "\r"); //需要格式化header字符串
$pHeader = str_replace($split, 'br>', $pHeader); //使用br>換行符格式化輸出到網(wǎng)頁(yè)上
echo $pHeader;
}
?>
輸出結(jié)果如下:
HTTP/1.1 200 OK
Cache-Control: max-age=86400
Content-Length: 15189
Content-Type: text/html
Content-Encoding: gzip
Content-Location: http://www.webkaka.com/index.html
Last-Modified: Fri, 19 Jul 2013 03:52:28 GMT
Accept-Ranges: bytes
ETag: "0268633384ce1:5cb3"
Vary: Accept-Encoding
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Fri, 19 Jul 2013 09:27:21 GMT
上面輸出結(jié)果里可以看到一個(gè)項(xiàng)目:Content-Encoding: gzip,這個(gè)正是我們用來(lái)判斷網(wǎng)頁(yè)是否啟用GZip壓縮的項(xiàng)目。
另外,需要認(rèn)真注意下本實(shí)例里的注釋部分,不能少了任何一項(xiàng),否則可能獲取header信息有誤。
更多關(guān)于PHP相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《php curl用法總結(jié)》、《PHP網(wǎng)絡(luò)編程技巧總結(jié)》、《PHP數(shù)組(Array)操作技巧大全》、《php字符串(string)用法總結(jié)》、《PHP數(shù)據(jù)結(jié)構(gòu)與算法教程》及《PHP中json格式數(shù)據(jù)操作技巧匯總》
希望本文所述對(duì)大家PHP程序設(shè)計(jì)有所幫助。
您可能感興趣的文章:- PHP curl偽造IP地址和header信息代碼實(shí)例
- php curl中g(shù)zip的壓縮性能測(cè)試實(shí)例分析
- php使用curl檢測(cè)網(wǎng)頁(yè)是否被百度收錄的示例分享
- php中通過(guò)curl檢測(cè)頁(yè)面是否被百度收錄
- php使用curl判斷網(wǎng)頁(yè)404(不存在)的方法
- php下利用curl判斷遠(yuǎn)程文件是否存在的實(shí)現(xiàn)代碼
- PHP使用curl_multi_select解決curl_multi網(wǎng)頁(yè)假死問(wèn)題的方法
- php使用curl詳細(xì)解析及問(wèn)題匯總
- 關(guān)于PHP的curl開(kāi)啟問(wèn)題探討
- 關(guān)于php curl獲取301或302轉(zhuǎn)向的網(wǎng)址問(wèn)題的解決方法