php读取远程gzip压缩网页的方法

yipeiwu_com6年前PHP代码库

今天在调取一家商城的页面信息时候,使用file_get_contents抑或curl:


复制代码 代码如下:

$url = 'http://www.xxx.com/21/?type=23′; 
$temp = file_get_contents($url); 
echo $temp;


都得到一片乱码,查看了许多内容,包括页面的header信息,发现原来页面使用了。

 

 

类似的信息,即Content-Encoding为gzip,即该站点开启了gzip压缩。这里的解决方案有多种,当然如果你使用file_get_contents的话,可以这样修改:

 

复制代码 代码如下:

file_get_contents("compress.zlib://".$url);

或者使用curl来完成:


复制代码 代码如下:

function curl_get($url, $gzip=false){  
        $curl = curl_init($url);  
        curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);  
        curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);  
        if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里  
        $content = curl_exec($curl);  
        curl_close($curl);  
        return $content;  

同时,参考手册上面的解法,还可以对保存gzip类型的字符串进行处理如下:

复制代码 代码如下:

function gzdecode($data){  
    $g=tempnam(‘/tmp','ff');  
    @file_put_contents($g,$data);  
    ob_start();  
    readgzfile($g);  
    $d=ob_get_clean();  
    return $d;  
}

相关文章

PHP序列化的四种实现方法与横向对比

PHP序列化的四种实现方法与横向对比

一、PHP 序列化变量的 4 种方法 序列化是将变量转换为可保存或传输的字符串的过程;反序列化就是在适当的时候把这个字符串再转化成原来的变量使用。这两个过程结合起来,可以轻松地存储和传输...

PHP实现的进度条效果详解

PHP实现的进度条效果详解

本文实例讲述了PHP实现的进度条效果。分享给大家供大家参考,具体如下: 在做采集的时候,想通过php来实现一个进度条功能,谷歌了一下,找了个合适的代码。下面直接上代码: <&...

php正则表达式获取内容所有链接

方法一: function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)...

php中取得文件的后缀名?

第一类方法是利用数组完成的。先把文件名切割成数组,然后想办法取得数组最后一个元素就OK了。第二类方法是通过字符串的处理来完成,还有一种方法是用pathinfo()函数。 复制代码 代码如...

PHP对文件进行加锁、解锁实例

有时候你的php脚本或许需要线程安全的保证,比如进行文件写操作的时候。本文提供了文件加锁函数以及使用示例。文件加锁功能也可以用来获得独享的处理空间,防止脚本执行发生同步错误。 复制代码...