php不用正则采集速度探究总结

yipeiwu_com6年前PHP代码库
 
注意:下面的所有函数都没有用正则。

以上为取出第一个匹配的三个函数,实现相同的目的

复制代码 代码如下:

function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换 
$content = strstr( $str, $start ); 
$content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) ); 
return $content; 

function str_cut1($str ,$start, $end) {//取出第一个匹配,效率中,直接查找替换 
$x = strpos($str, $start); 
return substr($str, $x+strlen($start), strpos($str, $end)-$x+strlen($end)); 


function str_cut3($content,$start,$end){//取出第一个匹配,字符串越大,速度越慢! 
$my = explode($start,$content); 
$my = explode($end,$my[1]); 
return $my[0]; 


以下为取出所有匹配的3个函数(全部原创),实现相同的采集目的
复制代码 代码如下:

function strcut($str ,$start, $end) //先搜个数,速度中等 

    if( strpos( $str , $start ) ) 
    { 
            $sum = substr_count($str,$start); 

            $carr = array(); 
            for($i=0;$i<$sum;$i++){ 
                $str = strstr( $str, $start ); 
                $str = substr( $str, strlen($start)); 
                   $carr[] = substr( $str, 0, strpos( $str, $end ) ); 
            } 

           

    } 
    return $carr; 


function str_cut_all($str ,$start, $end,$carr=array()) //递归,运行效率最慢! 

    if( strpos( $str , $start ) ) 
    { 
            $str = strstr( $str, $start ); 
            $str = substr( $str, strlen($start)); 
               $carr[] = substr( $str, 0, strpos( $str, $end ) ); 
               if( strpos( $str , $start ) ) 
            { 
                   return str_cut_all($str ,$start, $end ,$carr ); 
               } 

    } 
    return $carr; 


function my_Ca($content,$start,$end){//取出所有匹配,效率最快,因为只读一次,字符串越大越明显 
    $m = explode($start,$content); 
    $a = array(); 
    for( $i = 1;$i < count($m);$i++ ) 
    { 
        $my = explode($end,$m[$i]); 
        $a[] = $my[0]; 
        unset($my); 
    } 
    return $a; 


注意my-Ca比较
如果这样写:
复制代码 代码如下:

function my_Ca($content,$start,$end){//取出所有匹配 
$m = explode($start,$content); 
$a = array(); 
$sum = count($m); 
for( $i = 1;$i < $sum;$i++ ) 

$my = explode($end,$m[$i]); 
$a[] = $my[0]; 
unset($my); 

return $a; 


速度又快了一些!


由上可以看出,并不是数组处理函数(explode)比字符串处理函数(substr等)慢,也不是那个比这个快,因为在匹配多个数据的时候匹配的越多数组函数的优势越大,处理字符串就象切蛋糕一样越切越小。匹配单个字符串运用切的思路去做也是一样的效果(str_cut)。关键还是在---算法!算法写的好,什么函数都是一样哦!

相关文章

编写php应用程序实现摘要式身份验证的方法详解

通基本身份认证一样,也可以使用PHP网页处理HTTP请求报头字段来匹配摘要式身份验证信息。例如下边的代码使用header()函数要求客户端使用Digest验证,它在HTTP消息报头中增加...

PHP基于php_imagick_st-Q8.dll实现JPG合成GIF图片的方法

一、概述: 本文详解了PHP基于php_imagick_st-Q8.dll实现JPG合成GIF图片的方法。 首先要实现PHP使用php_imagick_st-Q8.dll类库,把JPG图...

PHP经典Redis操作类 调用方便,操作简单

/**  * redis操作类  * 说明,任何为false的串,存在redis中都是空串。  * 只有在key不存在时,才会返回fa...

apache php模块整合操作指南

apache php模块整合操作指南

apache的版本: httpd-2.2.21-win32-x86-no_ssl php的版本: php-5[1].3.8-Win32-VC9-x86 (一) 准备工作 1.先找在D:/...

PHP实现采集抓取淘宝网单个商品信息

调用淘宝的数据可以使用淘宝提供的api,如果只需调用淘宝商品图片名称等公开信息在自己网站上,使用php中的 file_get_contents 函数实现即可。 思路: file_get_...