比较strtr, str_replace和preg_replace三个函数的效率
之前已经分析过strtr的源码了,现在就比较strtr, str_replace和preg_replace的效率:
$str =
'111111110000000000000000000000000000000111000001000100010000010010000010010000010100000010
';
$str = str_repeat($str, 1);
$pattern1 = array('12345'=>'', '67891'=>'');
$pattern2 = array('a'=>'', '1234567890'=>'');
$pattern3 = '/12345|67891/';
$pattern4 = '/a|1234567890/';
$pattern5 = array('12345', '67891');
$pattern6 = array('a', '1234567890');
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
strtr($str, $pattern1);
}
echo microtime(true)-$t, "/n"; //0.21915886878967 0.47268319129944
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
strtr($str, $pattern2);
}
echo microtime(true)-$t, "/n"; //0.4768660068512 2.7257590293884
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
preg_replace($pattern3, '', $str);
}
echo microtime(true)-$t, "/n"; //0.30504012107849 1.0864448547363
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
preg_replace($pattern4, '', $str);
}
echo microtime(true)-$t, "/n"; //0.30298089981079 1.117014169693
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
str_replace($pattern5, '', $str);
}
echo microtime(true)-$t, "/n"; //0.18029189109802 0.22510504722595
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
str_replace($pattern6, '', $str);
}
echo microtime(true)-$t, "/n"; //0.18104100227356 0.23055601119995
//说明:当str_repeat的第二个参数为1时输出第一个数字,当为8时输出第二个数字
从输出结果来看,str_replace的整体表现相对strtr和preg_replace要好的。原因从查看str_replace的源码(http://code.google.com/p/cyy0523xc/source/browse/trunk/php/str_replace源码.c)就可以看出,str_replace(array search, string|array replace, string subject)在执行的时候会对search的每一个元素按照先后顺序进行循环(不是按照下标或者其他的什么顺序,这个和数组在底层的实现有关),然后到subject中去匹配,如果找到就替换为相应的replace。这样从效率上的确会比strtr好,因为还会多一个从下标的最大长度到最小长度的循环,如果这时下标字符串的长度变化比较大的话,且subject字符串比较长的话,这里的开销也是比较大的。不过str_replace这样的实现也有个我们需要注意的地方,就是它不会像strtr那样最大匹配优先。例如:
str_replace(array('ab', 'abc'), '1', 'abcd');
如果使用的是strtr,我们输出的结果会是“1d”,因为strtr会实现最大匹配。但是str_replace却会输出“1cd”,因为在search字符串中‘ab'排在“abc”的前面,所以会先把‘ab'替换成了‘1'。
现在小结一下这三个函数的用法:
str_replace:这个应该作为字符串替换的首选方法,不过有一点需要注意,就是把最希望匹配的元素放在前面。(为了效率的提升,有时这样做也是值得的)
strtr: strtr在短字符串替换的时候也是挺高效的,不过search数组的下标长度的差别也对效率产生比较大的影响,还有就是没事最好不要使用strtr(string, string, string)这种形式(对于非单字节字符很容易产生乱码)。
preg_replace:这个不用说,可以使用正则匹配,功能绝对是最强的,不过也是要牺牲一点效率的。
复制代码 代码如下:
$str =
'111111110000000000000000000000000000000111000001000100010000010010000010010000010100000010
';
$str = str_repeat($str, 1);
$pattern1 = array('12345'=>'', '67891'=>'');
$pattern2 = array('a'=>'', '1234567890'=>'');
$pattern3 = '/12345|67891/';
$pattern4 = '/a|1234567890/';
$pattern5 = array('12345', '67891');
$pattern6 = array('a', '1234567890');
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
strtr($str, $pattern1);
}
echo microtime(true)-$t, "/n"; //0.21915886878967 0.47268319129944
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
strtr($str, $pattern2);
}
echo microtime(true)-$t, "/n"; //0.4768660068512 2.7257590293884
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
preg_replace($pattern3, '', $str);
}
echo microtime(true)-$t, "/n"; //0.30504012107849 1.0864448547363
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
preg_replace($pattern4, '', $str);
}
echo microtime(true)-$t, "/n"; //0.30298089981079 1.117014169693
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
str_replace($pattern5, '', $str);
}
echo microtime(true)-$t, "/n"; //0.18029189109802 0.22510504722595
$t = microtime(true);
for($i=0; $i<10000; $i++)
{
str_replace($pattern6, '', $str);
}
echo microtime(true)-$t, "/n"; //0.18104100227356 0.23055601119995
//说明:当str_repeat的第二个参数为1时输出第一个数字,当为8时输出第二个数字
从输出结果来看,str_replace的整体表现相对strtr和preg_replace要好的。原因从查看str_replace的源码(http://code.google.com/p/cyy0523xc/source/browse/trunk/php/str_replace源码.c)就可以看出,str_replace(array search, string|array replace, string subject)在执行的时候会对search的每一个元素按照先后顺序进行循环(不是按照下标或者其他的什么顺序,这个和数组在底层的实现有关),然后到subject中去匹配,如果找到就替换为相应的replace。这样从效率上的确会比strtr好,因为还会多一个从下标的最大长度到最小长度的循环,如果这时下标字符串的长度变化比较大的话,且subject字符串比较长的话,这里的开销也是比较大的。不过str_replace这样的实现也有个我们需要注意的地方,就是它不会像strtr那样最大匹配优先。例如:
复制代码 代码如下:
str_replace(array('ab', 'abc'), '1', 'abcd');
如果使用的是strtr,我们输出的结果会是“1d”,因为strtr会实现最大匹配。但是str_replace却会输出“1cd”,因为在search字符串中‘ab'排在“abc”的前面,所以会先把‘ab'替换成了‘1'。
现在小结一下这三个函数的用法:
str_replace:这个应该作为字符串替换的首选方法,不过有一点需要注意,就是把最希望匹配的元素放在前面。(为了效率的提升,有时这样做也是值得的)
strtr: strtr在短字符串替换的时候也是挺高效的,不过search数组的下标长度的差别也对效率产生比较大的影响,还有就是没事最好不要使用strtr(string, string, string)这种形式(对于非单字节字符很容易产生乱码)。
preg_replace:这个不用说,可以使用正则匹配,功能绝对是最强的,不过也是要牺牲一点效率的。