php中英文混合字符串截取问题

yipeiwu_com5年前PHP代码库

但是在英文和汉字混合的情况下会出现如下问题:

如果有这样一个字符串

$str="这是一个字符串";

为了截取该串的前10个字符,使用

if(strlen($str)>10) $str=substr($str,10)."…";

那么,echo $str的输出应该是"这是一个字…"

假设

$str="这是1个字符串";

这个串中包含了一个半角字符,同样执行:

if(strlen($str)>10) $str=substr($str,10);

由于原字符串$str的第10、11个字符构成了汉字“符”;
执行串分割后会将该汉字一分为二,这样被截取的串就会发现乱码现象。


请问这种问题如何解决?即要使过长字符串实现分割,又不能让它发生乱码?请看以下函数

<?php
//村里有很多,这个是gb2312
function substrs($content, $length = '30')
{
    if ($length && strlen($content) > $length) {
        $num = 0;
        for ($i = 0; $i < $length - 3; $i++) {
            if (ord($content[$i]) > 127) {
                $num++;
            }
        }
        $num % 2 == 1 ? $content = substr($content, 0, $length - 4) : $content = substr($content, 0, $length - 3);
    }
    return $content;
}

function cutstr($string, $length, $dot = ' ...')
{
    $strcut = '';
    for ($i = 0; $i < $length - strlen($dot) - 1; $i++) {
        $strcut .= ord($string[$i]) > 127 ? $string[$i] . $string[++$i] : $string[$i];
    }
    return $strcut . $dot;
}


function cutTitle($str, $len, $tail = "")
{
    $length = strlen($str);
    $lentail = strlen($tail);
    $result = "";
    if ($length > $len) {
        $len = $len - $lentail;
        for ($i = 0; $i < $len; $i++) {
            if (ord($str[$i]) < 127) {
                $result .= $str[$i];
            } else {
                $result .= $str[$i];
                ++$i;
                $result .= $str[$i];
            }
        }
        $result = strlen($result) > $len ? substr($result, 0, -2) . $tail : $result . $tail;
    } else {
        $result = $str;
    }
    return $result;
}


以下是一些补充:
1. 截取GB2312中文字符串 

<?php
//截取中文字符串 
function mysubstr($str, $start, $len)
{
    $tmpstr = "";
    $strlen = $start + $len;
    for ($i = 0; $i < $strlen; $i++) {
        if (ord(substr($str, $i, 1)) > 0xa0) {
            $tmpstr .= substr($str, $i, 2);
            $i++;
        } else
            $tmpstr .= substr($str, $i, 1);
    }
    return $tmpstr;
}

?>


2. 截取utf8编码的多字节字符串 

<?php
//截取utf8字符串 
function utf8Substr($str, $from, $len)
{
    return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,' . $from . '}' .
        '((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,' . $len . '}).*#s',
        '$1', $str);
}

?>


3. UTF-8、GB2312都支持的汉字截取函数 

<?php
/* 
Utf-8、gb2312都支持的汉字截取函数 
cut_str(字符串, 截取长度, 开始长度, 编码); 
编码默认为 utf-8 
开始长度默认为 0 
*/
function cut_str($string, $sublen, $start = 0, $code = 'UTF-8')
{
    if ($code == 'UTF-8') {
        $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
        preg_match_all($pa, $string, $t_string);
        if (count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen)) . "...";
        return join('', array_slice($t_string[0], $start, $sublen));
    } else {
        $start = $start * 2;
        $sublen = $sublen * 2;
        $strlen = strlen($string);
        $tmpstr = '';
        for ($i = 0; $i < $strlen; $i++) {
            if ($i >= $start && $i < ($start + $sublen)) {
                if (ord(substr($string, $i, 1)) > 129) {
                    $tmpstr .= substr($string, $i, 2);
                } else {
                    $tmpstr .= substr($string, $i, 1);
                }
            }
            if (ord(substr($string, $i, 1)) > 129) $i++;
        }
        if (strlen($tmpstr) < $strlen) $tmpstr .= "...";
        return $tmpstr;
    }
}

$str = "www.yipeiwu.com宜配屋视频录像回放下载--需要截取的字符串";
echo cut_str($str, 8, 0, 'gb2312');
?>


4. BugFree 的字符截取函数 

<?php
/**
 * @param string $String the string to cut.
 * @param int $Length the length of returned string.
 * @param booble $Append whether append "...": false|true
 * @return string the cutted string.
 * @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $
 *
 *
 * Return part of a string(Enhance the function substr())
 *
 * @author Chunsheng Wang
 * @package BugFree
 */
function sysSubStr($String, $Length, $Append = false)
{
    if (strlen($String) <= $Length) {
        return $String;
    } else {
        $I = 0;
        while ($I < $Length) {
            $StringTMP = substr($String, $I, 1);
            if (ord($StringTMP) >= 224) {
                $StringTMP = substr($String, $I, 3);
                $I = $I + 3;
            } elseif (ord($StringTMP) >= 192) {
                $StringTMP = substr($String, $I, 2);
                $I = $I + 2;
            } else {
                $I = $I + 1;
            }
            $StringLast[] = $StringTMP;
        }
        $StringLast = implode("", $StringLast);
        if ($Append) {
            $StringLast .= "...";
        }
        return $StringLast;
    }
}

$String = "www.yipeiwu.com";
$Length = "18";
$Append = false;
echo sysSubStr($String, $Length, $Append);
?>


标签: 字符串函数

相关文章

怎样使用PHP中的字符串函数

    PHP中的字符串操作功能是比较多的,重要的有以下这些:    (1)echo,print,printf,sprintf &...