分割GBK中文遭遇乱码的解决方法

yipeiwu_com5年前PHP代码库

类似如下的字符串(GBK), explode不能得到正确结果:

1.$result = explode("|", "滕华弢|海青"); 究其原因, 对于”弢”字(读tao,不认识没关系,我也不认识), 因为他的GBK编码值为: 8f7c, 不巧的是, “|”的ASCII值也是7c.

这样的问题, 还有很多 : 因为GBK编码的编码范围是: 0×8140-0xfefe, 所以, 理论上来说, 任何低字节是7c的字都会有这个问题, 比如:

1.倈(827c), 億(837c), 眧(b17c), 鍇(e57c).......等等等等对于这样的情况,

1.第一, 可以采用转码到utf8, 然后explode, 再转回来, 这是比较麻烦的方法.
2.第二, 我们可以采用正则拿"匹配出"来代替"分离出":
3.preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//写死编码这样, $matches中0号索引对应的数组就是结果词的数组了..

相关文章

PHP 输出缓存详解

输出控制函数不对使用 header() 或 setcookie(), 发送的文件头信息产生影响,只对那些类似于 echo() 和 PHP 代码的数据块有作用。 我们先举一个简单的例子,让...

php smarty模版引擎中的缓存应用

1,Smarty缓存的配置: 复制代码 代码如下:$smarty->cache-dir="目录名"; //创建缓存目录名 $smarty->caching=true; //开...

PHP获取字符流中第一个不重复字符的方法

本文实例讲述了PHP获取字符流中第一个不重复字符的方法。分享给大家供大家参考,具体如下: 问题 请实现一个函数用来找出字符流中第一个只出现一次的字符。例如,当从字符流中只读出前两个字符”...

php过滤htmlspecialchars() 函数实现把预定义的字符转换为 HTML 实体用法分析

本文实例讲述了php过滤htmlspecialchars() 函数实现把预定义的字符转换为 HTML 实体用法。分享给大家供大家参考,具体如下: 这个函数非常重要,特别是在处理中文字符时...

windows下安装php的memcache模块的方法

windows下安装php的memcache模块的方法

要求必备知识 熟悉基本编程环境搭建。 运行环境 windows 7(64位); php-5.3; memcached-1.2.6 下载地址 环境下载 什么是PHP Memcache模块...