php小技巧之过滤ascii控制字符

yipeiwu_com6年前PHP代码库

还记得以前在工作中,将爬来的其它网站的数据导到xml。但是会遇到一个问题:即网页会有ascII的控制字符。一开始以为是别人为了防止采集而加入的,然后发现一个就往过滤表里加一个。直到慢慢发现,他们都是ascii表里的字符。找到原因了,就好解决了。

复制代码 代码如下:

/**
 * 根据ascii码过滤控制字符
 * @param type $string
 */
public static function special_filter($string)
{
 if(!$string) return '';

 $new_string = '';
 for($i =0; isset($string[$i]); $i++)
 {
  $asc_code = ord($string[$i]);    //得到其asc码

  //以下代码旨在过滤非法字符
  if($asc_code == 9 || $asc_code == 10 || $asc_code == 13){
   $new_string .= ' ';
  }
  else if($asc_code > 31 && $asc_code != 127){
   $new_string .= $string[$i];
  }
 }

 return trim($new_string);
}

相关文章

php采集速度探究总结(原创)

 注意:下面的所有函数都没有用正则。 以上为取出第一个匹配的三个函数,实现相同的目的 function str_cut($str ,$start, ...

php iconv() : Detected an illegal character in input string

开始是这样用的$str = iconv('UTF-8', 'GB2312', unescape(isset($_GET['str'])? $_GET['str']:''));上线后报一堆...

PHP XML数据解析代码

复制代码 代码如下: //xml string $xml_string="<?xml version='1.0'?> <users> <user id='3...

php抓取网站图片并保存的实现方法

php抓取网站图片并保存的实现方法

php如何实现抓取网页图片,相较于手动的粘贴复制,使用小程序要方便快捷多了,喜欢编程的人总会喜欢制作一些简单有用的小软件,最近就参考了网上一个php抓取图片代码,封装了一个php远程抓取...

深入PHP FTP类的详解

FTP是一种文件传输协议,它支持两种模式,一种方式叫做Standard (也就是Active,主动方式),一种是 Passive (也就是PASV,被动方式)。 Standard模式 F...