火车采集器 免费版使出收费版本功能实现原理

yipeiwu_com6年前PHP代码库
hi 各位免费火车头采集器的采友:
火车头免费版本不支持采集结果的外挂处理,比如采用php来辅助处理结果,而火车头本身对于正则表达式的不完整支持,
导致对于采集一些有混淆文字的内容效果不好,那么咱们怎么做到过滤那些混淆字串呢?
其实很简单--采用服务器端过滤
比如采集发送到服务器端是:
$_POST = array("subject"=> "这里是标题","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>这里是内容");
在服务器端我们稍加处理:
$_POST["content"] = preg_replace("正则表达式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友说了,我服务器端代码是加密的怎么办?
其实很简单 比如 add.php 加密 ,那么将add.php 改名为 add_ori.php
然后建立新的 add.php
<?
//处理上传来的数据
....
include dirname(__FILE__)."/add_ori.php";
?>
这样就可以了

相关文章

不错的dedecms修改实用集锦第1/2页

采集去除链接 复制代码 代码如下:{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim} ——...

扩展你的 PHP 之入门篇

扩展你的 PHP 之入门篇

扩展你的php 扩展你的php 扩展的3种方式 extension dll方式的扩展 小结   首先注意,以下所有的一切皆在 win 下进行,使用的工具的 VC++6.0。 扩展...

关于PHP session 存储方式的详细介绍

PHP为sesion的存储提供了三种方式: 文件/ 内存/ 自定义存储,默认是使用文件存储.在访问量大的网站上采用这种方式就不大合适,因为这样会导致大量的输入输出的冗余.下面介绍一种基于...

利用curl抓取远程页面内容的示例代码

最基本的操作如下复制代码 代码如下:$curlPost = 'a=1&b=2';//模拟POST数据$ch = curl_init();curl_setopt($ch, CURLOPT_...

php 各种应用乱码问题的解决方法

1) 使用 标签设置页面编码 这个标签的作用是声明客户端的浏览器用什么字符集编码显示该页面,xxx 可以为 GB2312、GBK、UTF-8(和 MySQL 不同,MySQL 是 UTF...