火车采集器 免费版使出收费版本功能实现原理

yipeiwu_com6年前PHP代码库
hi 各位免费火车头采集器的采友:
火车头免费版本不支持采集结果的外挂处理,比如采用php来辅助处理结果,而火车头本身对于正则表达式的不完整支持,
导致对于采集一些有混淆文字的内容效果不好,那么咱们怎么做到过滤那些混淆字串呢?
其实很简单--采用服务器端过滤
比如采集发送到服务器端是:
$_POST = array("subject"=> "这里是标题","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>这里是内容");
在服务器端我们稍加处理:
$_POST["content"] = preg_replace("正则表达式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友说了,我服务器端代码是加密的怎么办?
其实很简单 比如 add.php 加密 ,那么将add.php 改名为 add_ori.php
然后建立新的 add.php
<?
//处理上传来的数据
....
include dirname(__FILE__)."/add_ori.php";
?>
这样就可以了

相关文章

php下使用无限生命期Session的方法

在PHP4.0中加入了对Session的支持,方便了我们很多程序,比如购物车等等!    在很多论坛中,Session也用于处理用户的登陆,记录下用户名和密码,使得用户不必每次...

PHP 伪静态技术原理以及突破原理实现介绍

先说实现方法: inj.php: 复制代码 代码如下: <?php set_time_limit(10); $id=$_GET["id"]; $id=str_replace(" "...

php判断输入是否是纯数字,英文,汉字的方法

本文实例讲述了php判断输入是否是纯数字,英文,汉字的方法。分享给大家供大家参考。具体分析如下: 这里利用php的mb_strlen和strlen函数就可以轻松得知字符串的构成是全英文、...

php读取图片内容并输出到浏览器的实现代码

代码很简单,网上都能找到,但在我机子上就是显示不出来,显示出的一直是这个php文件路径, 费了点时间才搞定,原来是我的<?php这个标签前面有多的空格,删掉就ok了,细节问题,粗心...

php微信开发自定义菜单

php微信开发自定义菜单

目前微信服务号自定义菜单最多包括3个一级菜单,每个一级菜单最多包含5个二级菜单。一级菜单最多4个汉字,二级菜单最多7个汉字,多出来的部分将会以“...”代替。请注意,创建自定义菜单后,由...