火车采集器 免费版使出收费版本功能实现原理

yipeiwu_com6年前PHP代码库
hi 各位免费火车头采集器的采友:
火车头免费版本不支持采集结果的外挂处理,比如采用php来辅助处理结果,而火车头本身对于正则表达式的不完整支持,
导致对于采集一些有混淆文字的内容效果不好,那么咱们怎么做到过滤那些混淆字串呢?
其实很简单--采用服务器端过滤
比如采集发送到服务器端是:
$_POST = array("subject"=> "这里是标题","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>这里是内容");
在服务器端我们稍加处理:
$_POST["content"] = preg_replace("正则表达式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友说了,我服务器端代码是加密的怎么办?
其实很简单 比如 add.php 加密 ,那么将add.php 改名为 add_ori.php
然后建立新的 add.php
<?
//处理上传来的数据
....
include dirname(__FILE__)."/add_ori.php";
?>
这样就可以了

相关文章

php实现网页上一页下一页翻页过程详解

php实现网页上一页下一页翻页过程详解

前言 这几天做项目因为数据太多,需要对信息进行上下翻页展示,就自己写了翻页的代码 大致功能就是页面只显示几条信息,按上一页、下一页切换内容,当显示第一页时上一页和首页选项不可选,当页面加...

php读取图片内容并输出到浏览器的实现代码

代码很简单,网上都能找到,但在我机子上就是显示不出来,显示出的一直是这个php文件路径, 费了点时间才搞定,原来是我的<?php这个标签前面有多的空格,删掉就ok了,细节问题,粗心...

ThinkPHP中RBAC类的四种用法分析

本文实例讲述了ThinkPHP中RBAC类的四种用法。分享给大家供大家参考。具体方法如下: 第一类:放在登陆控制器的登陆操作中 1.RBAC::authenticate(); 用于在用户...

详解PHP中的mb_detect_encoding函数使用方法

php中可以使用 mb_detect_encoding() 函数来判断字符串是什么编码的。 当在php中使用mb_detect_encoding函数进行编码识别时,很多人都碰到过识别编码...

php使用codebase生成随机数

有25幅作品拿去投票,一次投票需要选16幅,单个作品一次投票只能选择一次。前面有个程序员捅了漏子,忘了把投票入库,有200个用户产生的投票序列为空。那么你会如何填补这个漏子? 当然向上级...