PHP将HTML转换成文本的实现代码

yipeiwu_com5年前PHP代码库

核心代码:

<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
         "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
         "'([\r\n])[\s]+'",         // 去掉空白字符
         "'&(quot|#34);'i",         // 替换 HTML 实体
         "'&(amp|#38);'i",
         "'&(lt|#60);'i",
         "'&(gt|#62);'i",
         "'&(nbsp|#160);'i",
         "'&(iexcl|#161);'i",
         "'&(cent|#162);'i",
         "'&(pound|#163);'i",
         "'&(copy|#169);'i",
         "'&#(\d+);'e");          // 作为 PHP 代码运行

$replace = array ("",
         "",
         "\\1",
         "\"",
         "&",
         "<",
         ">",
         " ",
         chr(161),
         chr(162),
         chr(163),
         chr(169),
         "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>

相关文章

浅谈ThinkPHP5.0版本和ThinkPHP3.2版本的区别

5.0版本和之前版本的差异较大,本篇对熟悉3.2版本的用户给出了一些5.0的主要区别。 URL和路由 5.0的URL访问不再支持普通URL模式,路由也不支持正则路由定义,而是全部改为规则...

PHP数组去重的更快实现方式分析

本文实例讲述了PHP数组去重的更快实现方式。分享给大家供大家参考,具体如下: 概述 使用PHP的array_unique()函数允许你传递一个数组,然后移除重复的值,返回一个拥有唯一值的...

PHP中文乱码解决方案

汉字乱码真是一个悲催的事情,JAVA讨厌汉字,PHP也不喜欢汉字;     Java乱码最终使用了spring给出的过滤器来过滤,处处过滤,其实影响了速度,...

php对象在内存中的存在形式分析

php对象在内存中的存在形式分析

本文实例分析了php对象在内存中的存在形式。分享给大家供大家参考。具体分析如下: <?php class Person{ public $name; public...

php学习笔记之面向对象编程

复制代码 代码如下:<?phpclass db {     private $mysqli; //数据库连接     p...