php计算title标题相似比的方法

yipeiwu_com5年前PHP代码库

本文实例讲述了php计算title标题相似比的方法。分享给大家供大家参考。具体如下:

<?php 
/*
 *
 * @param string $title_1 题目1
 * @param string $title_2 题目2
 * @return float $percent 相似百分比
 */
function title_similar($title_1,$title_2) {
  $title_1 = get_real_title($title_1);
  $title_2 = get_real_title($title_2);
  similar_text($title_1, $title_2, $percent);
  return $percent;
}
/**
 * php采集文章题目并去版权
 * @param string $html 需要采集的html源代码
 * @return string
 */
function get_real_title($str){
  $str = str_replace(array('-','—','|'),'_',$str);
  $splits = explode('_', $str);
  $l = 0;
  foreach ($splits as $tp){
    $len = strlen($tp);
    if ($l < $len){$l = $len;$tt = $tp;}
  }
  $tt = trim(htmlspecialchars($tt));
  return $tt;
}
//以下是测试
$title_1 = '代号PHPCMS V9产品正式发布公测版本';
$title_2 = 'PHPCMS再战江湖 V9产品正式发布公测版本';
$percent = title_similar($title_1,$title_2);
echo '相似百分比:'.$percent.'%';
echo "<br />\n";
?>

希望本文所述对大家的php程序设计有所帮助。

相关文章

完美解决:Apache启动问题—(OS 10022)提供了一个无效的参数

今天启动apache2始终无法启动,本以为又是端口问题,可后来查看并未有端口占用问题,于是查看错误日志如下:[Sat Jun 20 03:12:52 2009] [notice] Apa...

PHP中错误与异常的日志记录用法分析

本文分析了PHP中错误与异常的日志记录用法。分享给大家供大家参考,具体如下: 提到 Nginx + PHP 服务的错误日志,我们通常能想到的有 Nginx 的 access 日志、err...

php强制下载文件函数

本文实例为大家分享了php强制下载文件函数,供大家参考,具体内容如下 public function down() { $id = $this->_get('id');...

火车头discuz6.1 完美采集的php接口文件

PS:对原文件的修改较大,程序中注释已经很详尽,这里就不多说了。 复制代码 代码如下:<?php // header('Content-Type:text/html;charset...

php中实现进程锁与多进程的方法

php中实现进程锁与多进程的方法

为什么需要进程锁? 主要作用就是防止你重复执行同一程序,主要用在crontab中,当你设置了一个定时任务,然后每分钟执行一次,如果不加进程锁的话,之前的进程没有执行完的情况下。每分钟都会...