2015-05-27
PHP截取html代码,考虑了html标签的闭合问题
/* 生成摘要
* @param (string) $body
* 正文
* @param (int) $size
* 摘要长度
* @param (int) $format
* 输入格式 id
*/
function blog_summary($body, $size, $format = NULL){
$_size = mb_strlen($body, "utf-8');
if($_size <= $size) return $body;
// 输入格式中有 PHP 过滤器
/*
if(!isset($format) && filter_is_php($format)){
return $body;
}
*/
$strlen_var = strlen($body);
// 不包含 html 标签
if(strpos($body, '<') === false){
return mb_substr($body, 0, $size);
}
// 包含截断标志,优先
if($e = strpos($body, '<!-- break -->')){
return mb_substr($body, 0, $e);
}
// html 代码标记
$html_tag = 0;
// 摘要字符串
$summary_string = '';
/**
* 数组用作记录摘要范围内出现的 html 标签
* 开始和结束分别保存在 left 和 right 键名下
* 如字符串为:<h3><p><b>a</b></h3>,假设 p 未闭合
* 数组则为:array('left' => array('h3', 'p', 'b'), 'right' => 'b', 'h3');
* 仅补全 html 标签,<? <% 等其它语言标记,会产生不可预知结果
*/
$html_array = array('left' => array(), 'right' => array());
for($i = 0; $i < $strlen_var; ++$i) {
if(!$size){
break;
}
$current_var = substr($body, $i, 1);
if($current_var == '<'){
// html 代码开始
$html_tag = 1;
$html_array_str = '';
}else if($html_tag == 1){
// 一段 html 代码结束
if($current_var == '>'){
/**
* 去除首尾空格,如 <br / > < img src="" / > 等可能出现首尾空格
*/
$html_array_str = trim($html_array_str);
/**
* 判断最后一个字符是否为 /,若是,则标签已闭合,不记录
*/
if(substr($html_array_str, -1) != '/'){
// 判断第一个字符是否 /,若是,则放在 right 单元
$f = substr($html_array_str, 0, 1);
if($f == '/'){
// 去掉 /
$html_array['right'][] = str_replace('/', '', $html_array_str);
}else if($f != '?'){
// 判断是否为 ?,若是,则为 PHP 代码,跳过
/**
* 判断是否有半角空格,若有,以空格分割,第一个单元为 html 标签
* 如 <h2 class="a"> <p class="a">
*/
if(strpos($html_array_str, ' ') !== false){
// 分割成2个单元,可能有多个空格,如:<h2 class="" id="">
$html_array['left'][] = strtolower(current(explode(' ', $html_array_str, 2)));
}else{
/**
* * 若没有空格,整个字符串为 html 标签,如:<b> <p> 等
* 统一转换为小写
*/
$html_array['left'][] = strtolower($html_array_str);
}
}
}
// 字符串重置
$html_array_str = '';
$html_tag = 0;
}else{
/**
* 将< >之间的字符组成一个字符串
* 用于提取 html 标签
*/
$html_array_str .= $current_var;
}
}else{
// 非 html 代码才记数
--$size;
}
$ord_var_c = ord($body{$i});
switch (true) {
case (($ord_var_c & 0xE0) == 0xC0):
// 2 字节
$summary_string .= substr($body, $i, 2);
$i += 1;
break;
case (($ord_var_c & 0xF0) == 0xE0):
// 3 字节
$summary_string .= substr($body, $i, 3);
$i += 2;
break;
case (($ord_var_c & 0xF8) == 0xF0):
// 4 字节
$summary_string .= substr($body, $i, 4);
$i += 3;
break;
case (($ord_var_c & 0xFC) == 0xF8):
// 5 字节
$summary_string .= substr($body, $i, 5);
$i += 4;
break;
case (($ord_var_c & 0xFE) == 0xFC):
// 6 字节
$summary_string .= substr($body, $i, 6);
$i += 5;
break;
default:
// 1 字节
$summary_string .= $current_var;
}
}
if($html_array['left']){
/**
* 比对左右 html 标签,不足则补全
*/
/**
* 交换 left 顺序,补充的顺序应与 html 出现的顺序相反
* 如待补全的字符串为:<h2>abc<b>abc<p>abc
* 补充顺序应为:</p></b></h2>
*/
$html_array['left'] = array_reverse($html_array['left']);
foreach($html_array['left'] as $index => $tag){
// 判断该标签是否出现在 right 中
$key = array_search($tag, $html_array['right']);
if($key !== false){
// 出现,从 right 中删除该单元
unset($html_array['right'][$key]);
}else{
// 没有出现,需要补全
$summary_string .= '</'.$tag.'>';
}
}
}
return $summary_string;
}
</pre>
-->
1
CI框架连接数据库配置操作以及多数据库操作
09-05
2
asp 简单读取数据表并列出来 ASP如何快速从数据库读取大量数据
05-17
3
C语言关键字及其解释介绍 C语言32个关键字详解
04-05
4
C语言中sizeof是什么意思 c语言里sizeof怎样用法详解
04-26
5
PHP中的魔术方法 :__construct, __destruct , __call, __callStatic,__get, __set, __isset, __unset , __sleep,
09-05
6
将视频设置为Android手机开机动画的教程
12-11
7
PHP中的(++i)前缀自增 和 (i++)后缀自增
09-05
8
最简单的asp登陆界面代码 asp登陆界面源代码详细介绍
04-12
常用dos命令及语法
2014-09-27
PHP中include和require区别之我见
2014-09-05
如何安装PHPstorm并配置方法教程 phpstorm安装后要进行哪些配置
2017-05-03
php递归返回值的问题
2014-09-05
单片机编程好学吗?单片机初学者怎样看懂代码
2022-03-21
PHP 教程之如何使用BLOB存取图片信息实例
2014-09-05
学ug编程如何快速入门?
2022-03-17
PHP数组函数array
2014-09-05
学习使用C语言/C++编程的7个步骤!超赞~
2022-03-20
零基础的初学者怎样学习java,或者应该先学什么?
2022-03-21
坦克沙盒游戏手机版(坦克物理模拟)下载v9.0 安卓版
其它手游 241.7MB
下载
太空人抽卡对决手机版下载v1.6 安卓版
其它手游 77.61MB
下载
棕熊露营旅行游戏下载v1.1.0 安卓版
其它手游 32.94MB
下载
回家的猫游戏下载v2.5.18 安卓版
角色扮演 105.86MB
下载
蜗牛鲍勃3游戏(snail bob 3)下载v1.0.34 安卓版
其它手游 96.55MB
下载
snail bob3最新版下载v1.0.34 安卓版
其它手游 96.55MB
下载
西梅小说手机版v1.0
其它手游 24.36MB
下载
超级舰队3k破解版下载v10.3 安卓最新版
策略塔防 100.64MB
下载房间的秘密2起点官方版下载v1.2.4.df926432 安卓版
下载
葫芦娃tv版小y游戏下载v3.0.8 安卓版
下载
葫芦娃tv版渠道游戏下载v3.0.8 安卓版
下载
足球大玩家手游下载v1.224.6 安卓最新版
下载
辉烬embers手游官方下载v1.0.0 安卓版
下载
代号辉烬手游下载v1.0.0 安卓版
下载
远光84手游下载v1.1.1.3.1612300 安卓版
下载
逆战助手app下载v3.15.0 安卓版
下载