纯粹空间 - 韩国欧美酷站教程设计素材美女壁纸下载论坛免费博客

伪静态页面的制作

2010-02-10

我们看到一些网站，地址是以 .htm 或 .html 结尾的，形如 http://www.k810.com/html/guide/2/1.htm 这样的格式，其中有一部分是真的静态页面，有一些侧是伪静态的。
静态和伪静态的网站我都有做过，其中伪静态的制作和维护都容易一些。所以先向大家介绍伪静态的实现方法。我这里介绍的方法并非用 URL Rewrite (URL重写)实现，不用改写复杂的 URL Rewrite 规则，制作维护起来更加简便。

详细的案例请查看 http://www.k810.com/ 。由于像“会员中心”那些页面，需要登录才能访问的，就不做成伪静态了。否则容易暴露该站点的“静态页面”是假的，呵呵。

第一步，Apache 配置。

Apache 配置，要求在 httpd.conf 的 Directory-Options 中添加 MultiViews 支持。例如

<Directory "D:/wwwroot/">
Options Indexes FollowSymLinks MultiViews
## 默认为 Options Indexes FollowSymLinks

AllowOverride None
 Order allow,deny
 Allow from all
</Directory>

先介绍一下实现的原理。假如一个网页的动态地址为 guide.php?page=2&typeid=1 ，对应的伪静态地址为 html/guide/2/1.htm 。

开启了 MultiViews 后，保证的根目录下没有 html/ 目录，然后新建 html.php 文件。访问地址 html/guide/2/1.htm 时，由于 Apache 找不到 html/ 目录，它会读取并用PHP解释 html.php 这个文件。所以我们要在 html.php 中，解读这个伪静态地址为对应的动态地址，然后向用户输出相应的内容。

第二步，创建 html.php 文件。

html.php 的代码及解释:

<?
$parseformat = array();

// 变量格式设定：
// 每个文件允许接受的 GET 变量，以 / 分隔
// 静态地址中，每个值的顺序会与变量名顺序对应
// 建议常用到的变量写在前面，可能不会接收到的变量写在后面

$parseformat['tech.php'] = 'page';
$parseformat['tech_type.php'] = 'typeid/page';
$parseformat['tech_details.php'] = 'id';

$parseformat['guide.php'] = 'page';
$parseformat['guide_details.php'] = 'id';

// SCRIPT_IN_ROOTPATH : 本文件相对 document_root 所在的文件夹(以 / 结尾)
$this_script_path = str_replace('\\','/',dirname(__FILE__)."/");
if(!defined("SCRIPT_IN_ROOTPATH")){
define("SCRIPT_IN_ROOTPATH", substr($this_script_path,strlen($_SERVER['DOCUMENT_ROOT']) ) );
}

// 动态链接解释并规范化,返回一个动态链接对应的静态链接
// 在链接向一个静态页面时需要调用，其中 $link 是一个动态链接的地址，如 xxx.php?typeid=1&page=2
// 返回 html/xxx/1/2.htm 这样的格式
function url($link){

global $parseformat;

//分解 $link 字符串为两部份，以 "?" 号分隔，前面部份是文件路径 $url_file，后面部份是请求字符串 $url_query
 $url_file = $url_query = '';
list($url_file,$url_query) = split('\?',$link,2);

//若是以 "/" 开头的绝对路径，则改为相对路径
if($url_file[0]=='/'){
$url_file = substr($url_file,strlen(SCRIPT_IN_ROOTPATH));
}

// 将文件路径 / 替换为 --
$url_file = str_replace('/','--',$url_file);

//去掉文件名中的 ".php" 后缀
$file = substr($url_file,0,-4);
if(!$file) $file = "index";

//将 url_query 的值解释到 $query_values 数组
$query_values = array();
if($url_query) parse_str($url_query,$query_values);

// 该文件的变量格式，分解为数组
$format_arr = array();
if($parseformat["$file.php"]) $format_arr = split('/',$parseformat["$file.php"]);

// 各个变量的值，按照变量名的出现顺序规范排列
$querys = array();
foreach($format_arr as $fa){
$querys[] = $query_values["$fa"];
}
$query = join('/',$querys);

// 去除末尾 / 号
// 为什么会出现末尾的 / 号呢
// xxx.php?typeid=1&page=2 => html/xxx/1/2.htm
// xxx.php?typeid=1 => html/xxx/1/.htm
// 因为有些变量不一定要传值，但设置里面有这个变量，需要给它留一个位置
// 如果这个位置是在最后，就可以去掉了。
 if(strrchr($query,'/')=='/'){
$query = preg_replace('/\/+$/mis','',$query);
}

// 返回的链接，加上 .htm 字符。
// 看得出来 .htm 这几个字符其实是多余的，反向解释的时候还要先去掉呢
 $htmlfile = SCRIPT_IN_ROOTPATH."html/".$file.($query?"/$query":"").".htm";

return $htmlfile;
}

// 直接访问 html.php, 即用户访问的路径为伪静态地址时:
// 这里是反向解释，把静态链接解释为对应的动态链接；
// 把 html/xxx/1/2.htm 这样的访问格式，解释为 xxx.php?typeid=1&page=2 相同的效果
if(basename($_SERVER['SCRIPT_FILENAME'])==basename(__FILE__)){

list($request_uri,) = split('\?',str_replace('\\','/',$_SERVER['REQUEST_URI']),2); // ?号后的去掉,HTML 的路径是不需要那部份的

// 访问路径,去掉 SCRIPT_IN_ROOTPATH 和 .htm
$uri_string = substr($request_uri,strlen(SCRIPT_IN_ROOTPATH),-4);

// 以 "/" 号为分隔，分解访问路径到数组中
// 第一项值当然是 html，第二项是没有后缀的实际文件路径，其他为各个请求变量对应的值。

$uri_string_arr = split('/',$uri_string);

//文件路径，加回 .php 后缀
$phpfile = str_replace('--','/',$uri_string_arr[1]).".php";

// $_SERVER['PHP_SELF'] 这个系统变量, 用伪静态访问的话，会是 html.php ...
$_SERVER['PHP_SELF'] = SCRIPT_IN_ROOTPATH.$phpfile;

//读取变量的格式，分解为数组
$format_arr = array();
if($parseformat["$phpfile"]) $format_arr = split('/',$parseformat["$phpfile"]);

//静态地址中的变量值，把它们赋值到 $_REQUEST 和 $_GET 对应的变量中:

for($i=0;$i<count($format_arr);$i++){
if(isset($uri_string_arr[$i+2]) && $format_arr[$i]){
$queryvalue = urldecode($uri_string_arr[$i+2]);
if(!isset($_REQUEST["$format_arr[$i]"])) $_REQUEST["$format_arr[$i]"] = $queryvalue;
if(!isset($_GET["$format_arr[$i]"])) $_GET["$format_arr[$i]"] = $queryvalue;
}
}

//include 实际的文件
chdir(dirname($phpfile)) && @include($this_script_path.$phpfile);

}
?>

第三步，包含 html.php 。
其他页面，包括指向 guide.php 的页面和 guide.php 页面本身，只需要以 <? include_once("html.php");?> 开头，再添加其他内容即可。

第四步，添加 BASE HREF 。
由于伪静态页面的路径和动态的不一样，导致浏览器解释到的目录不同，所以需要在 HTML 代码的<HEAD>部分，添加 BASE HREF 标签，代码如
<base href='http://www.k810.com/' />
其中的网址改为你自己的网站地址。

第五步，链接改写。

其中指向伪静态页面的链接，写为类似<?=url("guide.php?page=2&typeid=1");?> 这样的格式，得到标准的伪静态链接。例如

<? include_once("html.php");?>
<html>
<head>
<title>快精灵</title>
<base href='http://www.k810.com/' />
<head>
<body>
<a href="./">首页</a>
<a href="<?=url("guide.php?page=2&typeid=1");?>">设计指南</a>
</body>
</html>

至此，我们的伪静态页面制作完成。添加多个伪静态页面，只要改下程序，并不需要再改写 URL Rewrite 规则，或者虚拟机上多个站点需要制作成伪静态页面，这种方式显得特别简单。

要改回动态的站点，只需要把 html.php 的内容改为 <? function url($link){return $link;} ?> 即可，是不是很方便呢？

我制作了简单的实例供参考，需要的朋友可以点击如下地址下载：

http://www.k810.com/html/article/83.htm

[技术探讨] :: 评论 (3) :: 得分 (13)

MySQL 6.0 有严重的 BUG

2008-03-10

MySQL 6.0 有严重的 BUG!
仔细对比以下三句的区别,返回的行数就是不同:
(在 MySQL 5.0 和 5.1 中都是返回 1 行)
由于 MySQL 6.0 尚处于开发测试阶段,建议朋友们暂时不要升级到该版本.

SELECT *
FROM `con_shipment`
WHERE `productsnumber` = '58161-169670'
ORDER BY `shipmentid` ; # MySQL 返回的查询结果为空(即零行)。

SELECT *
FROM `con_shipment`
WHERE `productsnumber` = '58161-169670'; # 行数: 1

SELECT `shipmentid` , `productsnumber`
FROM `con_shipment`
WHERE `productsnumber` = '58161-169670'
ORDER BY `shipmentid` ; # 行数: 1

[技术探讨] :: 评论 (3) :: 得分 (13)

使用虚拟硬盘Ramdisk对MySQL数据库性能的影响实测

2008-03-01

Ramdisk 是一款虚拟硬盘软件。它的作用是把物理内存划出一部分当作硬盘使用。
这篇文章，测试的是在 Windows 2003 下，把系统临时目录设置到虚拟硬盘后，对MySQL数据库性能的影响。

测试环境：
CPU： AMD Athlon 64 3400+ (2.2GHz)
内存：1 GB DDR 333 (3.0-3-3-7)
硬盘：Seagate ST3160812AS (酷鱼九 160G SATA)
操作系统：Windows Server 2003 Standard Edition
MYSQL 版本：6.0.3-alpha-community

测试采用一个 10.0M 的数据表 table1 （含3.7万行数据），测试查询语句为:

select * from table1 order by rand() limit 0,30;

使用 rand() 随机排序的查询，MySQL 会自动创建临时表。

----
测试一：系统临时目录设置在物理硬盘。
按照系统默认，系统变量 TEMP 和 TMP 的值为 C:\windows\TEMP，用户变量 TEMP 和 TMP 的值这里也设为 C:\windows\TEMP。

系统刚启动完成，在 PHPMyAdmin 中运行查询语句，并刷新 10 次，把每次查询用时记录下来，结果如下（单位为秒）：

1.7446 1.1523 1.2543 1.5410 1.4012 1.3716 1.4238 1.5215 1.1823 1.1505

---
测试二：系统临时目录设置在虚拟硬盘。
用 Ramdisk 虚拟出一个 128M 的虚拟硬盘 R: 。
把系统变量 TEMP 和 TMP 设为 R:\TEMP，用户变量 TEMP 和 TMP 也设为 R:\TEMP。

重启系统并启动完成后，在 PHPMyAdmin 中运行同样的查询，一样记录 10 次查询用时，结果如下（单位为秒）：

1.2243 0.4750 0.4903 0.5119 0.5124 0.4752 0.5029 0.4912 0.4879 0.4814

---

结论:
1) 每个测试的第1次查询，用时都明显比后面的9次要多。这是由于 MySQL 的缓存机制，第1次会把数据载入缓存。
而每个测试的后9次查询，用时相差不大，在合理的范围内跳动.

2) 测试二中,使用虚拟硬盘作临时目录,明显比测试一中用物理硬盘作临时目录快的多。从数据可以看出，查询用时少了一倍以上。

3) 测试的表只有 10.0M ，若是更大的表，理论上速率相差会更多。

4) 本测试中的语句需要创建临时表。若是不需要创建临时表的查询，查询速率相差不大。

Ramdisk 的下载见附件。

[技术探讨] :: 评论 (1) :: 得分 (3)

截取字符串时,截断HTML的问题

2007-11-13

在截取字符串时，如果该串中含 HTML 代码，往往会把 HTML 截断，比如：
$string = "aaaaaaaaaa bbbbbbbbbb cccccccccc dddddddddd eeeeeeeeee";
截取 29 个字符：
$len = 29;
echo substr($string,0,$len);
将会得到： aaaaaaaaaa bbbbbbbbbb<br

用以下方法，可以避免从 HTML 代码处截断，而且长度的计算，不算上代码的长度，更比较切合实际：

<?

$len = 29;
$string = "aaaaaaaaaa bbbbbbbbbb cccccccccc dddddddddd eeeeeeeeee";

echo substr($string,0,$len);
// Result: aaaaaaaaaa bbbbbbbbbb bbbbbbbbbb ccccccccc

/** Function Start,faisun@sina.com **/
function cut_without_tags($string,$len){
/*
Split $string to array:
"aaaaaaaaaa"," ","bbbbbbbbbb"," ","cccccccccc"," ","dddddddddd"," ","eeeeeeeeee"
*/
$spchar = chr(1).chr(2).chr(4); // A special String
$s = str_replace("<","$spchar<",$string);
$s = str_replace(">",">$spchar",$s);
$str_array = split("$spchar",$s);

$new_str = "";
$new_str_len = 0;
$temp_lem = 0;

foreach($str_array as $s){

$tag = strrchr($s,'<')?true:false; // Is a HTML tag?

if(!$tag) $temp_lem += strlen($s); // valid length,if NOT a HTML tag

if( $temp_lem < $len ){
$new_str .= $s;
$new_str_len = $temp_lem;
}else if($new_str_len==$len || $tag){
$new_str .= $s;
$new_str_len = $temp_lem;
break;
}else{
$new_str .= substr($s,0,$len-$new_str_len); //Cut, if too long and NOT a HTML tag
break;
}
}
return $new_str;
}

?>

中文的截取，在字符串的长度计算和截取方面有所不同，需要换成相应的函数。
用这种方法截取后，可能会出现不闭合的标签，还要把这些标签进行后期闭合处理。

[技术探讨] :: 评论 (1) :: 得分 (3)

在apache中解压预压缩的静态文件

faisun | 2007-04-25

对于静态的 html 文件，在 apache 可加载 mod_deflate.so 模块，把内容压缩后输出，可节约大量的传输带宽。

mod_deflate.so 的用法可在网上找，大部分的文章都是正确的。

像本站（纯粹空间 http://www.softpure.com/），静态的 html 是由 PHP 生成并保存于 /html/ 目录下。生成及用户访问的流程如下：
（流程1）
生成： PHP处理生成代码 > 保存为HTML；
访问： Apache 读取HTML文件 > 压缩 > 输出文件头+文件内容；
客户端：解压 > 处理

如此一来，用户的每次访问， Apache 都要压缩一次，浪费了大量的资源。

我就想到预压缩 HTML 文件内容，提高 apache 效率，流程改为：
（流程2）
生成： PHP处理生成代码 > 压缩 > 保存为预压缩HTML；
访问： Apache 读取HTML文件 > 输出文件头+文件内容；
客户端：解压 > 处理

这样用户访问时不用压缩一次，直接发送已压缩的内容，不但效率高，占用资源少，而且减少保存 HTML 的占用空间。
然而，有小部分浏览器/Spider是不支持解压的。对于这类的浏览器，流程1中 Apache 可判断并不压缩内容；但在流程2中，内容已预压缩，只能解压后再发送。

在网上查找资料，看这篇文件，似乎是官方的：
http://mail-archives.apache.org/mod_mbox/httpd-bugs/200409.mbox/%3C20040909145350.20659.qmail@nagoya.betaversion.org%3E

文章说 mod_deflate 是有解压输出的功能的，用
LoadModule deflate_module modules/mod_deflate.so
SetOutputFilter INFLATE
即可解压。并说设置环境变量 force-gunzip=1 即可不管文件类型和Header内容，强制解压，设置 no-gunzip=1 即可不解压。

在 Apache 2.0.59 和 Apache 2.2.4 下，我试了半天，无论怎么配置，一概不解压

一气之下，下载 Apache 源文件，细细研究。

结果发现：
1）在 Apache 2.0.59 中，mod_deflate 只有输出压缩和输入解压功能，并没有输出解压功能。
2）在 Apache 2.2.4 中，mod_deflate 增加了输出解压功能，但它并不读取环境变量 force-gunzip 和 no-gunzip 。
解压的条件是：输入到 Apache 的 Header 中，包含文件头 Content-Encoding: gzip 。
解压后该模块会删除 Content-Encoding 的文件头。

我用 php 先 header('Content-Encoding: gzip '); 发送文件头，然后读取预压缩的HTML文件并输出，果然可以解压。
然而，在 httpd.conf 中设置 Header Append Content-Encoding gzip ，却是不行的。

静态文件是不可能向 apache 发送文件头的，所以用 mod_deflate 的解压方式在这里行不通。
解决的办法，只能自己修改 mod_deflate 模块的源码，然后重新编译。或者，等 Apache 出新版。 Apache 的最新几个版本都陆续对 mod_deflate 有修改。

不过目前我在 Windows 下编译 Apache 还没有测试成功，只能继续查找资料了，有经验的朋友可以和我交流阿。
Email: faisun@sina.com

现在本站的解决方法是：
如果浏览器支持 gzip ，则发送 Content-Encoding: gzip 文件头，并把预压缩 HTML 内容输出。
若不支持，则用 Rewrite 的方式，转为 php 解压该HTML 文件。
1） PHP压缩保存： php 压缩时，应采用 gzencode() 函数压缩，客户端才能解码。
2） Apache 的 httpd.conf 设置：

#该虚拟主机 DocumentRoot D:/wwwroot/softpure.com
#对 D:/wwwroot/softpure.com/html 这个目录的规则(Rewrite 一般是相对目录编辑规则)
<Directory D:/wwwroot/softpure.com/html>
RewriteEngine On
# 非 IE 浏览器,并且
RewriteCond %{HTTP_USER_AGENT} !\bMSIE
# 空的 HTTP_USER_AGENT,或
RewriteCond %{HTTP_USER_AGENT} ="" [OR]
#不支持gzip 的浏览器
RewriteCond %{HTTP_USER_AGENT} Mozilla/4\.0[678]
#把 .html/.htm 文件，重写为 /htm/... ，使用伪静态，用 htm.php 读取>解压内容后输出。
RewriteRule (.+\.html?) /htm/$1 [L,NS]

#如果没有重写，则下条指令生效：发送 Content-Encoding: gzip 的 Header
Header append Content-Encoding "gzip"
</Directory>

[荐] :: [纯粹日志] :: 评论 (2) :: 得分 (7)

我发表在php.net 官网手册上的 Note: ob_gzhandler() 函数

faisun | 2007-04-25

http://cn.php.net/manual/en/function.ob-gzhandler.php
faisun at sina dot com 就是我啦 :)

ob_gzhandler

faisun at sina dot com
24-Apr-2007 12:53

My PHP version is 5.2.1 For windows.



If browser doesn't support compressed ,

ob_start('ob_gzhandler') returns the original string,

but $str = ob_gzhandler ( $buffer, 5 ) returns false;



<?php /* 1.php */ 

ob_start('ob_gzhandler') ; 

echo 'This is a string.'; 

?> 



<?php 

/* 2.php */ 

header("Content-Encoding: gzip"); 

$buffer = 'This is a string.'; 

$str = ob_gzhandler ( $buffer, 5 ) ; 

if($str===false){ 

    echo 'ob_gzhandler() returns false.'; 

}else{ 

    echo $str; 

} 

?> 



<?php 

/* 3.php */ 

echo file_get_contents('http://www.php.net/1.php'); 

echo file_get_contents('http://www.php.net/2.php'); 

/* 

result: 

This is a string.ob_gzhandler() returns false. 

*/ 

?>

[技术探讨] :: 评论 (2) :: 得分 (7)

纯粹手写板 V1.3 算法简介

faisun | 2007-03-25

相关链接：纯粹手写板测试专帖

本以为纯粹手写板的代码压缩到了 V1.22 版，几乎没什么压缩的空间了。今天却忽然又来了灵感，采用 10*52 的记数方法，进一步提高了1/3以上的压缩率。

    纯粹手写板的代码压缩大概经历了这几个历程：
    V 1.0 把原代码转化为按各属性值排列；可使存储的代码减为原代码的 1/2 以上。
    V 1.1 把线条的直线中间点去掉；可使存储的代码再减少 1/2 以上。
    V 1.2 采用 62*62 的记数方法，可使存储的代码再减少 1/3 左右。
    V 1.3 采用 10*52 的记数方法，可使存储的代码再减少 1/2 - 1/3。

什么是 V 1.2 版的 62*62 的记数方法呢？原码中，线条的坐标代码是这种格式的：x1,y1,x2,y2,x3,y3.....,xn,yn。因为手写板编辑框为 400px*200px ，所以坐标数字都是 0 到 400 之间的。62*62 记数方法为：把 x1...xn,y1...yn 这些数字用 0-9a-zA-Z 共 62 个符号表示，也就是 62 进制了。不足2位的，在前面补0。由于所有的数字都用2个符号表示了，所以数字之间的逗号可以去掉。这样的表示方式，可以比原来的代码少 1/2 左右。

而 10*52 的记数方式，比 62*62 的表示代码还要少。这个方式能表示的最大数字，不能超过 520，用在手写板中还是可以的（而用 26*36 的记数方式的话，可以表示不超过936 的数）。原理是用0-9表示高位，用a-zA-Z共52个符号表示低位。你现在也许会说，一样是用两个符号表示一个数字啊，怎么会比 62*62的方法更少呢？它们的区别在于，一个数和上一个数的高位相同的时候，此数的高位不写。也就是说，打个比方，8A8B8z 只表示为 8ABz 。因为手写板中的代码，每个x或y之间的跳跃不会很频繁地很大，所以压缩的比较多。根据比较的结果，这种方式比 62*62 的方式可以少 1/2-1/3 的存储代码。

因为算法的更新，V1.3 不可能兼容 V1.2 原来的代码了，直接从 V1.2 更新到 V1.3 的话，以前存储的数据将不能解释，所以更新手写板后，是需要更新数据库中的数据的。

Discuz! 更新到 5.0 后，由于编辑器和以前的版本大不一样，安装手写板插件会比以前复杂一些，我会尽快把安装说明整理出来。

[技术探讨] :: 评论 (3) :: 得分 (12)

关于 iconv() 函数

faisun | 2007-03-23

用 iconv('GB2312','UTF-8',$string) 转换编码时，如果 $string 中含有不能转换的字符（如繁体字），则会转换失败，返回 False。

iconv( 'GB2312', 'UTF-8//IGNORE' , $string) 可以忽略失败。

[技术探讨] :: 评论 (2) :: 得分 (7)

UTF-8 和 GB2312 截取固定长度字符串的处理

faisun | 2007-03-23

我曾发过一篇《高效的固定长度字符串的截取函数》，可是这个方法只适用于 GB2312 的编码。因为在 GB2312 下，汉字占两个字符，在页面中刚好也是占两倍的地方显示。

可是在 UTF-8 编码中，汉字却是占2-3个字符。这个不确定性给截取造成了挺大的麻烦。目前我用的方法只能是循环：

<?
function toFixLen($str, $len) { // 固定长度字符串的截取,UTF-8
$str=trim($str);

$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
preg_match_all($pa, $str, $t_string);

$lt = count($t_string[0]);
$str = '';
$l = 0 ;
foreach($t_string[0] as $k=>$s){
$l += (strlen($s)==1?1:2);
if($l>=$len-3 && $k!=$lt){
$str .= '...';
break;
}else{
$str .= $s;
}
}
return $str;
}

?>

[技术探讨] :: 评论 (2) :: 得分 (8)

共 15 篇相关文章,每页显示 10 篇
« [1] [2] »

-= 文章分类 =-

文章搜索