当前位置:首页>>技术文章>>内容详情

常用的各种系统rewrite重写规则方法

2022年02月16日
Tags:rewrite重写

介绍常用的各种系统rewrite重写规则方法,用来美化网页的链接,提高搜索引擎收录。

一.web.config 适用iis7以上

实例1:普通重写

.htaccess转换web.config   注意: 1.添加<match url="^(.*/)*  2. 添加 url="{R:1} 3.去掉 list.asp\?teacher_id  转义符

<?xml version="1.0" encoding="UTF-8"?>
       <configuration>
          <system.webServer>
             <rewrite>
                <rules>
                   <rule name="rule1">
                   <match url="^(.*)t/([0-9,a-z]*)" ignoreCase="false" />
                   <action type="Rewrite" url="{R:1}/t_list.asp?teacher_id={R:2}" appendQueryString="false" />
                   </rule>
                   <rule name="rule2">
                   <match url="^(.*/)*([0-9]+)-([0-9]+)-([0-9]+)-([0-9]+)\.html\?*(.*)$" />
                   <action type="Rewrite" url="{R:1}/index.php?moduleid={R:2}&amp;catid={R:3}&amp;itemid={R:4}&amp;page={R:5}" />
                   </rule>
            </rules>
         </rewrite>
       </system.webServer>
   </configuration>

实例2:其他重写功能

(1)301重定向

<rule name="301Redirect" stopProcessing="true">
<match url="(.*)" />
<conditions logicalGrouping="MatchAll">
     <add input="{HTTP_HOST}" pattern="^xxx.com$" />
 </conditions>
<action type="Redirect" url="http://www.xxx.com/{R:0}" redirectType="Permanent" />
</rule>

(2)取消目录执行权限

<rule name="rule1">
       <match url="uploads/(.*).(php|asp|aspx)$" ignoreCase="false" />
       <conditions logicalGrouping="MatchAll">
             <add input="%" pattern="^$" ignoreCase="false" negate="true" />
       </conditions>
       <action type="AbortRequest" />
</rule>
 
<rule name="Rule2">
      <match url="(.*).(asp)$" ignoreCase="false" />
      <action type="AbortRequest" />
</rule>

(3)屏蔽来源域名

<rule name="rule1" stopProcessing="true">
      <match url="^(.*)$" />
      <conditions>
            <add input="{HTTP_REFERER}" pattern="ylhqvip.com" negate="true" />
            <add input="{HTTP_REFERER}" pattern="^$" negate="true" />
      </conditions>
      <action type="AbortRequest" />
</rule>

(4)屏蔽ip地址

<rule name="band ip" stopProcessing="true">
      <match url="(.*)" />
      <conditions logicalGrouping="MatchAny">
            <add input="%{HTTP_X_FORWARDED_FOR}&amp;%{REMOTE_ADDR}&amp;%{HTTP_X_Real_IP}" pattern="(8.8.4.4|8.8.8.)" />
      </conditions>
      <action type="AbortRequest" />
</rule>

(5)过滤静态文件

<rule name="Imported Rule 1" stopProcessing="true">
      <match url="^(.*)$" ignoreCase="false" />
      <conditions logicalGrouping="MatchAll">
              <add input="{URL}" pattern="^.*(.css|.js|.gif|.png|.jpg|.jpeg|.xml)" ignoreCase="false" />
      </conditions>
      <action type="None" />
</rule>

(6)屏蔽蜘蛛

<rule name="Block spider" stopProcessing="true">
      <match url="(.*)" ignoreCase="false" negate="false" />
      <conditions>
           <add input="{HTTP_USER_AGENT}" pattern="baiduspider|googlebot" />
      </conditions>
      <action type="AbortRequest" />
</rule> 

语法总结

(1)<add>条件判断,就像我们程序中的if语句一样,表示如果符合某个或某几个条件则执行action后的语句

#判断访问域名:     <add input="{HTTP_HOST}" pattern="^www.xxx.com$" />                                                   
#判断user_agent:   <add input="{HTTP_USER_AGENT}" pattern="baiduspider|googlebot" />                                      
#判断访问来源域名: <add input="{HTTP_REFERER}" pattern="xxx.com" negate="true" />
#判断url中:        <add input="{URL}" pattern="^.*(.css|.js|.gif|.png|.jpg|.jpeg|.xml)" ignoreCase="false" />
#判断url中?后参数: <add input="{QUERY_STRING}" pattern="blog" negate="true" />                                            
#判断url路径地址:  <add input="{REQUEST_URI}" pattern="blog" negate="true" />   
#判断ip(包括代理): <add input="%{HTTP_X_FORWARDED_FOR}&amp;%{REMOTE_ADDR}&amp;%{HTTP_X_Real_IP}" pattern="(8.8.4.4|8.8.8.)" />
#判断真实文件:     <add input="{REQUEST_FILENAME}" matchType="IsFile" negate="true" pattern="" ignoreCase="false" />      
#判断真实目录:     <add input="{REQUEST_FILENAME}" matchType="IsDirectory" negate="true" pattern="" ignoreCase="false" /> 
#判断match中的变量:<add input="{R:1}" pattern="^(bbs|blog)" ignoreCase="false" negate="true" />
#其他              <add input="%" pattern="^$" ignoreCase="false" negate="true" />

(2)<action>处理方式

#禁止访问:         <action type="AbortRequest" />  
#重定向到          <action type="Redirect" url="http://www.xxx.com" redirectType="Permanent" />   
#重写到            <action type="Rewrite" url="{R:1}/t_list.asp?teacher_id={R:2}" appendQueryString="false" />  
#不做操作          <action type="None" />
#向客户端返回状态  <action type="CustomResponse" statusCode="403" statusReason="Forbidden" statusDescription="Forbidden" />

(3)参数

忽略大小写:             ignoreCase="true"|ignoreCase="false"
非(不等于):             negate="true" 
不带?后面的参数:        appendQueryString="false"
永久重定向:             redirectType="Permanent"
匹配条件为所有还是一条: logicalGrouping="MatchAll"|logicalGrouping="MatchAny"      # 用于conditions节点

二.htaccess 适用iis6(rewrite3.1)|linux

实例1:普通重写

<IfModule mod_rewrite.c>
      RewriteEngine On
      RewriteCond %{QUERY_STRING} ^(.*)$
      RewriteRule ^topic-(.+)\.html$ portal.php?mod=topic&topic=$1&%1
      RewriteCond %{QUERY_STRING} ^(.*)$
      RewriteRule ^article-([0-9]+)-([0-9]+)\.html$ portal.php?mod=view&aid=$1&page=$2&%1
      RewriteCond %{QUERY_STRING} ^(.*)$
      RewriteRule ^forum-(\w+)-([0-9]+)\.html$ forum.php?mod=forumdisplay&fid=$1&page=$2&%1
</IfModule>
 
RewriteRule ^(.*)/topic-(.+)\.html(\?(.*))*$ $1/portal\.php\?mod=topic&topic=$2&$4
RewriteRule ^(.*)/article-([0-9]+)-([0-9]+)\.html(\?(.*))*$ $1/portal\.php\?mod=view&aid=$2&page=$3&$5
RewriteRule ^(.*)/forum-(\w+)-([0-9]+)\.html(\?(.*))*$ $1/forum\.php\?mod=forumdisplay&fid=$2&page=$3&$5]

动态地址跳转到静态地址

RewriteRule ^goods-([0-9]+)(.*)\.html$  goods\.php\?id=$1 [QSA,L]
 
RewriteCond %{QUERY_STRING} ^id=([0-9]+)$ [NC]
RewriteRule ^goods.php$ /goods-%1.html? [L,R=301]
 
RewriteCond %{QUERY_STRING} ^id=1$ [NC]
RewriteRule ^category.php$ http://www.yaolongnonwoven.com/? [L,R=301] 加?不带参数,不加带上参数

实例2:其他重写功能

(1)301重定向

RewriteCond %{HTTP_HOST} ^xxxx1.com$ [NC] 
RewriteCond %{HTTP_HOST} ^xxxx2.com$ [NC] 
RewriteRule ^(.*)$ http://www.xxxx1.com/$1 [R=301,L]

(2)取消目录执行权限

RewriteCond % !^$   
RewriteRule uploads/(.*).(php)$ – [F]   
RewriteRule data/(.*).(php)$ – [F] 

(3)屏蔽来源域名

RewriteCond %{HTTP_REFERER} www.baidu.com [NC]
RewriteRule ^(.*)$ - [F]

(4)屏蔽ip地址

RewriteCond %{http:X-Forwarded-For}&%{REMOTE_ADDR}&%{http:X-Real-IP} (8.8.4.4|8.8.8.) [NC]
RewriteRule (.*) - [F]

(5)过滤静态文件

RewriteCond %{REQUEST_URI} ^.*(.css|.js|.gif|.png|.jpg|.jpeg|.xml)
RewriteRule ^(.*)$   - [L] 
 
RewriteCond %{REQUEST_FILENAME} !-f     
RewriteCond %{REQUEST_FILENAME} !-d

(6)屏蔽蜘蛛

RewriteCond %{HTTP_USER_AGENT} (baiduspider|googlebot) [NC]
RewriteRule ^(.*)$ - [F]

语法总结

(1)RewriteCond条件判断,就像我们程序中的if语句一样,表示如果符合某个或某几个条件则执行RewriteCond下面紧邻的

RewriteRule语句
#判断访问域名:     RewriteCond %{HTTP_HOST} ^xxxx.com$ [NC]                                                    
#判断user_agent:   RewriteCond %{HTTP_USER_AGENT} Baiduspider [NC]                                  
#判断访问来源域名: RewriteCond %{HTTP_REFERER} www.baidu.com [NC]
#判断METHOD:       RewriteCond %{REQUEST_METHOD} ^(TRACE|OPTIONS)
#判断url中?后参数: RewriteCond %{QUERY_STRING} ^id=([0-9]+)$ [NC]                                           
#判断url路径地址:  RewriteCond %{REQUEST_URI} ^/bbs    
#判断ip(包括代理): RewriteCond %{http:X-Forwarded-For}&%{REMOTE_ADDR}&%{http:X-Real-IP} (8.8.4.4|8.8.8.) [NC]
#判断真实文件:     RewriteCond %{REQUEST_FILENAME} !-f     
#判断真实目录:     RewriteCond %{REQUEST_FILENAME} !-d
#判断header        RewriteCond %{HTTP:header}
#判断以上所有情况: RewriteCond $1 !^(bbs|blog)
#其他 RewriteCond % !^$ 
(2)处理方式
#禁止访问:         RewriteRule (.*) - [F]
#重定向到          RewriteRule ^(.*)$ http://www.xxx.com/404.html [R=301,L]  
#重写到            RewriteRule ^goods-([0-9]+)(.*)\.html$  goods\.php\?id=$1 [QSA,L]
#不做操作          RewriteRule ^(.*)$   - [L] 
参数解释:
$N 规则后向引用
%N RewriteCond 后向引用
${mapname:key|default}
%{VARNAME} 服务器变量
‘!’ 取非
[C] 与下一个规则联锁
[CO=name:val:domain:lifetime:path] 设置cookie
[F] 强制禁止应答
[G] 强制继续应答
[H=content-handler] 明确的内容处理 (不适用)
[L] 上一个规则标记
[N] 再次应用规则
[NC] 大小写不敏感
[NE] 不转义输出
[NS]非内部子请求
[P]代理通过
[QSA] 追加查询字符串
[R =code] 重定向
[S=num] 跳到下面第n条规则
[T=MIME-type] 强制明确应答 MIME 类型
RewriteCond
[NC] 大小写不敏感
[OR] 逻辑并集
三.nginx 规则

实例1.普通重写

location / { 
    if (!-e $request_filename) { 
        rewrite  ^(.*)$  /index.php?s=$1  last; 
        break;   
    } 
}

实例2.其他重写

(1).301重定向

server_name test.com www.test.com; 
if ($host ~* test.com) { 
    rewrite ^/(.*)$ http://www.test.com/$1 permanent; 
}

http跳转https

普通

rewrite ^(.*) https://www.abc.com$1 permanent; 

有cdn

if ( $http_from_https != 'on' ){
     rewrite ^(.*) https://www.abc.com$1 permanent;      
 }

(2). 取消目录执行权限

location ~* ^/(uploads|templets|data)/.*.(php|php5)$ {
                deny  all;
        }

(3).屏蔽来源域名

location / {
            valid_referers www.baidu.com www.360.cn;
            if ($invalid_referer){
                    return 403;
            }
    }

防盗链

location ~* \.(gif|jpg|png|webp)$ {
   valid_referers none blocked domain.com *.domain.com server_names ~\.google\. ~\.baidu\.;
   if ($invalid_referer) {
    return 403;
    #rewrite ^/ http://www.domain.com/403.jpg;
   }
   root /opt/www/image;
  }

(4).屏蔽ip地址

allow 1.1.1.2;
allow all;
deny all;
deny 1.1.1.2
 
location ^~ /xxx/xxx/xx/
    {
      allow 172.0.0.1;
      allow xxx.xxx.0.0/8;#表示允许xxx.xxx.0.1 ~ xxx.xxx.255.254  
      allow xxx.0.0.0/16;#表示允许xxx.0.0.1 ~ xxx.255.255.254
      allow xxx.xxx.xxx.x; 
      deny all;
      }

前端还有cdn情况

map $http_x_forwarded_for  $clientIp {
        ""      $remote_addr;
        ~^(?P<firstAddr>[0-9\.]+),?.*$  $firstAddr;
}
if ($clientIp ~* "127.0.0.1|127.0.0.2") {
   return 403;
   break;
}

(5).屏蔽蜘蛛

if ($http_user_agent ~ "FeedDemon|JikeSpider|MJ12bot|heritrix|EasouSpider|LinkpadBot|Ezooms" )
{
  return 403;
}

(6).禁止非GET|HEAD|POST方式的抓取

if ($request_method !~ ^(GET|HEAD|POST)$) {
  return 403;
  }

语法总结

(1)RewriteCond条件判断,就像我们程序中的if语句一样,表示如果符合某个或某几个条件则执行RewriteCond下面紧邻的RewriteRule语句

#判断访问域名:     if ($host ~* test.com)                                                   
#判断user_agent:   if ($http_user_agent ~* "baiduspider" )                                
#判断访问来源域名: valid_referers www.baidu.com;if ($invalid_referer){return 403;}
#判断METHOD:       if ($request_method !~ ^(GET|HEAD|POST)$)
#判断url中?后参数: if ($request_uri ~* ^/list.php\?([^_]+)(_[0-9]+)$)                                           
#判断url路径地址:  if ($uri ~* ^/list.php\?([^_]+)(_[0-9]+)$)    
#判断ip:           if ($remote_addr ~* "127.0.0.1|127.0.0.2")
#判断真实文件:     -e filename      
#判断真实目录:     -d filename

(2).处理方式

#禁止访问:         return 403; deny all;
#重定向到          rewrite ^/(.*)$ http://www.test.com/$1 permanent; 
#重写到            rewrite  ^(.*)$  /index.php?s=$1  last; 
last – 基本上都用这个Flag。
break – 中止Rewirte,不在继续匹配
redirect – 返回临时重定向的HTTP状态302
permanent – 返回永久重定向的HTTP状态301
 
-f和!-f用来判断是否存在文件
-d和!-d用来判断是否存在目录
-e和!-e用来判断是否存在文件或目录
-x和!-x用来判断文件是否可执行

参数解释

location [=|~|~*|^~] /uri/ { … }
= 开头表示精确匹配
^~ 开头表示uri以某个常规字符串开头,理解为匹配 url路径即可。nginx不对url做编码,因此请求为/static/20%/aa,可以被规则^~ /static/ /aa匹配到(注意是空格)。
~ 开头表示区分大小写的正则匹配
~* 开头表示不区分大小写的正则匹配
!~和!~*分别为区分大小写不匹配及不区分大小写不匹配 的正则
/ 通用匹配,任何请求都会匹配到。

全局变量

$args
$content_length
$content_type
$document_root
$document_uri
$host
$http_user_agent
$http_cookie
$limit_rate
$request_body_file
$request_method
$remote_addr
$remote_port
$remote_user
$request_filename
$request_uri
$query
打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。
上一条信息:Microsoft.XMLHttp 的属性和方法使用
下一条信息:ASP统计每个栏目下文章总数并按高到低排序