Page 1 of 1
元字符的一个问题
Posted: Jan 27 2011, 22:52
by liumailong
要匹配所有含“ .atm.youku.com”的网址,但要排除“static.atm.youku.com”
元字符要如何写?
我尝试了下面的语法,发现都不行
Code: Select all
(^static)++.atm.youku.com
[(^static)]++.atm.youku.com
[^(static)]++.atm.youku.com
(*&(^static))++.atm.youku.com
Re: 元字符的一个问题
Posted: Jan 28 2011, 01:52
by red
Re: 元字符的一个问题
Posted: Jan 28 2011, 20:24
by liumailong
这样有问题吧!
只要含有 ”static“匹配下来就会多一一个 “s”
比如 static.atm.youku.com ,static.static.atm.youku.com, static.dsfsd.atm.youku.com 等等
Re: 元字符的一个问题
Posted: Feb 17 2011, 01:14
by cre
这个问题我也遇到过。
如果是直接作用到url,比如urlkill中的,可以用bypass列表。
有时候可以用^或者^&结合
Code: Select all
[^o]adfile/
/ad([a-z]&([^dmvo]))
://www.ad&(^(://www.ad(min|muncher|obe|d)))
[/color]当一样解决不了需求可以考虑~
以前google相册图片有像abcdabcdabcdefad.jpg这种误杀的我用
解决。
举例,如果是要允许访问abc.def.aaa而不允许acd.def.aaa bcd.def.aaa
需要urlkill写下
本例该用
Code: Select all
*??.atm.youku.com
~*ic.atm.youku.com
因为static有6个字符但是不能用6个?号。印象至少有个vlf是三个字符的。
~用起来最闷的就是必须同长,切切注意。
Re: 元字符的一个问题
Posted: Mar 03 2011, 22:09
by red
只要含有 ”static“匹配下来就会多一一个 “s”
比如 static.atm.youku.com ,static.static.atm.youku.com, static.dsfsd.atm.youku.com 等等
是有这个问题,如果你给出的就是实际url,
也不会太误伤
以下来自sidki中Exceptions-U
Code: Select all
# URL expression syntax:
# Exactly one page: www.mysite.com/mydir/mypage.html
# One hostname: www.mysite.com/
# The whole domain: ([^/]++.|)mysite.com/
# All subdomains: [^/]++.mysite.com/
# All primary subdomains: [^.]+.mysite.com/
# All primary subdomains except "www": [^.]+.mysite.com/&(^www.)