Page 1 of 1

元字符的一个问题

Posted: Jan 27 2011, 22:52
by liumailong
要匹配所有含“ .atm.youku.com”的网址,但要排除“static.atm.youku.com”

元字符要如何写?

我尝试了下面的语法,发现都不行

Code: Select all

(^static)++.atm.youku.com
[(^static)]++.atm.youku.com
[^(static)]++.atm.youku.com
(*&(^static))++.atm.youku.com

Re: 元字符的一个问题

Posted: Jan 28 2011, 01:52
by red
以前我提过类似问题。。

Code: Select all

(^static.)[^/]++.atm.youku.com

Re: 元字符的一个问题

Posted: Jan 28 2011, 20:24
by liumailong
这样有问题吧!
只要含有 ”static“匹配下来就会多一一个 “s”
比如 static.atm.youku.com ,static.static.atm.youku.com, static.dsfsd.atm.youku.com 等等

Re: 元字符的一个问题

Posted: Feb 17 2011, 01:14
by cre
这个问题我也遇到过。
如果是直接作用到url,比如urlkill中的,可以用bypass列表。
有时候可以用^或者^&结合

Code: Select all

[^o]adfile/
/ad([a-z]&([^dmvo]))
://www.ad&(^(://www.ad(min|muncher|obe|d)))
[/color]当一样解决不了需求可以考虑~
以前google相册图片有像abcdabcdabcdefad.jpg这种误杀的我用

Code: Select all

~$URL(*.ggpht.com)*.(jpg|gif|png)
解决。

举例,如果是要允许访问abc.def.aaa而不允许acd.def.aaa bcd.def.aaa
需要urlkill写下

Code: Select all

~*abc.def.aaa
*???.def.aaa
本例该用

Code: Select all

*??.atm.youku.com
~*ic.atm.youku.com
因为static有6个字符但是不能用6个?号。印象至少有个vlf是三个字符的。
~用起来最闷的就是必须同长,切切注意。

Re: 元字符的一个问题

Posted: Mar 03 2011, 22:09
by red
只要含有 ”static“匹配下来就会多一一个 “s”
比如 static.atm.youku.com ,static.static.atm.youku.com, static.dsfsd.atm.youku.com 等等
是有这个问题,如果你给出的就是实际url,

Code: Select all

(^static.)[^/]++.atm.youku.com
也不会太误伤

以下来自sidki中Exceptions-U

Code: Select all

#  URL expression syntax:
#       Exactly one page:                     www.mysite.com/mydir/mypage.html
#       One hostname:                         www.mysite.com/
#       The whole domain:                     ([^/]++.|)mysite.com/
#       All subdomains:                       [^/]++.mysite.com/
#       All primary subdomains:               [^.]+.mysite.com/
#       All primary subdomains except "www":  [^.]+.mysite.com/&(^www.)