元字符的一个问题

新手入门、经验交流

Moderator: cre

Forum rules
  • 软件自带帮助是最好的入门教程,请仔细阅读;在您掌握最基本知识前,我们没法帮助您
  • 提问前请先查阅软件帮助文件和论坛相关讨论
  • 查阅软件帮助和论坛相关讨论即可解决的问题帖将直接删除,以免浪费他人时间
  • 请学会如何提问,尽量将问题描述清楚,不明确的提问将被直接删除
Post Reply
liumailong
Posts: 50
Joined: Jun 04 2009, 03:38

元字符的一个问题

Post by liumailong »

要匹配所有含“ .atm.youku.com”的网址,但要排除“static.atm.youku.com”

元字符要如何写?

我尝试了下面的语法,发现都不行

Code: Select all

(^static)++.atm.youku.com
[(^static)]++.atm.youku.com
[^(static)]++.atm.youku.com
(*&(^static))++.atm.youku.com
red
Posts: 99
Joined: Mar 09 2010, 16:25

Re: 元字符的一个问题

Post by red »

以前我提过类似问题。。

Code: Select all

(^static.)[^/]++.atm.youku.com
liumailong
Posts: 50
Joined: Jun 04 2009, 03:38

Re: 元字符的一个问题

Post by liumailong »

这样有问题吧!
只要含有 ”static“匹配下来就会多一一个 “s”
比如 static.atm.youku.com ,static.static.atm.youku.com, static.dsfsd.atm.youku.com 等等
User avatar
cre
Moderator
Posts: 91
Joined: May 26 2009, 00:34

Re: 元字符的一个问题

Post by cre »

这个问题我也遇到过。
如果是直接作用到url,比如urlkill中的,可以用bypass列表。
有时候可以用^或者^&结合

Code: Select all

[^o]adfile/
/ad([a-z]&([^dmvo]))
://www.ad&(^(://www.ad(min|muncher|obe|d)))
[/color]当一样解决不了需求可以考虑~
以前google相册图片有像abcdabcdabcdefad.jpg这种误杀的我用

Code: Select all

~$URL(*.ggpht.com)*.(jpg|gif|png)
解决。

举例,如果是要允许访问abc.def.aaa而不允许acd.def.aaa bcd.def.aaa
需要urlkill写下

Code: Select all

~*abc.def.aaa
*???.def.aaa
本例该用

Code: Select all

*??.atm.youku.com
~*ic.atm.youku.com
因为static有6个字符但是不能用6个?号。印象至少有个vlf是三个字符的。
~用起来最闷的就是必须同长,切切注意。
red
Posts: 99
Joined: Mar 09 2010, 16:25

Re: 元字符的一个问题

Post by red »

只要含有 ”static“匹配下来就会多一一个 “s”
比如 static.atm.youku.com ,static.static.atm.youku.com, static.dsfsd.atm.youku.com 等等
是有这个问题,如果你给出的就是实际url,

Code: Select all

(^static.)[^/]++.atm.youku.com
也不会太误伤

以下来自sidki中Exceptions-U

Code: Select all

#  URL expression syntax:
#       Exactly one page:                     www.mysite.com/mydir/mypage.html
#       One hostname:                         www.mysite.com/
#       The whole domain:                     ([^/]++.|)mysite.com/
#       All subdomains:                       [^/]++.mysite.com/
#       All primary subdomains:               [^.]+.mysite.com/
#       All primary subdomains except "www":  [^.]+.mysite.com/&(^www.)
Post Reply