Page 1 of 1

我翻译的 URL Killfile.txt 的说明部分和注解部分

Posted: Dec 26 2008, 23:00
by 天堂之门
这个会直接中止添加的网址的列表虽然不能让过滤的位置显示“被过滤内容”这样的文字,但是还是会经常用到的。

所以翻译了下说明。不妥之处,欢迎指正。 :roll:
# Proxomitron Killfile
#
# 如果 URL killer 这个 header 过滤规则被启用,那么它将封杀此列表中所有匹配的 URL。注意,这样会彻底中止访问所给出的网址。
#
# 提示:AdKeys list (即 Keyword list.txt) 也会调用此列表从而使那些 banner 过滤规则有机会在这些网址传到你的浏览器之前阻止它们。
#
# 列表索引:Naoko-4 BetaFour 新增了索引某些正则表达式的能力。这种索引能力可以极大地加速大型列表的查找。已存在的列表无需变更,但要充分利用这些特性的话,必须懂得什么样的网址可以被索引,什么样的却不行。可以索引的网址包括:
#
# 1) 不以通配符开头的行可以被索引至首个通配符。如同 "www.somesite.com/\w/ads.html"
#
# 2) 以特定的通配符开头,并且其剩余的主机名称直到首个的 "/" 都不再出现其它通配符的 URL。例如:
#
# *.somesite.com/
# \w.somesite.com/
# [^.]+.somesite.com/
# [^/]++somesite.com/
# ([^/]++.|)somesite.com/
#
# 有效地开头通配符包括 *, \w, [...]+, [...]++, 以及 (...|)
# 注意,你必须在包括其他通配符前包含 "/"。
# 例如,"[^.]+.somesite.(com|net)/" 不可索引,因为主机名称的首尾两边都包含了通配符。

# The WWW's
www.clickXchange.com/
www.custom-click.com/
www.eads.com/
www.hotlinks.com/images/ban
www.maximumcash.com/
www.net3media.com/
www.PayPopup.com/
www.popupad.net/
www.sitetracker.com/
www.TheCounter.com/
www.whatsfind.com/

# 忽略首个子域名进行匹配
[^.]+.adsag.com/
[^.]+.adserver.com/
[^.]+.advertising.com/
[^.]+.atdmt.com/
[^.]+.atwola.com/
[^.]+.counted.com/
[^.]+.hotrank.com/
[^.]+.msads.net/
[^.]+.mtree.com/
[^.]+.nedstatbasic.net/
[^.]+.sitemeter.com/

# 专门的广告服务器主机名称 (在首个 "/" 前的)
[^/]++.adbureau.net/
[^/]++.adquest3d.com/
[^/]++.adserver.com/
[^/]++.advert.com/
[^/]++.burstnet.com/
[^/]++.doubleclick.net/
[^/]++.fastclick.com/
[^/]++.fastclick.net/
[^/]++.flycast.com/
[^/]++.gator.com/
[^/]++.hitbox.com/
[^/]++.imrworldwide.com/
[^/]++.linkexchange.com/
[^/]++.mediaplex.com/
[^/]++.orbitcycle.com/
[^/]++.usads.futurenet.com/
[^/]++.valueclick.com/
[^/]++.valueclick.net/
[^/]++extreme-dm.com/

mediamgr.ugo.com/
us.a1.yimg.com/
rd.yahoo.com/M=[0-9.]+{5,*}/
ar.atwola.com/

# 匹配开头的主机名称部分 (ads.something adserver.something ...)
(us.|)(ad(s(erver|rv|)|force|tegrity|c|)[0-9]+
|leader
|counter).

# 专门的路径名称部分 (在首个 "/" 之后的)
[^/]+\w[/?.](ad(s|erver|verts|log.pl)[0-9]+/|banner(s|)/|GetAd|cookie.crumb|js_source|hitometer.js|index.cgi\?id=???)