过滤名单,或者叫过滤文件...
(making your life easier through text files)
Previous Back to contents Next

过滤文件(或者叫过滤名单),在 Proxomitron 里有广泛的用途。

顾名思义,过滤名单是用来存放被过滤的东西像是广告,cookies,或是随便什么。不过它们能做的远远不止这些。

过滤名单可以是存放任何东西的列表,并可以在 Proxomitron 的规则里任何你需要检测的地方插入并使用。但除非你自己写规则,不然你就不用管这些。大多数过滤名单就是一张包含很多 URL 的列表(像是 www.stuff.com/... 这样你在浏览器里看到的地址),并且你可以随时往这些名单里加入新的项目。

不过它们真的是非常容易使用。 Proxomitron 里附带了一些制作好的过滤名单....

AdList (这是一张过滤广告地址的URL名单)
CookieList (允许 cookies 的网站名单)
BypassList (优先级最高的白名单)
NoImages (需要过滤全部图片的网站名单)

这些名单都被用于复数规则,并决定 Proxomitron 在某网站采取怎样的行动。要往这些名单里加新项目很容易。例如,如果你看到一个广告图片,只要像这样做...

这是一个 "Add URL to Blockfile" 对话框例子 - 注意当你添加一个新的 URL 时,"http://" 协议部分会被自动移除。这么做是有目的的,因为你不需要协议部分...

还有,你可以点击下面那个下拉列表右边的小箭头,会弹出一个最近接收的 URL 的下拉条目。这可以用来更容易地找到一些你需要过滤却被浏览器隐藏的项目。特别注意那些 host (URL 第一个 "/" 前面的部分) 和你浏览的网站明显不同的项目。

过滤名单是纯文本文件,所以你在这个对话框里可以选择手动编辑过滤名单。点击 "Edit" ,Proxomitron 会自动使用默认的打开方式打开该名单。

在添加 URL 之前,你也许需要把它弄得简洁一点,例如如果一个广告 URL 可能看起来像这样...

www.obnoxious-banners.com/ads/banners/pop?victim_id=232&annoyance=54&intrusion=100&invasiveness=45

由于每个广告地址可能都不一样,所以不要直接将这个完整的地址直接加入过滤名单。仔细观察一下这个 URL,我们可以看见这个广告是来自 "www.obnoxious-banners.com"的。看起来把来自这个网站的所有东西都屏蔽掉就可以了。所以,我们最终加入过滤名单的是...

www.obnoxious-banners.com/

这会把所有来自 "www.obnoxious-banners.com" 的连接屏蔽掉,所以当然也会屏蔽所有这个网站发送给我们的任何广告。

有些广告商比较狡猾,有着很多不同的主机名。例如...

ad121.obnoxious-banners.com/ads/banners/pop?victim_id=232...
ad232.obnoxious-banners.com/ads/banners/pop?victim_id=232...
ad454.obnoxious-banners.com/ads/banners/pop?victim_id=232...

显然一个个地屏蔽会很麻烦。一个简单的办法是使用通配符 ' * ' 来全部匹配...

*.obnoxious-banners.com/

很多时候这都可以正常工作。如果你对匹配了解的比较多你可以试试这样...

(www.|)someplace.com/ 匹配 www.someplace.com 或是 someplace.com
([^.]+.|)someplace.com/ 匹配 除了"."以外的任意字符.someplace.com 或是 someplace.com
[^/]++someplace.com/ 匹配 除了"/"以外的任意字符.someplace.com

(译注:如果不清楚[^.]+和[^/]++两者的区别,可以参考
Proxomitron的文本匹配语言

注意: 虽然这不影响过滤,但如果你的过滤项目以通配符开始,那么最好在主机名的最后加上一个斜杠 "/"(像上面的例子一样)。这可以帮助 Proxomitron 更快地搜索整个过滤名单。

另外有时使用一些高级的通配符会比单纯的 ' * ' 来得更好,因为星号也可能匹配含有 "someplace.com" 的其他主机名,像是...

wwww.someplace-else-entirely.net/gamera/eats/someplace.com/for-lunch.html


返回目录