Search found 529 matches

by phoenix
Jan 09 2008, 09:54
Forum: 一般应用交流
Topic: 关于广告过滤的正则表达式的格式
Replies: 9
Views: 24391

Re: 关于广告过滤的正则表达式的格式

(ete|ez|unionsky|shareware).cn|51.la 这句,“|”前面的匹配生效了,但后面的51.la没生效。“|”这些符号没用的? 我测试是生效的 如果你的表达式是用在blockfile里,分行写比写在一起效率更高 类似这些需要怎样修改? (.|\)(1tong|265|51(ad|.la|yes|link)|alexa|alibaba|ebay|gimg|hotadv?|icast|unicom|itsun|union(sky)?|usmsad)(\d)?s?(.|\) [\W_]adsence.sogou.com|union.narrowad.com|code1.c...
by phoenix
Jan 08 2008, 21:32
Forum: 一般应用交流
Topic: 关于广告过滤的正则表达式的格式
Replies: 9
Views: 24391

Re: 关于广告过滤的正则表达式的格式

Proxomitron使用的是正则表达式的变形,即作者在正则表达式的基础上做了一定的改进以更适合广告过滤规则的编写。软件自带的帮助文件介绍得很详细,请仔细体会。

以你的Adlist为例,“.”在Proxomitron的语法里不是元字符,所以并不需要用“\”来转义。开头的“/”可以去掉或依情况改写为“[^/]++.”。以[^/]++.adserver.com为例,它将匹配:

Code: Select all

www.adserver.com
www1.adserver.com
而不匹配:

Code: Select all

www.host.com/adserver.com
至于在地址栏输入是否能通过,要看你的规则的具体写法。
by phoenix
Jan 07 2008, 10:00
Forum: 一般应用交流
Topic: 这个table 怎么过滤?
Replies: 3
Views: 7983

Re: 这个table 怎么过滤?

我估计是你的Byte Limit设置得太小的缘故。

不用新建一个文件进行测试,Byte Limit下有个按钮Test,点击后会出来个测试窗口,可以测试过滤结果,其中的profile按钮还可以显示字符串长度、成功匹配次数、匹配时间等信息。

你也可以在你的规则上右键导出到剪切板,然后粘贴上来让大家帮你看看。

软件自带的帮助文件是最好的辅助文档,对软件有兴趣的话还是硬着头皮多看几遍吧。
by phoenix
Jan 06 2008, 21:49
Forum: 一般应用交流
Topic: 这个table 怎么过滤?
Replies: 3
Views: 7983

Re: 这个table 怎么过滤?

单独过滤掉这个table很简单,

Code: Select all

<table*</table>
就可以了,但是考虑到要避免误过滤页面中的其他table,得知道这个table区别于其他table的特征或关键字,最好使用

Code: Select all

<table*keyword*</table>
的形式。
by phoenix
Jan 01 2008, 20:27
Forum: 通用规则讨论
Topic: 在当前网页显示第三方javascript脚本来源
Replies: 5
Views: 17122

在当前网页显示第三方javascript脚本来源

现在很多网页广告和追踪代码都使用javascript形式,并通常来源于广告服务商或统计服务商的服务器。 以下规则,会将不来源于当前所访问页面服务器的第三方脚本显示出来,便于我们分析广告之用。请将其置于过滤规则的最后面使用。 [Patterns] Name = "Show 3rd party JavaScript [phoenix]" Active = TRUE URL = "$TYPE(htm)" Bounds = "$NEST(<script\s,</script>)" Limit = 256 Match = "(* sr...
by phoenix
Jan 01 2008, 20:17
Forum: 特定网站规则讨论
Topic: taobao.com 淘宝商品描述页超链接修复
Replies: 0
Views: 29617

taobao.com 淘宝商品描述页超链接修复

经常使用淘宝的人会注意到,商品描述里的超链接都会被淘宝自动替换掉,使得我们需要访问该链接时,只能手动拷贝粘贴目标网址到浏览器的地址栏。 无论淘宝是出于安全考虑或其他目的,这么做都是非常愚蠢的,因为它并不能阻止真正有兴趣的人访问目标网址,只是给使用者增加不便而已。 以下规则会自动恢复<a href="url">http://target.url</a>或<a href="url">www.target.com</a>形式的超链接,即将“url”替换为<a></a>之间的内容。对于<a href="url">文字</a>形式的超链接,如果...
by phoenix
Jan 01 2008, 19:41
Forum: 特定网站规则讨论
Topic: google.com 恢复网页快照功能
Replies: 5
Views: 14548

google.com 恢复网页快照功能

最近www.google.cn恢复了网页快照功能,而www.google.com上的cache功能仍然被GFW屏蔽。解决方法很简单,将搜索结果URL中的 ?q= 改为 ?&q= 即可绕过封锁。 规则如下: [HTTP headers] In = FALSE Out = TRUE Key = "!-|||||||||||| URL: Google Cache AntiBlock 07.07.09 [phoenix] (out)" URL = "\0search?q=cache:\1&$RDIR(http://\0search?&q=cache...
by phoenix
Jan 01 2008, 14:01
Forum: 一般应用交流
Topic: Proxomitron入门级应用之:代理调度
Replies: 31
Views: 77879

Re: Proxomitron入门级应用之:代理调度

Ray4的例子描述了如何针对某些网站自动使用代理,但我们知道,很多时候,不同代理访问不同网站的速度是不一样的,还有些时候,某些网站必须使用特定的代理才能访问,那么,我们是否能实现针对不同网站使用不同代理呢?

答案是肯定的。以Ray的blocklist文件为例,如果我们在每个网站的后面通过$SET()函数将需要指定的代理服务器赋予一个变量,然后在http header规则中,让$SETPROXY()函数使用这个变量,不就可以实现我们的目标了吗?这里我不给出具体的实现方法,有兴趣的同学可以自行尝试。

BTW,sidki的config set已内置了此功能,具体设置可以参考这里
by phoenix
Jan 01 2008, 13:37
Forum: sidki config set 讨论区
Topic: 如何实现代理调度?
Replies: 4
Views: 21311

如何实现代理调度?

通过代理调度,我们将实现以下目标: 仅对需要使用代理访问的网站 自动 使用代理,而不影响能正常访问的网站。 针对不同网站, 自动 使用不同代理。 一、点击主界面的“Manage Proxies”按钮添加代理服务器信息 addproxy.png 请注意,除了普通的xxx.xxx.xxx.xxx:port形式的代理,我们也可以添加形如proxyserver.org:80/cgi-bin/proxy.cgi/的web代理。如上图,在代理服务器信息后还可以添加备注以区分不同代理。 二、修改配置文件,以实现代理调度 以2007-09-09版本的sidki config set为例,打开Lists\si...