过滤文字型的链接广告
Posted: Aug 05 2008, 20:42
图片,FLASH之类的图形广告被过滤得七七八八了。文字广告反而卷土重来。
如
<a href="test.com">游戏私服</a>
<a target="_blank" href="test.com">例子游戏私服</a>
<a href="test1.com" target="_blank">例子游戏私服001</a>
<a href="test22.com" target="_blank"><strong>例子游戏私服001</strong></a>
<a href="test33.com" target="_blank"><font color=red>让你3天学会英语日语法语</font></a>
<a href="test444.com" target="_blank"><img src="test.com/test.jpg">例子游戏私服001</a>
等文本广告。
其链接完全没有特征码,只能提取其中的 “私服” “3天学会” 这几个文字来做特征码。
以下是某天在群里讨论得出的规则。但发现不能普遍适用。特求一个通用性较高,更新时只需更新其中的关键字的规则。
[Patterns]
Name = "a"
Active = FALSE
URL = "$TYPE(htm)|$TYPE(js)"
Limit = 256
Match = "<a\s[^>]+>[^<]++私服[^<]+</a>"
Replace = "\0"
如
<a href="test.com">游戏私服</a>
<a target="_blank" href="test.com">例子游戏私服</a>
<a href="test1.com" target="_blank">例子游戏私服001</a>
<a href="test22.com" target="_blank"><strong>例子游戏私服001</strong></a>
<a href="test33.com" target="_blank"><font color=red>让你3天学会英语日语法语</font></a>
<a href="test444.com" target="_blank"><img src="test.com/test.jpg">例子游戏私服001</a>
等文本广告。
其链接完全没有特征码,只能提取其中的 “私服” “3天学会” 这几个文字来做特征码。
以下是某天在群里讨论得出的规则。但发现不能普遍适用。特求一个通用性较高,更新时只需更新其中的关键字的规则。
[Patterns]
Name = "a"
Active = FALSE
URL = "$TYPE(htm)|$TYPE(js)"
Limit = 256
Match = "<a\s[^>]+>[^<]++私服[^<]+</a>"
Replace = "\0"