图片,FLASH之类的图形广告被过滤得七七八八了。文字广告反而卷土重来。
如
<a href="test.com">游戏私服</a>
<a target="_blank" href="test.com">例子游戏私服</a>
<a href="test1.com" target="_blank">例子游戏私服001</a>
<a href="test22.com" target="_blank"><strong>例子游戏私服001</strong></a>
<a href="test33.com" target="_blank"><font color=red>让你3天学会英语日语法语</font></a>
<a href="test444.com" target="_blank"><img src="test.com/test.jpg">例子游戏私服001</a>
等文本广告。
其链接完全没有特征码,只能提取其中的 “私服” “3天学会” 这几个文字来做特征码。
以下是某天在群里讨论得出的规则。但发现不能普遍适用。特求一个通用性较高,更新时只需更新其中的关键字的规则。
[Patterns]
Name = "a"
Active = FALSE
URL = "$TYPE(htm)|$TYPE(js)"
Limit = 256
Match = "<a\s[^>]+>[^<]++私服[^<]+</a>"
Replace = "\0"
过滤文字型的链接广告
Moderator: cre
Forum rules
- 软件自带帮助是最好的入门教程,请仔细阅读;在您掌握最基本知识前,我们没法帮助您
- 提问前请先查阅软件帮助文件和论坛相关讨论
- 查阅软件帮助和论坛相关讨论即可解决的问题帖将直接删除,以免浪费他人时间
- 请学会如何提问,尽量将问题描述清楚,不明确的提问将被直接删除
Re: 过滤文字型的链接广告
哦。问题不是blockfile。问题是那个规则还不具有普适性。
举个例子页面,这是一个在百度上随意搜到的传奇私服的列表,网页有点大,并且不保证没有木马。只是用来举例。
http://www.zt1888.com/sf766.html
其中有一个td,是专门用来放置 “下载专用登录器” 这个链接的,符合<a href=链接 [其他属性]>文字</a>这样的格式。
但我在这个规则里添加 “登录器” 或者 “下载专用登录器” 等关键词都无法过滤。有时候还会在prox里死循环。
举个例子页面,这是一个在百度上随意搜到的传奇私服的列表,网页有点大,并且不保证没有木马。只是用来举例。
http://www.zt1888.com/sf766.html
其中有一个td,是专门用来放置 “下载专用登录器” 这个链接的,符合<a href=链接 [其他属性]>文字</a>这样的格式。
但我在这个规则里添加 “登录器” 或者 “下载专用登录器” 等关键词都无法过滤。有时候还会在prox里死循环。
Re: 过滤文字型的链接广告
我这里没有问题 另外,你给的例子,用这个规则应该不能过滤完全的,用下面这个试试(我没测试太多,就拿了个新浪首页看有没有误过滤),你给的例子可以过滤1、2、3、4、6,没有过滤5是因为没有相应的关键词,反正多测试几个再修改吧,估计肯定会有误过滤的imsheng wrote:哦。问题不是blockfile。问题是那个规则还不具有普适性。
举个例子页面,这是一个在百度上随意搜到的传奇私服的列表,网页有点大,并且不保证没有木马。只是用来举例。
http://www.zt1888.com/sf766.html
其中有一个td,是专门用来放置 “下载专用登录器” 这个链接的,符合<a href=链接 [其他属性]>文字</a>这样的格式。
但我在这个规则里添加 “登录器” 或者 “下载专用登录器” 等关键词都无法过滤。有时候还会在prox里死循环。
Code: Select all
[Patterns]
Name = "a"
Active = TRUE
URL = "$TYPE(htm)|$TYPE(js)"
Limit = 512
Match = "$NEST(<a\s[^>]+>(( <[^>]+> )+{0,6} |)([^<>/]++(私服|登录器)[^<>/]+)*,</a>)"
Replace = "\0"