cnBeta 新闻页面广告过滤

针对特定网站的规则分享、讨论

Moderator: phoenix

Post Reply
天堂之门
Posts: 17
Joined: Nov 27 2008, 10:50

cnBeta 新闻页面广告过滤

Post by 天堂之门 » Dec 26 2008, 16:40

过滤对象:形如 http://www.cnbeta.com/articles/73351.htm 这类新闻页面。

过滤方式:
1. 利用 HTTP Header 过滤中的 URL-Killer: kill-a-URL (out) 过滤规则,将需要过滤的网址写入 URL Killfile.txt
2. HTML 网页过滤中自己新建的“截尾”过滤规则

将下列需屏蔽的网址添加进 Proxomitron 解压目录\Lists\URL Killfile.txt 中:

Code: Select all

## cnbeta 新闻 20081226
img.cnbeta.com/ms_ff/
pagead2.googlesyndication.com/
a.alimama.cn/
www.cnbeta.com/images/yodao576.gif
#亿告网络广告交易平台
monitor.yigao.com/
img.cnbeta.com/idc300.gif
复制如下“截尾”规则,然后导进 HTML Web Page Filters 列表:

Code: Select all

[Patterns]
Name = "cnBeta_EndCut"
Active = TRUE
URL = "www.cnbeta.com/"
Bounds = "<script\s*</script>"
Limit = 105
Match = "(*Arcomment*)\0"
Replace = "\0 </div></div></div></div></div></body></html> \k"
过滤前后的页面截图:

1. 带广告截图(广告区域已用黄色遮罩标出):
cnbeta新闻带广告.png
cnbeta新闻带广告.png (364.6 KiB) Viewed 27235 times
2. 去广告截图:
cnbeta新闻去广告.png
cnbeta新闻去广告.png (90.82 KiB) Viewed 27232 times

Post Reply