示例页面:http://sports.sina.com.cn/g/2012-01-10/ ... 2653.shtml
我只需要正文部分,什么侧栏啊,微博啊,当然还有广告推荐啊,统统不要。我自己用AdComments.ptxt这个没有搞定。期待大侠帮忙~
求新浪页面过滤规则~~~~
Moderator: phoenix
Re: 求新浪页面过滤规则~~~~
我写的sina和sidki无关.....单独的一个规则
blocklist的内容
Code: Select all
[Patterns]
Name = "Sina Delete 2009.02.10 [ddandyy]"
Active = TRUE
URL = "$TYPE(htm)[^/]++.sina.com.cn/|$TYPE(css)[^/]++.sina.com.cn/|$TYPE(js)[^/]++.sina.com.cn/"
Limit = 12000
Match = "(<|.|#)$LST(Sina)"
Replace = "\0"
blocklist的内容
Code: Select all
# Sina
#
!--_SINA_ADS_BEGIN_-->*<!--_SINA_ADS_END_--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 071127 ws begin -->*<!-- 071127 ws end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 20070922英超意甲推广begin-->*<!-- 20070922英超意甲推广end--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- GLADNEWS_START -->*<!-- GLADNEWS_END --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- Google begin -->*<!-- Google end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- Google 广告 begin -->*<!-- Google 广告 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- Start Wrating -->*<!-- End Wrating--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 位置导航 广告 爱问搜索 begin -->*<!-- 位置导航 广告 爱问搜索 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 企业服务 begin * 企业服务 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--企业服务文字广告开始-->*<!--企业服务文字广告结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
#!-- 今日推荐 begin -->*<!-- 今日推荐 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 新浪10年*开始 -->*<!-- 新浪10年*结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 新闻中心首页顶部广告位 begin -->*<!-- 新闻中心首页顶部广告位 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 中国公开赛代码*开始-->*<!-- 中国公开赛代码*结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 内容底部搜索 begin -->*<!-- 内容底部搜索 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 侧边栏 begin -->*<!-- 侧边栏 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 图铃下载* begin -->*<!-- 新浪公益* end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 竞价文字 start -->*<!-- 竞价文字 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 广告开始 -->*<!-- 广告结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 顶通 begin -->*<!-- 顶通 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 顶通广告 begin -->*<!-- 顶通广告 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--AD300_[0-9]+开始-->*<!--AD300_[0-9]+结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--右侧固定板块模式开始-->*<!--右侧固定板块模式结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--画中画广告开始-->*<!--画中画广告结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--广告开始-->*<!--广告结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--竟价开始-->*<!--竟价结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--图铃下载开始-->*<!--图铃下载结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--爱问搜索开始-->*<!--爱问搜索结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--企业服务 beign -->*<!--企业服务 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 保存功能调用的js begin -->*<!-- 保存功能调用的js end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 音乐推荐列表开始-->*<!-- 音乐推荐列表结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- nba推广 begin -->*<!-- nba推广 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--宋庆龄基金会赞助 begin-->*<!--宋庆龄基金会赞助 end--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--海尔窄通 begin-->*<!--海尔窄通 end--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 20090309 地域上海 通栏 begin -->*<!-- 20090309 地域上海 通栏 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 跨栏 开始 -->*<!-- 跨栏 结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--加载全屏 begin-->*<!--加载全屏 end--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--新浪首页二轮播背投广告开始-->*<!--新浪首页二轮播背投广告结束--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- CPM视窗广告 开始 -->*<!-- CPM视窗广告 结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 370x75轮播bt广告 开始 -->*<!-- 370x75轮播bt广告 结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- SSO_GETCOOKIE_START -->*<!-- SSO_GETCOOKIE_END --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--加载流媒体 begin-->*<!--加载流媒体 end--> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 新浪商城 begin -->*<!-- 新浪商城 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- webim js begin -->*<!-- webim body js end -->(;|) $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 亚运右侧相关推荐 begin -->*<!-- 亚运右侧相关推荐 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 高清图推荐 开始 -->*<!-- 高清图推荐 结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 一键关注 开始 -->*<!-- 一键关注 结束 --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 大片推广 begin -->*<!-- 大片推广 begin --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- weibo begin -->*<!-- weibo end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 分享 begin -->*<!-- 分享 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- nosmb begin -->*<!-- nosmb begin --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- yleft2blk add by yyk 2011-9-6 begin -->*<!-- yleft2blk add by yyk 2011-9-6 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 浪首两轮播通栏01 780x90 begin -->*<!-- 浪首两轮播通栏01 780x90 end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
div style="margin-top:6px;">*<!-- ip end --> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
td width="640" valign="top" class="lc_blue"> $SET(0=<!-- Sina Delete Start [ddandyy] -->\r\n<td width="940" valign="top" class="lc_blue">\r\n<!-- Sina Delete End [ddandyy] -->\r\n)
td width="300"*DisplayAd()*</td> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
div id="for_loader">*<div class="info_hyfl">*<div id="cty_wrap">*</script> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
div class="toollinks">*</div> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
h1>\1</h1> $SET(0=<!-- Sina Delete Start [ddandyy] -->\r\n<center><h1>\1</h1></center>\r\n<!-- Sina Delete End [ddandyy] -->\r\n)
FFF(^[0-9a-z]) $SET(0=#F5F8FD)
rightbox{\1} $SET(0=.rightbox{float:right; \1 float:right;}\r\n)
PartA{\1} $SET(0=#PartA{height:600px; \1 height:600px;}\r\n)
PartC{background*} $SET(0=)
blog{\1} $SET(0=#blog{height:350px; \1 height:350px;}\r\n)
news{\1} $SET(0=#news{height:600px; \1 height:600px;}\r\n)
ShBlk{*} $SET(0=)
div class="qyfwBlk"> $SET(0=<div class="qyfwBlk" style="display:none">)
div class="botSxBlk"> $SET(0=<div class="botSxBlk" style="display:none">)
div class="a-r"> $SET(0=<div class="a-r" style="display:none">)
##div class="HSpace_10"></div> $SET(0=<div class="HSpace_10" style="display:none">)
div class="grD" id="list1"> $SET(0=<div class="grD" id="list1" style="display:none">)
table cellspacing="0" class="PartB"> $SET(0=<table cellspacing="0" class="PartB" style="display:none">)
div class="otherContent_01"> $SET(0=<div class="otherContent_01" style="display:none">)
## 新浪环球地理
part-a{background:url(*)\1} $SET(0=.part-a{repeat-y;overflow:hidden;zoom:1;margin-top:10px;}\r\n)
a-l{width:647px;\1} $SET(0=.a-l{width:100%; \1 width:100%;}\r\n)
## 社会新闻
div class="block link-008-yl" style="margin-left:7px;">(\r\n\s+)\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/qwys/index.shtml">奇闻轶事 $SET(0=<div class="block link-008-yl">\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/qwys/index.shtml">奇闻轶事)
div class="block link-008-yl">(\r\n\s+)\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/zqsk/index.shtml">真情时刻 $SET(0=<div class="block link-008-yl" style="margin-left:7px;">\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/zqsk/index.shtml">真情时刻)
## blog css
## sports.sina.com.cn/z/chinaoverseas/
blkS1 {\1} $SET(0=.blkS1{overflow:visible; \1 overflow:visible; }\r\n)
boxS5 {\1} $SET(0=.boxS5{overflow:visible; \1 overflow:visible; }\r\n)
blkBreadcrumb {\1} $SET(0=.blkBreadcrumb{overflow:hidden; \1 overflow:hidden;}\r\n)
# 主容器
blkContainer {\1} $SET(0=.blkContainer{ width:950px; \1 width:950px;}\r\n)
blkContainerPblk {\1} $SET(0=.blkContainerPblk{width:948px; \1 width:948px;}\r\n)
# 正文块
blkContainerSblk {\1} $SET(0=.blkContainerSblk{width:860px; \1 width:860px;}\r\n)
# 相关专题
MTitle_01 {\1} $SET(0=.MTitle_01{width:640px;margin-left:auto; margin-right:auto; \1 width:640px;margin-left:auto; margin-right:auto;}\r\n)
Mblk_01 {\1} $SET(0=.Mblk_01{width:640px;margin-left:auto; margin-right:auto; \1 width:640px;margin-left:auto; margin-right:auto;}\r\n)
# 相关新闻 相关博文
MPartA {\1} $SET(0=.MPartA{margin-left:auto; margin-right:auto; \1 margin-left:auto; margin-right:auto;}\r\n)
#JS
# 爱问link
span class=yqlink>*<a *class=akey *>\1</a></span> $SET(0=\1)
a [^>]+>([^<]+)\1</a>&& *class=$AV(akey)* $SET(0=\1)
# sina blog
#div class="componentContent"><center>*</center></div> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
# 评论
#div id="commentContent"></div> $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)