求新浪页面过滤规则~~~~

sidki config set的配置、使用,新手入门首选

Moderator: phoenix

Post Reply
ajiao
Posts: 59
Joined: Sep 29 2009, 08:17

求新浪页面过滤规则~~~~

Post by ajiao » Jan 11 2012, 01:01

示例页面:http://sports.sina.com.cn/g/2012-01-10/ ... 2653.shtml

我只需要正文部分,什么侧栏啊,微博啊,当然还有广告推荐啊,统统不要。我自己用AdComments.ptxt这个没有搞定。期待大侠帮忙~

ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: 求新浪页面过滤规则~~~~

Post by ddbb » Jan 12 2012, 12:41

我写的sina和sidki无关.....单独的一个规则
2012-01-12_124213.png
2012-01-12_124213.png (33.87 KiB) Viewed 5745 times

Code: Select all

[Patterns]
Name = "Sina Delete 2009.02.10 [ddandyy]"
Active = TRUE
URL = "$TYPE(htm)[^/]++.sina.com.cn/|$TYPE(css)[^/]++.sina.com.cn/|$TYPE(js)[^/]++.sina.com.cn/"
Limit = 12000
Match = "(<|.|#)$LST(Sina)"
Replace = "\0"

blocklist的内容

Code: Select all

# Sina
#

!--_SINA_ADS_BEGIN_-->*<!--_SINA_ADS_END_-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 071127 ws begin -->*<!-- 071127 ws end -->        $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 20070922英超意甲推广begin-->*<!-- 20070922英超意甲推广end-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- GLADNEWS_START -->*<!-- GLADNEWS_END -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- Google begin -->*<!-- Google end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- Google 广告 begin -->*<!-- Google 广告 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- Start  Wrating  -->*<!-- End Wrating-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 位置导航 广告 爱问搜索 begin -->*<!-- 位置导航 广告 爱问搜索 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 企业服务 begin * 企业服务 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--企业服务文字广告开始-->*<!--企业服务文字广告结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
#!-- 今日推荐 begin -->*<!-- 今日推荐 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 新浪10年*开始 -->*<!-- 新浪10年*结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 新闻中心首页顶部广告位 begin -->*<!-- 新闻中心首页顶部广告位 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 中国公开赛代码*开始-->*<!-- 中国公开赛代码*结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 内容底部搜索 begin -->*<!-- 内容底部搜索 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 侧边栏 begin -->*<!-- 侧边栏 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 图铃下载* begin -->*<!-- 新浪公益* end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 竞价文字 start -->*<!-- 竞价文字 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 广告开始 -->*<!-- 广告结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 顶通 begin -->*<!-- 顶通 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 顶通广告 begin -->*<!-- 顶通广告 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--AD300_[0-9]+开始-->*<!--AD300_[0-9]+结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--右侧固定板块模式开始-->*<!--右侧固定板块模式结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--画中画广告开始-->*<!--画中画广告结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--广告开始-->*<!--广告结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--竟价开始-->*<!--竟价结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--图铃下载开始-->*<!--图铃下载结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--爱问搜索开始-->*<!--爱问搜索结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--企业服务 beign -->*<!--企业服务 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 保存功能调用的js begin -->*<!-- 保存功能调用的js end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 音乐推荐列表开始-->*<!-- 音乐推荐列表结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- nba推广 begin -->*<!-- nba推广 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--宋庆龄基金会赞助 begin-->*<!--宋庆龄基金会赞助 end-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--海尔窄通 begin-->*<!--海尔窄通 end-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 20090309 地域上海 通栏 begin -->*<!-- 20090309 地域上海 通栏 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 跨栏 开始 -->*<!-- 跨栏 结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--加载全屏 begin-->*<!--加载全屏 end-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--新浪首页二轮播背投广告开始-->*<!--新浪首页二轮播背投广告结束-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- CPM视窗广告 开始 -->*<!-- CPM视窗广告 结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 370x75轮播bt广告 开始 -->*<!-- 370x75轮播bt广告 结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- SSO_GETCOOKIE_START -->*<!-- SSO_GETCOOKIE_END -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!--加载流媒体 begin-->*<!--加载流媒体 end-->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 新浪商城 begin -->*<!-- 新浪商城 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- webim js begin -->*<!-- webim body js end -->(;|)      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 亚运右侧相关推荐 begin -->*<!-- 亚运右侧相关推荐 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 高清图推荐 开始 -->*<!-- 高清图推荐 结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 一键关注 开始 -->*<!-- 一键关注 结束 -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 大片推广 begin -->*<!-- 大片推广 begin -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- weibo begin -->*<!-- weibo end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 分享 begin -->*<!-- 分享 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- nosmb begin -->*<!-- nosmb begin -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- yleft2blk add by yyk 2011-9-6 begin  -->*<!-- yleft2blk add by yyk 2011-9-6 end  -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
!-- 浪首两轮播通栏01 780x90 begin -->*<!-- 浪首两轮播通栏01 780x90 end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)

div style="margin-top:6px;">*<!-- ip end -->      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)




td width="640" valign="top" class="lc_blue">      $SET(0=<!-- Sina Delete Start [ddandyy] -->\r\n<td width="940" valign="top" class="lc_blue">\r\n<!-- Sina Delete End [ddandyy] -->\r\n)
td width="300"*DisplayAd()*</td>      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
div id="for_loader">*<div class="info_hyfl">*<div id="cty_wrap">*</script>      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
div class="toollinks">*</div>      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)
h1>\1</h1>  $SET(0=<!-- Sina Delete Start [ddandyy] -->\r\n<center><h1>\1</h1></center>\r\n<!-- Sina Delete End [ddandyy] -->\r\n)


FFF(^[0-9a-z])      $SET(0=#F5F8FD)
rightbox{\1}      $SET(0=.rightbox{float:right; \1 float:right;}\r\n)
PartA{\1}      $SET(0=#PartA{height:600px; \1 height:600px;}\r\n)
PartC{background*}      $SET(0=)
blog{\1}      $SET(0=#blog{height:350px; \1 height:350px;}\r\n)
news{\1}  $SET(0=#news{height:600px; \1 height:600px;}\r\n)
ShBlk{*}      $SET(0=)

div class="qyfwBlk">      $SET(0=<div class="qyfwBlk" style="display:none">)
div class="botSxBlk">     $SET(0=<div class="botSxBlk" style="display:none">)
div class="a-r">          $SET(0=<div class="a-r" style="display:none">)
##div class="HSpace_10"></div>     $SET(0=<div class="HSpace_10" style="display:none">)
div class="grD" id="list1">     $SET(0=<div class="grD" id="list1" style="display:none">)
table cellspacing="0" class="PartB">     $SET(0=<table cellspacing="0" class="PartB" style="display:none">)
div class="otherContent_01">     $SET(0=<div class="otherContent_01" style="display:none">)

## 新浪环球地理
part-a{background:url(*)\1}       $SET(0=.part-a{repeat-y;overflow:hidden;zoom:1;margin-top:10px;}\r\n)
a-l{width:647px;\1}       $SET(0=.a-l{width:100%; \1 width:100%;}\r\n)

## 社会新闻
div class="block link-008-yl" style="margin-left:7px;">(\r\n\s+)\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/qwys/index.shtml">奇闻轶事       $SET(0=<div class="block link-008-yl">\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/qwys/index.shtml">奇闻轶事)
div class="block link-008-yl">(\r\n\s+)\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/zqsk/index.shtml">真情时刻       $SET(0=<div class="block link-008-yl" style="margin-left:7px;">\1<h2><a href="http://roll.news.sina.com.cn/news/shxw/zqsk/index.shtml">真情时刻)


## blog css


## sports.sina.com.cn/z/chinaoverseas/
blkS1 {\1}     $SET(0=.blkS1{overflow:visible; \1 overflow:visible; }\r\n)
boxS5 {\1}     $SET(0=.boxS5{overflow:visible; \1 overflow:visible; }\r\n)


blkBreadcrumb {\1}  $SET(0=.blkBreadcrumb{overflow:hidden; \1 overflow:hidden;}\r\n)
# 主容器
blkContainer {\1}  $SET(0=.blkContainer{ width:950px; \1 width:950px;}\r\n)
blkContainerPblk {\1}  $SET(0=.blkContainerPblk{width:948px; \1 width:948px;}\r\n)
# 正文块
blkContainerSblk {\1}  $SET(0=.blkContainerSblk{width:860px; \1 width:860px;}\r\n)
# 相关专题
MTitle_01 {\1}  $SET(0=.MTitle_01{width:640px;margin-left:auto; margin-right:auto; \1 width:640px;margin-left:auto; margin-right:auto;}\r\n)
Mblk_01 {\1}  $SET(0=.Mblk_01{width:640px;margin-left:auto; margin-right:auto; \1 width:640px;margin-left:auto; margin-right:auto;}\r\n)
# 相关新闻 相关博文
MPartA {\1}  $SET(0=.MPartA{margin-left:auto; margin-right:auto; \1 margin-left:auto; margin-right:auto;}\r\n)

#JS


# 爱问link
span class=yqlink>*<a *class=akey *>\1</a></span>  $SET(0=\1)
a [^>]+>([^<]+)\1</a>&& *class=$AV(akey)*  $SET(0=\1)

# sina blog
#div class="componentContent"><center>*</center></div>      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)

# 评论
#div id="commentContent"></div>      $SET(0=<!-- Sina Delete [ddandyy] -->\r\n)

ajiao
Posts: 59
Joined: Sep 29 2009, 08:17

Re: 求新浪页面过滤规则~~~~

Post by ajiao » Jan 15 2012, 18:37

已经搞定,谢谢DDBB

Post Reply