中文网站过滤列表分享

sidki config set的配置、使用,新手入门首选

Moderator: phoenix

User avatar
phoenix
Site Admin
Posts: 525
Joined: Dec 29 2007, 16:27

中文网站过滤列表分享

Post by phoenix » Jul 08 2008, 23:34

sidki的过滤列表主要面向西方世界的网站,以下是我在一段时间内浏览中文网站时积累的过滤列表,希望对大家有用,但请注意以下2点:

1、由于各人日常浏览网站不同,我不保证此过滤列表不会对你经常访问的网站产生不良影响。如果你在使用过程中出现问题,请尽量自行排查解决,我无义务一定帮忙。

2、我只会按自己的浏览习惯添加、修改过滤列表;我无意采纳别人的过滤条目,因为我可能从来不会访问你所访问的网站,而你的过滤条目却可能对我经常访问的网站产生不良影响。所以,我鼓励大家就过滤问题讨论、分享经验,但请大家按自己的浏览习惯维护自己的过滤列表,适合自己的才是最好的。

综上所述,以下列表仅供参考,请各取所需。
以下文件位于Proxomitron的Lists\sidki_l_yyyy-mm-dd目录下。如果你使用最新的beta版本,那就是Proxomitron\Lists\sidki_l_2008-01-02目录。请用文本编辑器打开各文件,将过滤列表粘贴到各文件末尾。对blockfile所做的变动,在使用Reload Edited Lists命令之后才会生效。

AdComments

Code: Select all

## Sina
- 顶通广告 begin -->*<!-- 顶通广告 end -->
-广告开始-->*<!--广告结束-->
180天设置PublicRelation5开始 -->*<!-- 180天设置PublicRelation5结束 -->
XAD_STARTX-->*<!--XAD_ENDX-->
_SINA_ADS_BEGIN_-->*<!--_SINA_ADS_END_-->
AdDomains

Code: Select all

lianmeng.com
265.com
cnzz.com
unionsky.cn
allyes
AdHosts-J

Code: Select all

## ============================================================================
## 统计跟踪
## ============================================================================

www.clicki.cn/
www.referer.cn/
[^/]++.imageg.net/
[^/]++.t2t2.com/
js.users.51.la/
[^/]++.50bang.com/
js.tongji.yahoo.com.cn/
js.tongji.cn.yahoo.com/
www.nasboq.com/
www.zzcount.com/
clkstat.qihoo.com/
static.woopra.com/
popstat.pppop.cn/

# www.ccmedia.com.cn webnibbler
cn.tag.btnibbler.com/
tw.tag.adnibbler.com/

# 百度联盟统计代码
utk.baidu.com/

# 北京缔元信数据技术有限公司 万瑞互联网数据统计系统 www.dratio.com
[^/]++.wrating.com/

## ============================================================================
## 广告平台、联盟
## ============================================================================

# 阿里妈妈广告
p.alimama.com/
a.alimama.cn/

# 百度主题推广
cpro.baidu.com/

union.114.com.cn/
link88.be/
js.icast.cn/
[^/]++.yigao.com/
[^/]++.ifocus.cn/
[^/]++.t2click.com/
unionch.qyule.com/
un.so.gougou.com/
cm.p4p.cn.yahoo.com/
cj.8le8le.com/

## ============================================================================
## 其他
## ============================================================================

ufile.kuaiche.com/
AdHosts

Code: Select all

union.wps.kingsoft.com		$TST(\3=iframe)
u.sl.iciba.com				$TST(\3=iframe)
AdKeys-J

Code: Select all

# 百度主题推广
arrBaiduCproConfig

# 阿里妈妈广告
alimama_pid

# Wordpress Google Analyticator Plugin http://cavemonkey50.com/code/google-analyticator/
pageTracker

# 北京缔元信数据技术有限公司 万瑞互联网数据统计系统 www.dratio.com
wratingId
AdPaths

Code: Select all

# crsky & greendown
ggao
~ggao/downd_a.js

zizaiwang
Posts: 17
Joined: Jun 23 2008, 01:14

Re: 中文网站过滤列表分享

Post by zizaiwang » Jul 09 2008, 04:15

谢谢lz的分享 就算不用这些具体的过滤
看看楼主的规则写法也是不错的
因为我英语烂 帮助基本没看 根本不知道那几个list是什么作用
看完楼主的贴子 总算有点理解了

可不可以请楼主将各个list都来个实例看看

ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: 中文网站过滤列表分享

Post by ddbb » Jul 09 2008, 09:51

也就是说
理论上来说
根本就无需自己写新规则
只要加过滤条件就行了

有个小问题
就是-J -S
和同名的 有什么区别

User avatar
phoenix
Site Admin
Posts: 525
Joined: Dec 29 2007, 16:27

Re: 中文网站过滤列表分享

Post by phoenix » Jul 09 2008, 10:32

zizaiwang wrote:可不可以请楼主将各个list都来个实例看看
这个工程量可太大了,不如你给一个广告的例子,我给你演示下如何来分析解决问题。
ddbb wrote:也就是说 理论上来说 根本就无需自己写新规则 只要加过滤条件就行了
没有那么绝对。
对于大部分较通用的情况,sidki已经编好了相应的规则,只需我们添加过滤条目即可;而有些特殊情况,还是自己编写规则来得方便。
ddbb wrote:有个小问题 就是-J -S 和同名的 有什么区别
-J表示该blockfile是针对javascript的。
-S表示该blockfile是site-specific的,即针对特定网站的;相反,如果没有-S,即表示该blockfile是对所有网站生效的,除非你对个别条目使用了$URL()命令来限定其作用的网站。

每个blockfile的开头都有对该文件的说明和用法介绍。

ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: 中文网站过滤列表分享

Post by ddbb » Jul 09 2008, 10:48

那我来提个具体的例子吧

针对深度BBS 比如
我写了3个单独的规则
一个是删掉一个CSS (这个URL里有http://soft.deepin.org/read.php?tid=707090)

Code: Select all

Name = "deepin CSS update"
Active = FALSE
URL = "$TYPE(htm)[^/]*.deepin.org/read.php"
Limit = 120
Match = ".tips li{list-style:none;width:30%;padding:0 5px;float:left;overflow: hidden;text-overflow:ellipsis;white-space:nowrap}"
Replace = "<!-- deepin CSS update -->"
一个是删掉公告的table (比如这上面的公告 http://soft.deepin.org/thread.php?fid=165)

Code: Select all

Name = "deepin sub head clean"
Active = FALSE
URL = "$TYPE(htm)[^/]*.deepin.org/thread.php"
Limit = 3000
Match = "<div class="t">*</table></div>"
Replace = "<!-- deepin sub head clean -->"
最后一个是修改图片代码 不让他有onclick (http://soft.deepin.org/read.php?tid=706354&fpage=2)

Code: Select all

Name = "deepin image click update"
Active = FALSE
URL = "$TYPE(htm)[^/]*.deepin.org/read.php"
Limit = 400
Match = "<img src="http://\1" * onclick="*" onload="*">"
Replace = "<img src="http://\1" border="0">"
这3条现在都是好用的
然后我想把他们整合到sidki里去
我在AdKeys-S.ptxt 里的Hide Targets下面 加入了

Code: Select all

*.deepin.org/read.php		$SET(sAdKey=.tips li{list-style:none;width:30%;padding:0 5px;float:left;overflow: hidden;text-overflow:ellipsis;white-space:nowrap})$SET(sAdKeyR=<!-- deepin CSS update -->)
*.deepin.org/thread.php		$SET(sAdKey=<div class="t">*</table></div>)$SET(sAdKeyR=<!-- deepin sub head clean -->)
*.deepin.org/read.php		$SET(sAdKey=<img src="http://\1" * onclick="*" onload="*">)$SET(sAdKeyR=<img src="http://\1" border="0">)
可是没有效果........
我应该怎么修改呢

还有一种常用的
比如把 <div class="postmessage defaultpost"> 全替换成 <div >
目前我都是硬写
用sidki能做到么

User avatar
phoenix
Site Admin
Posts: 525
Joined: Dec 29 2007, 16:27

Re: 中文网站过滤列表分享

Post by phoenix » Jul 09 2008, 21:03

很遗憾,以上问题,除了公告那个,其他都和AdKeys-S无关。关于AdKeys-S的作用,文件开头已经说得很清楚了:
Names of site-specific tag classes and IDs
该说明下面就是个应用举例:

Code: Select all

#  For instance, to remove three tag classes - AdEShopHead, AdEShopMain,
#  textSmallGrey - at MSNBC:
#
#    (www.|)msnbc.msn.com/	$SET(sAdKey=.adeshop.textSmallGrey.)
至于删除公告的问题,参照上面的例子你应该很容易写出表达式,但我简单看了下,同一页面有其他Tag也具有class="t"属性,使用AdKeys-S将导致所有具有class="t"属性的Tag Block被删除,不知道那是否是你想要的结果。

zizaiwang
Posts: 17
Joined: Jun 23 2008, 01:14

Re: 中文网站过滤列表分享

Post by zizaiwang » Jul 09 2008, 23:24

Code: Select all

*.deepin.org/thread.php      $SET(sAdKey=.t.)$SET(sAdKeyR=<!-- deepin sub head clean -->)
如果是上面这种写法的话 整个页面就什么东西都没有了 现在的网站代码都太乱了 一个网页内 有太多的class
和id名是一样的
过滤的时候经常会出错

ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

sidki上国内网站需要修正的整理

Post by ddbb » Nov 24 2009, 10:19

因为上某些网站 会有误过滤 影响网站正常打开 所以整理一下

以下内容全都加在 Exceptions-U.ptxt 下
百度贴吧发贴框

Code: Select all

static.tieba.baidu.com/tb/js/Fe.js        $SET(0=a_js.a_flash.a_target.a_float.a_code.)
static.tieba.baidu.com/tb/js/pb.js        $SET(0=a_js.a_flash.a_target.)
static.tieba.baidu.com/tb/editor/contentinput.js       $SET(0=a_js.)
tieba.baidu.com/tb/editor/editor.js       $SET(0=a_js.a_headers.a_target.)

淘宝 by phoenix

Code: Select all

# allow Product Views
item.taobao.com/auction/         $SET(0=a_adjsex.)
count.taobao.com/            $SET(0=a_adjsex.)

# allow redirecting links, allow contact information hint
trade.taobao.com/            $SET(0=a_rdlink.i_timer:3.)

# allow item image flash
assets.taobaocdn.com/app/tc/detail.js      $SET(0=a_flash.)
www.taobao.com/view_image.php         $SET(0=a_flash.)

# fix show xxx scripts
www.taobao.com/assets/js/app/recommend_list/recommend_list.js   $SET(0=b_domain.)
www.taobao.com/home/js/favorite/mercury_joint.js      $SET(0=b_domain.)
新浪

Code: Select all

www.sina.com.cn/(^?)      $SET(0=b_domain.)
i3.sina.com.cn/book/forum/s2/js/base.js      $SET(0=b_domain.)
(www|news|tech|ent|video|blog|sports).sina.com.cn/iframe/[0-9]+{2}/[0-9]+{8}/content.js      $SET(0=b_domain.)
(www|news|tech|ent|video|blog|sports).sina.com.cn/iframe/survey/js/100/f_content_[0-9]+.js      $SET(0=b_domain.)
comment4.news.sina.com.cn/comment/xml/yl/6C/DB/28-3-2392163_embed_1.js      $SET(0=b_domain.)
ent.sina.com.cn/js/moodcounter.js      $SET(0=b_domain.)
sjs.sinajs.cn/common/js/boot.js      $SET(0=b_domain.)
(ent|mil.news).sina.com.cn/*/[0-9]+.(shtml|html)      $SET(0=b_domain.)
bbs.[a-z]+.sina.com.cn/showtopicpropnum.php            $SET(0=a_jssigns.)
comment[0-9].news.sina.com.cn/(comment|cgi-bin)/                   $SET(0=a_redir.)
看ku6外连的视频时用

Code: Select all

[0-9]+{1,3}.[0-9]+{1,3}.[0-9]+{1,3}.[0-9]+{1,3}/                  $SET(0=a_refer.)
163

Code: Select all

*.163.com/       $SET(0=a_type_t.)
news.163.com/[0-9]+{2}/[0-9]+{4}/[0-9]+{2}/*.html      $SET(0=b_domain.)
优酷

Code: Select all

static.youku.com/*.swf              $SET(0=a_ads.)

red
Posts: 99
Joined: Mar 09 2010, 16:25

Re: 中文网站过滤列表分享

Post by red » Mar 19 2010, 12:18

sina首页底部的广告代码太长了,footer end之后的
使用ph的这个comment remove
## Sina

Code: Select all

_SINA_ADS_BEGIN_-->*<!--_SINA_ADS_END_-->
还需要将<!> Remove: Comment-Block Ads I 9.01.10 [sd] (d.2)的byte limit改到22000以上,默认16000,我改成24000了 :x

Bonnie
Moderator
Posts: 165
Joined: Oct 05 2008, 01:27

Re: 中文网站过滤列表分享

Post by Bonnie » Mar 19 2010, 19:58

Code: Select all

_SINA_ADS_BEGIN_-->*<!--_SINA_ADS_END_-->
我记得这条有误过滤的,会将正常的sina边栏代码也过滤掉。

Post Reply