sina.com.cn 过滤规则分享

针对特定网站的规则分享、讨论

Moderator: phoenix

User avatar
phoenix
Site Admin
Posts: 526
Joined: Dec 29 2007, 16:27

Re: sina.com.cn 过滤规则分享

Post by phoenix »

Code: Select all

<$LST(Sina)|.$LST(Sina)
写成

Code: Select all

[<.]$LST(Sina)
更简洁些。

old和new有些项目重复了,其实也没必要分开,都合并到一起好了,只要将html和css分开就好了。
ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: sina.com.cn 过滤规则分享

Post by ddbb »

关于用了sidki之后.....
sina的 已有_COUNT_位网友发表评论 这个被过滤掉了......
我debug了一下 没发现他过滤了网页中的东西
估计是JS运算之后 改这个span的状态的时候 被屏蔽了
我只能查到 改这个span的状态的JS是 http://news.sina.com.cn/iframe/confv/fullscreenview.js
html中是
<span name="cmnt_count" cmnt_id="gn:1-1-16233919:0" p_id="1001" p_key="1-1-16233919" p_url="http://news.sina.com.cn/c/2008-09-04/235016233919.shtml" p_expara="" show_limit="20,0" style="display:none; margin-right:12px;">已有<span class="f_c00">_COUNT_</span>位网友发表评论</span>
这个该如何改才能让他显示出来?????
ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: sina.com.cn 过滤规则分享

Post by ddbb »

忘了给link了.....
比如说这个页面....
http://news.sina.com.cn/c/2008-09-04/235016233919.shtml
User avatar
phoenix
Site Admin
Posts: 526
Joined: Dec 29 2007, 16:27

Re: sina.com.cn 过滤规则分享

Post by phoenix »

首先,操作已评论网友数量的js是http://news.sina.com.cn/comment/cmnt_counter.js,该js因为url中含有counter而被以下规则阻挡:
<Match: <script> Block: Scripts by URL 7.11.06 [pr] (d.2) >
通过在IncludeExclude-U.ptxt中添加以下项目可以排除该规则的过滤:

Code: Select all

news.sina.com.cn/						$SET(0=a_adjsex.)
通过检查cmnt_counter.js和prox的log,浏览器接下来的请求http://counter.sina.com.cn/querylist?format=js&entry=g_clist&id=0&key=又被以下规则过滤:
Top Sniff: JS & VBS Content 7.10.27 [sd] (d.2 l.3)
同理,再添加免过滤项目:

Code: Select all

counter.sina.com.cn/						$SET(0=a_jssigns.)
清空缓存,刷新页面,问题解决。
ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: sina.com.cn 过滤规则分享

Post by ddbb »

:cry:

我尝试过去看log windows
可是实在是有点看不懂........
能简单的介绍下你的第2步是怎么看出来的么
User avatar
phoenix
Site Admin
Posts: 526
Joined: Dec 29 2007, 16:27

Re: sina.com.cn 过滤规则分享

Post by phoenix »

首先,通过prox menu的show xx scripts可以看到如下内容:
show_scripts.png
show_scripts.png (27.83 KiB) Viewed 20750 times
通过其url可以推测其和获取当前页面评论人数有关,其内容显示replaced by js sniffer,即被过滤。

再查看log window中的记录,即可确认生效的规则是“Top Sniff: JS & VBS Content 7.10.27 [sd] (d.2 l.3)”
js_sniffer.png
js_sniffer.png (20.65 KiB) Viewed 20736 times
jonaphan
Posts: 8
Joined: Jan 25 2010, 21:00

Re: sina.com.cn 过滤规则分享

Post by jonaphan »

Code: Select all

# 主容器
blkContainer{\1width:*px;\2}  $SET(0=.blkContainer{\1 \2 width:950px;})
# 正文块
blkContainerSblk{\1width:*px;\2}  $SET(0=.blkContainerSblk{\1 \2 width:860px;})
这里的意思,应该是将正文的宽度拉宽吧?
但我用了后,广告可以去掉,但正文的宽度仍没改变,请问这里应该如何修改呢?把正文的宽度拉到上面设定的宽度.

附新浪链接:美联航一架客机遭遇强气流致30人受伤_新浪航空航天_新浪网
http://mil.news.sina.com.cn/s/2010-07-2 ... 01783.html
Attachments
1.JPG
1.JPG (81.04 KiB) Viewed 17418 times
ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: sina.com.cn 过滤规则分享

Post by ddbb »

额......你的图片总是这么恐怖.......

放上我的最新的规则......好像主要就是blocklist变化的大一些

Code: Select all

[Patterns]
Name = "Sina Delete 2009.02.10 [ddandyy]"
Active = TRUE
URL = "$TYPE(htm)[^/]++.sina.com.cn/|$TYPE(css)[^/]++.sina.com.cn/|$TYPE(js)[^/]++.sina.com.cn/"
Limit = 8000
Match = "(<|.|#)$LST(Sina)"
Replace = "\0"


另外关于那个右边的那一块空白....你用了这个规则之后 要清一下缓存.....
Attachments
Sina.txt
(7.8 KiB) Downloaded 692 times
jonaphan
Posts: 8
Joined: Jan 25 2010, 21:00

Re: sina.com.cn 过滤规则分享

Post by jonaphan »

感谢ddbb提供的规则,用着后正常了.
一下子看新浪这样大网站的代码,感觉还是有些吃力哦.

Code: Select all

URL = "$TYPE(htm)[^/]++.sina.com.cn/|$TYPE(css)[^/]++.sina.com.cn/|$TYPE(js)[^/]++.sina.com.cn/"
这段代码中,$type()中的类型是起关联的作用?表示在sina中的htm,css,js?
另拉宽的代码中,是否要先把原先空白处的元素去掉后,才能正常用上拉宽的那段代码呢?
ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: sina.com.cn 过滤规则分享

Post by ddbb »

因为有时候我自己的需求比较怪......我又想改CSS 又想改JS.....所以URL那我就那么写了.......

对应的是 sina.com.cn/*.css 和 *.js 表示那里的内容也能改

至于拉宽.......如果你的层写得好 能覆盖的话......可以不删掉.......

不过一般我写东西的时候都是先删掉 然后再拉的
Post Reply