Page 1 of 1

一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Jan 18 2009, 14:33
by sixsheeps
过滤 goolge、alimama、第一视频等,比较好用。新手看。p的老手大概都知道了。嘿嘿。

Code: Select all

[Patterns]
Name = "[sss] ★ FOR ALL SITE  <script iframe>"
Active = TRUE
URL = "$TYPE(htm)"
Limit = 250
Match = "<(script|iframe)\1\s*src=$AV(*(t2click|yoyi|ggao|alimama|yahoo|clickeye|dotmore|ifocus|ivansms|vodone|vogate|googlesyndication|cpro.baidu)*)*</\1>"
------------------------------------------------------------------------------------------------------
最近有朋友喜欢上了人体艺术。可是人体艺术上面的广告比较多,请我帮帮忙。我分析了一下网页原代码就乐了。那些广告也不过就是一句话的事情。只要把script和iframe除去就ok了。

因为过滤思路比较简单。代码也简单。所以我先建立了一个list取名 +si (就是script和iframe的意思,呵呵。) 把需要过滤的网站都扔进去。(这个步骤应该都知道吧。如果不知道,私下问)

加入如下过滤语句:

Code: Select all

[Patterns]
Name = "[sss] ★ FOR ALL SITE  <script iframe>小网站"
Active = TRUE
URL = "$TYPE(htm)$LST(+si)"
Limit = 250
Match = "<(script|iframe)\1 *</\1>"

呵呵,清爽多了。

您要问我都过滤了那些网站。您自己上网搜吧。嘿嘿 ……

消失了半年,现在我又回来了。

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Jan 18 2009, 18:35
by ddbb

Code: Select all

[Patterns]
Name = "Delete JavaScript "
Active = TRUE
URL = "$TYPE(htm)"
Bounds = "$NEST(<script\s,</script>)"
Limit = 15000
Match = "*$LST(JSDelete)*"
Replace = "<!-- Delete JavaScript [\0]  -->\n"
我是写了一个专门的JS DELETE规则....路径和inline的都可以过滤....然后在文件里写关键字

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Jan 19 2009, 08:49
by sixsheeps
15k的字节数,是不是有些大了。还是更喜欢小的过滤规则。

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Jan 19 2009, 17:12
by ddbb
因为这个不只是用来过滤URL类型的....

还用来过滤inline的.....

万一有inline代码很长的话 就得这么写....还不如就写一个共通的 把所有的都包括进去......

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Feb 05 2009, 13:12
by phoenix
楼主的规则有个问题,看有没有人能发现。 :D

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Feb 05 2009, 14:01
by ddbb
结尾有问题....
</\1> 会匹配任意的结尾
MATCH的\1是付值用的 不是用来取值的

P.S:刚才TEST了一下 原来在一个MATCH里两次给\1值 第2次是进不去的......

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Feb 05 2009, 15:48
by phoenix
ddbb wrote:结尾有问题....
</\1> 会匹配任意的结尾
说得没错。 ;)
楼主的这种情况,可以用$TST()命令来解决,比如: <(script|iframe)\1 *</$TST(\1)>
帮助文件中有提到,参见 http://www.proxomitron.cn/help/Matching ... s.html#TST

Re: 一些关于script和iframe的通用规则,新手看。可过滤谷歌、百度、阿里妈妈等等等等广告

Posted: Feb 11 2009, 14:31
by phoenix
ddbb wrote: P.S:刚才TEST了一下 原来在一个MATCH里两次给\1值 第2次是进不去的......
sidki-etc\Techniques.txt:
6 Local variables can be reused (assign -> use -> reassign) with global
variables because they are immediately expanded.

Examples:
(???)\0$SET(a=\0)(??)\0$SET(b=\0)
((?)\0$SET(a=$GET(a)\0-))+