Page 1 of 1

学习笔记1

Posted: Nov 20 2012, 14:06
by uddgm
作为一个新人,感觉学习的困难,把自己的笔记放出来,同时希望大家写点简单的例子,互相交流更能进步,
其实,作为新人刚开始需要的不是什么复杂的东西,从起步的时候搞清楚一点规则比看一堆复杂的脚本更容易明白。
建议大家写点简单的,如图片的过滤,图片的更改,广告网址的添加。不用太多,写1条规则就行。
比如
如何隐藏网页上的浮动页面。
如何将图片改为链接。
如何将script中的脚本替换成空白?
如何判断一个脚本中是否含有播放器或swf代码?
如何判断一个脚本中是否有跳转信息或弹出窗口?

1 规则的导入导出
导入 在网页或者论坛复制代码,在规则窗口中点右键可导入
导出 在规则窗口,点右键可导出到剪贴板。

字节限制(Byte Limit)
根据需要匹配的标签中内容的长度,如script中比较长,而img、link 中比较短

边界限制(Bounds Limit)
控制预匹配,即先检查有这样的标签没,通常用开始标签*结束标签组成。<a *</a> 此项可选可不选。

如<a* href="slugcakes.html" >*</a>
<a href="crabcakes.html" > some stuff </a><br> <a href="slugcakes.html" > other stuff </a>
那么边界匹配一个* 匹配
<a href="crabcakes.html" > some stuff </a><br> <a

匹配表达式

注意:没有使用范围检测,在匹配表达式中不能在开始和结束标签中使用*,否则会匹配过多。
通常使用范围匹配可以使用匹配变量。

如下
范围匹配 bounds: <a\s*</a> 字节limit: 128
表达式 matching: * href="\1"*
替换 replace: <a href="\1">一个链接</a>

url 匹配
为了在特定的网页或网址发挥作用,使用URL匹配。http:// 将直接排除。
www.this.com|www.this.too.com 即只在这两个网址使用规则。
(^www.this.com) 在这个网址不使用规则。

导入过滤文件
如果你想对大量广告网址进行过滤并记录。创建一个过滤文件最合适。
在配置中加入你的过滤文件,然后在匹配窗口 add 加入的文件即可。

head 过滤
head 包括进入in 和出去out 。
往服务器发送信息是请求 out。服务发回是应答 in。

禁止url
URL-kill,用/k禁止不必要的url,使用此规则匹配url时,不向服务器发出连接。
对于img 则返回killed.gif替换图片.其他的则返回 killed.html.存在于 html目录中,可修改。


head 的名字是你需要过滤head的名称,必须完全匹配。:后面可加注释。

head匹配 只是用来匹配header的内容。
修改和替换 header:表达式和替换文本 都需要实际内容
删除:有匹配替换为空。
添加:有替换,表达式为空。
不存在时添加:有替换,匹配部分使用 (^?).

URL:head
有时你需要才、改变网页的URL本身。使用url:看作一个特殊的URL header过滤规则。
在替换文本中可使用$jump() $rdir()来重定向。(估计可解决不在新浪网图片就不能显示的问题。)
$jump 向浏览器发送重定向命令。
¥rdir 不通过浏览器发送。
例子:作用 匹配没有www和com的主机名,转换成www.*.com
http header=url:网址重定向(out) 以url开头 指明这是一个匹配url的head过滤
mactch=http://([^./+])\1/\2 匹配没有任何点或斜线的主机名,获取主机名到\1,获取剩余路径到\2
replace=$jump(http://www.\1.com/\2) 为$jump组成一个新的变量。

切断URL
[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL-Killer: kill-a-URL (out)" 切断url
URL = "$LST(AdList)" 广告网址列表
Replace = "URL killed \k" 替换文本