xml 过滤及嵌套匹配问题

新手入门、经验交流

Moderator: cre

Forum rules
  • 软件自带帮助是最好的入门教程,请仔细阅读;在您掌握最基本知识前,我们没法帮助您
  • 提问前请先查阅软件帮助文件和论坛相关讨论
  • 查阅软件帮助和论坛相关讨论即可解决的问题帖将直接删除,以免浪费他人时间
  • 请学会如何提问,尽量将问题描述清楚,不明确的提问将被直接删除
User avatar
phoenix
Site Admin
Posts: 529
Joined: Dec 29 2007, 16:27

Re: xml 过滤及嵌套匹配问题

Post by phoenix »

why wrote:顺便再问下,怎样使指定网站含某关键词的不被过滤 :oops: 比如 ad[^.]++.js 怎样不匹配 read.js add1.js ?
Proxomitron 支持 look behind ,要避免匹配 add1.js 很容易,写成 ad(^d)[^.]+.js 即可。

Proxomitron 不支持 look ahead,所以不能限定 ad 之前不能有什么,但变通一下,我们可以限定 ad 之前必须有什么,比如写成 /ad.js 或 "ad.js 都不会匹配到 read.js 。这只是举例,具体的情况有具体的写法。
why wrote:顺便再请问个,关于网站禁止缓存问题,可以用 proxomitron 做到解禁么?

比如hd.tudou.com随便个视频如 http://hd.tudou.com/program/5640/ ,缓存内找不到js等。官方那个允许缓存似乎没用,应该如何搞呢?
用 opera 试了下,在 opera:cache 中是有记录的。IE8 试了下没有,也许是它的 bug 。以前有类似的报告: https://jira.jboss.org/jira/browse/RF-3159
Bonnie
Moderator
Posts: 165
Joined: Oct 05 2008, 01:27

Re: xml 过滤及嵌套匹配问题

Post by Bonnie »

土豆好像并不需要过滤xml文件就可以过滤广告了.
以下加入默认的adlist:
img01.p2v.tudou.com
css.tudouui.com/skin/play/img/tudou_va.png
js.tudouui.com/bin/tudoumini/TudouMini_15.swf
/bin/player_online/adver*.swf
adplay.tudou.com/crossdomain.xml
js.tudouui.com/js/page/play_program_[0-9]+.js

我还有一些通用规则 没具体测试过滤tudou网时是否需要那些通用规则
不过以上的应该可以过滤tudou的播放器里的所有广告了.
User avatar
cre
Moderator
Posts: 91
Joined: May 26 2009, 00:34

Re: xml 过滤及嵌套匹配问题

Post by cre »

Proxomitron 支持 look behind ,要避免匹配 add1.js 很容易,写成 ad(^d)[^.]+.js 即可。
好吧没办法。具体例子求教。。。就还是这个

Code: Select all

?++(([^r][^e])&([^l][^o]))ad[^d.]+.js*
可以允许read load add,我想再加个mnad.js怎么办。就是要允许read load mnad add,怎么写?一行就容许一个&吧。

如果写成下面的,根本就不符合要求。该怎么写?

Code: Select all

?++(([^r][^e])&(([^l][^o])&([^m][^n])))ad[^d.]+.js*
直接测试下面的可以

Code: Select all

?++(\1)ad[^d.]+.js* ($TST(1=([^r][^e]&[^l][^o])))
这个不行,反正不管咋弄不允许俩&....

Code: Select all

?++(\1&\2)ad[^d.]+.js* ($TST(1=([^r][^e]&[^l][^o]))$TST(2=([^m][^n])))
User avatar
cre
Moderator
Posts: 91
Joined: May 26 2009, 00:34

Re: xml 过滤及嵌套匹配问题

Post by cre »

规则嵌套那个很郁闷,跟预想的很不一样。。。

不是有10个变量嘛,我想着能不能写在一个规则用一个列表....

Code: Select all

table=\1 div=\2 script=\3 iframe=\4 td=\5
id=\9 class=\8
$nest(<\0 \6=$AV(7),</\0>
TST\7 set(0=1)set(6=9)....
光一个div都问题重重,还没敢试其他。这个。。。。哎,怕是不行。这个,老大们分析下可行性 :roll:
是不是我想的太美了-_-!可理论上似乎没问题阿。
User avatar
cre
Moderator
Posts: 91
Joined: May 26 2009, 00:34

Re: xml 过滤及嵌套匹配问题

Post by cre »

Bonnie wrote:土豆好像并不需要过滤xml文件就可以过滤广告了.
以下加入默认的adlist:
......
主要不是过滤广告,是想借这网站求教xml怎么去过滤。还是感谢兄台的帮助。

这个我也能过滤....在UrlKill前面加了个\w呵呵我懒人。

Code: Select all

#tudou
(p2v|stat).tudou.com
adplay.
js.tudouui.com/bin/tudoumini/
/adcontrol/ #{就是这个,如果kill掉就不用去替换那个<ads了。}
#hd.tudou
$URL(\whd.tudou.com)js.tudouui.com/bin/player_online/
renhe_*.swf
缓存找到了,可不知道renhe_.swf是从哪调用的才问那个缓存问题。

比较纳闷为啥www.12345.com经常无用,非得用\w12345.com?
Bonnie
Moderator
Posts: 165
Joined: Oct 05 2008, 01:27

Re: xml 过滤及嵌套匹配问题

Post by Bonnie »

没看懂你要把那么多的元素名写进变量做什么。
id和class也不用分开过滤吧,我都是写进一个列表里的,顶多用个 $URL() 。
User avatar
phoenix
Site Admin
Posts: 529
Joined: Dec 29 2007, 16:27

Re: xml 过滤及嵌套匹配问题

Post by phoenix »

@why,你的几个问题,最好给出实际的网页代码,然后说明你要实现的目标,想匹配什么,不想过滤什么等等

你现在给出的规则,很难让人明白你到底想干什么,至少我是看不懂,也帮不到你。。。
ddbb
Moderator
Posts: 425
Joined: Jan 07 2008, 13:30

Re: xml 过滤及嵌套匹配问题

Post by ddbb »

看上去why好像是要写一个自己的共通方法........

可是他的思路好像.................不是很好..........
Post Reply