1. xml 过滤问题
tudou的广告在一个 xml 中:
Code: Select all
http://adcontrol.tudou.com/adcontrol/adcontrol?juid=b28a1udnsr8&itemId=21166680&sourceId=18000&userId=0&adPlay=0,0&rand=7651&channelId=102
替换<ads aid=*</ads>,limit足够,就是不工作。<?xml version='1.0' encoding='UTF-8'?>
<r a='411000' c='102' v='0'>
<ads aid='2778' lk='http://www.nivea4men.cn/redirect.aspx?u ... 2761200ED5}' id='3427' n='0' oid='100287' p='0.02' type='5' d='' dt='' su='http://www.nivea4men.cn/redirect.aspx?u ... 2761200ED5}' title='0508黑豆背景'>
http://img01.p2v.tudou.com/sales//mater ... 847866.swf
</ads>
<ads aid='3114' lk='http://www.redbanana.cn/ad/api/tjapi.php?fid=4&sid=355' id='3069' n='0' oid='100493' p='0.08' type='1' d='15' dt='15' su='' title='绿茶黑豆前贴090403'>
http://61.164.125.210/flv/028/566/816/2 ... /816/w.jpg
</ads>
</r>
xml 不在默认过滤之列,可 $TYPE(oth) 是干吗的,不是说过滤其他类型么?$TYPE(oth)帮助里说:
这个 $IHDR(Content-Type: ... ) 怎么用?$IHDR(Content-Type: text/xml )不行,$IHDR(Content-Type: * )也不行,这是怎么用的?能实现过滤 xml 么。For more complex content-type checks you can also use "$IHDR(Content-Type: ... )" where "..." is any matching expression including wildcards.
我知道修改 text/xml 为 text/htm 可以实现过滤,可这么改会让好多网站调用不正常。怎么能不修改 header 过滤 xml 呢?如果需要过滤一个网站的 xml,还需要它能正常调用,该怎么办?限定网站也不行时候怎么弄。