我来解释我的思路,我把链接分为几种情况:phoenix wrote:说实话,我没看出第一个链接有什么特别之处让你不想过滤,它只比另外两个链接在img标签后多了些文字,但那在链接中是很常见的。
第二个链接我测试是可以过滤的。
第三个链接占用了261 bytes,把Byte Limit相应调大就可以了。
1图片在本地,url指向外部-砍
2图片在外部,url指向外部-砍
3图片在本地,url指向内部-留
4图片在外部,url指向内部-留
其实我还想细分成有图片的链接和无图片的链接两种情况,也就是<a*><img*></a>中有无<img*>的情况,每种情况按上述分类,那就是8种不同情况。不过现在已经晕了,先不分了。
那两个链接:
Code: Select all
"<a href=""http://blog.163.com/redirect.html?url=http://yxp.163.com/product.do?action=detail&productType=photo&findex_photo?080825yxp07""><img src=""http://blog.163.com/style/common/index/image/yxpq.jpg"" width=""100%""></a>
"
我现在的config文件非常纯净,只有几条测试的规则。其余的都删除了。你那里可以过滤是不是其它规则的缘故。