Search found 34 matches

by vvmao
Oct 09 2008, 19:04
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 一个脑袋两个大,折腾到现在只好求助了,呵呵

是这样啊,真是巧了,我正好翻译到$AV这里卡住了,不理解这个命令的含义。 $AV(匹配) 应用于:仅限匹配 过滤类型: IN,OUT或者匹配 这个命令用来匹配任意属性值,它首先自动分离并解析这个值, 【This is used to match any attribute's value. It first parses and isolates the value - automatically taking things like quotes vs. no quotes into account. The match within the command is then limited ...
by vvmao
Oct 09 2008, 16:05
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 一个脑袋两个大,折腾到现在只好求助了,呵呵

这段代码链接指向http://www.eachnet.com/,是不应被过滤的;但是img src="http://i1.eachimg.cn/指向了外部地址,所以实际上被过滤了,这是误杀。 <a href="http://www.eachnet.com/promo/080904_3c_esnb4.html?_fromid=homepage_04&srcid=a137_4" target="_blank"><img src="http://i1.eachimg.cn/img/mkt/hp/081007_icon3_70x70....
by vvmao
Oct 09 2008, 15:50
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 一个脑袋两个大,折腾到现在只好求助了,呵呵

说实话,我没看出第一个链接有什么特别之处让你不想过滤,它只比另外两个链接在img标签后多了些文字,但那在链接中是很常见的。 第二个链接我测试是可以过滤的。 第三个链接占用了261 bytes,把Byte Limit相应调大就可以了。 我来解释我的思路,我把链接分为几种情况: 1图片在本地,url指向外部-砍 2图片在外部,url指向外部-砍 3图片在本地,url指向内部-留 4图片在外部,url指向内部-留 其实我还想细分成有图片的链接和无图片的链接两种情况,也就是<a*> <img*> </a>中有无 <img*> 的情况,每种情况按上述分类,那就是8种不同情况。不过现在已经晕了,先不分了...
by vvmao
Oct 09 2008, 15:42
Forum: 一般应用交流
Topic: Matching Rules帮助文件,覆盖原文件即可,新手有用
Replies: 9
Views: 36356

Re: Matching Rules帮助文件,覆盖原文件即可,新手有用

把压缩包里的An Introduction To Text Matching.html解压后覆盖help下面的同名文件即可。
中文翻译是按照自己的理解写的,同时把英文原文附在译文下面,只是对字体颜色做了处理。这样如果觉得翻译有问题可以很方便的查看原文。
An Introduction To Text Matching.zip
(3.61 KiB) Downloaded 2053 times
by vvmao
Oct 09 2008, 13:19
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 一个脑袋两个大,折腾到现在只好求助了,呵呵

哦,忘记说明了。$LST(SearchList)只是排除搜索引擎的,因为搜索引擎的页面都是外部链接啊。
所以在这里可以忽略不计。
by vvmao
Oct 09 2008, 02:39
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

一个脑袋两个大,折腾到现在只好求助了,呵呵

试了好几种方法都不行 [Patterns] Name = "[I]ALL-out-Link##去除所有指向外部链接的链接" Active = TRUE URL = "^$LST(SearchList)" Bounds = "$NEST(<a\s,</a>)" Limit = 256 Match = "(* href=*http://((^\h|local.ptron)*)/*</a>)" Replace = "<font size=2 color=red>lINK-AD</font>" 如何避免...
by vvmao
Oct 07 2008, 20:28
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 关于如何通杀广告的思路,欢迎讨论啊。

我太粗心了。谢谢。
看来细心和熟悉语法才是王道。我决定认真学习一段时间,再来论坛提问,不再闹笑话了。
by vvmao
Oct 07 2008, 15:12
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 关于如何通杀广告的思路,欢迎讨论啊。

过滤非本主机以外文字链接遇到一个现象,仔细看了好几遍网页源代码,找不到原因, 这是规则,根据论坛里找到现有规则改的,里面的排除搜索引擎的语句应该怎么写?现在根本不起作用 ScreenShot00037.jpg 这是效果,链接是daohang.google.cn,为什么同样都是指向外部的文字链接,上面的不被过滤,下面的就可以过滤呢? ScreenShot00036.jpg 上面没被过滤部分的代码是 <dt> <li><a href="http://www.google.cn" target=_blank id=AFrqEzfUWaEpJEPlihzzoPridL__y9uAr...
by vvmao
Oct 07 2008, 15:00
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

Re: 关于如何通杀广告的思路,欢迎讨论啊。

这里大致解释一下哈: 通常文字广告只能用关键词过滤,但是也可以考虑过滤所有链接指向非当前主机名的。 一般文字广告会指向广告主的网址(垃圾的39.net),代理广告公司的跳转网址(allyes等),或者是当前主机某个固定的网址(网易的pro.163)。所以可以从这三个方面入手予以屏蔽。 唯一就是注意有些网站比如搜索引擎都是指向外部的链接,所以一定要排除掉,否则搜索结果全没了,还有msn.com.cn,原来都是ynet.com的链接,没有自己的东西啊。这种垃圾网站砍了都没关系。 图片广告大致类似,此外一般广告图片会存在固定的文件夹下,例如华军的就是newhuagg文件夹下,霏凡的在gg文件夹下,这...
by vvmao
Oct 07 2008, 14:41
Forum: 一般应用交流
Topic: 关于如何通杀广告的思路,欢迎讨论啊。
Replies: 16
Views: 15951

关于如何通杀广告的思路,欢迎讨论啊。

今天正在翻译匹配命令的帮助文件,头有些大。换换脑子贴一张我的广告通杀思路图。
呵呵,其实所谓通杀应该是不会存在的,但是如果能够使得广告处于不再让人厌烦的程度也就是达到目的了,水至清则无鱼嘛,就像电视广告如果把脑白痴、恒源羊什么的去掉也就大致可以接受了。欢迎高手发言啊。
广告通杀思路图
广告通杀思路图
.jpeg (225.53 KiB) Viewed 10087 times