Search found 65 matches
- Jun 13 2008, 12:21
- Forum: 通用规则讨论
- Topic: 用proxomitron配合curl下载制作电子书
- Replies: 4
- Views: 24981
用proxomitron配合curl下载制作电子书
先说明一下,下载制作电子书的工具有很多,方法也有很多,这里只是在某些特殊情况下,比较适合我自己的。我很少看电子书,正则看过一点,不过不常用,手生得很。这几天闲来无聊,有兴趣看看书,没发现哪里有现成的TXT版的下载,好在有NBTIE这个站,方便是方便了,可发现有时翻页时等待的时间太长,就想把书下下来看,复制粘贴肯定是不行的,劳动量大,太机械,太没成就感了。想到用curl和sed配合,可sed的正规又要现学,况且还要有一定的功力才能达到理想的效果。所以只能找适合我自己的办法,proxomitron的正规我算是较常用,而且它是针对HTML的,使用起来较普通的正规有优势,用它作代理,curl来下载即可...
- Jun 05 2008, 09:20
- Forum: 一般应用交流
- Topic: Proxomitron入门级应用之:抛弃Ad Muncher
- Replies: 6
- Views: 55623
Re: Proxomitron入门级应用之:抛弃Ad Muncher
这个是过滤有脚本标签的内容。比如foleo wrote:adm导出的规则 用脚本处理后分类 然后设置里添加这些条目
下面该怎么做?是在web page按你图中这样添加 但没有效果
Code: Select all
<script type="text/javascript" src="templates/rollout.js"></script>
显然,你没有怎么看帮助
Re: 复制log引起崩溃
在几台电脑上都装过prox,都没有此问题
- May 03 2008, 11:05
- Forum: 特定网站规则讨论
- Topic: google 去除图片搜索结果的框架
- Replies: 7
- Views: 18527
Re: google 去除图片搜索结果的框架
防盗链难道不能修改reffer来解决吗?
- Apr 14 2008, 11:15
- Forum: 一般应用交流
- Topic: 关于新浪新闻内容字体控制的思路
- Replies: 3
- Views: 5616
Re: 关于新浪新闻内容字体控制的思路
这个\2就不必加了,limit也可以改小一些,节省点资源sixsheeps wrote:果然,之前的思路太简陋了。
新的代码如下:
Code: Select all
Name = "[sss] [sig] Sina 正文字体16px" Active = TRUE URL = "$TYPE(htm)[^/]++.sina.com.cn/" Limit = 100 Match = ".artibody p{\1font-size:14px\2}" Replace = ".artibody p{\1font-size:16px\2}"
- Apr 14 2008, 11:02
- Forum: sidki config set 讨论区
- Topic: greendown.cn 下载站广告过滤不显示下载链接的解决方案[试行版]
- Replies: 15
- Views: 29447
Re: greendown.cn 下载站广告过滤不显示下载链接的解决方案[试行版]
另外,早晨起来忽然对blockfile里边的~有了想法,在webpage里改了点东西,发现不必somh的js文件也可以在绿站很好的去广告并显示下载链接,一并奉上,代码如下: [Patterns] Name = "Adkill for Greendown.cn [wongker][20080411]" Active = TRUE URL = "$TYPE(htm)|$TYPE(js)(www.|search.|)greendown.cn/" Bounds = "<(script|iframe)\1\s*</\1>" Limit = 5...
- Apr 13 2008, 14:18
- Forum: sidki config set 讨论区
- Topic: greendown.cn 下载站广告过滤不显示下载链接的解决方案[试行版]
- Replies: 15
- Views: 29447
Re: greendown.cn 下载站广告过滤不显示下载链接的解决方案[试行版]
你的意思是针对\w.crsky.com/view_down.asp?view_n=地址过滤td嵌套里的(<td width=$AV(410) * adlist \+ \',</td>,包含width=410属性和adlist+' 的td,头大,我没有搜索到410的width啊,我只是在当前源码中翻width=410,似乎方法有问题,请详细解释下吧! 比如这个下载地址:http://www.crsky.com/soft/3319.html 由这个js写入下载地址:http://www.crsky.com/view_down.asp?view_n=1&SoftID=3319&ID...
- Apr 13 2008, 11:39
- Forum: sidki config set 讨论区
- Topic: greendown.cn 下载站广告过滤不显示下载链接的解决方案[试行版]
- Replies: 15
- Views: 29447
Re: greendown.cn 下载站广告过滤不显示下载链接的解决方案[试行版]
添加免过滤还是有些不好,有时候还是会留下一些空白的flash。如何不使用sidki的规则,可以添加以下替换规则既不用免过滤,也不会显示不出下载地址。用sidki的也以试试看行不行
替换为空
Code: Select all
$URL(http://\w.crsky.com/view_down.asp\?view_n\=)$NEST(<td width=$AV(410) * adlist \+ \',</td>)
- Apr 03 2008, 11:15
- Forum: 一般应用交流
- Topic: 浏览 https 类网站问题
- Replies: 5
- Views: 8412
Re: 浏览 https 类网站问题
如果你用sidki的规则,看看Config_Control.txt里,启用half-SSL即可解决 2.2 Use Half-SSL (off) ............................................................................... If active, secure links (https://) get redirected or converted to a Proxomitron URL command (http://https..). Pro: You may save some time because P...
- Mar 29 2008, 11:36
- Forum: 一般应用交流
- Topic: 请教ggao 的写法
- Replies: 8
- Views: 29164
Re: 请教ggao 的写法
个人感觉,直接用header过滤应该比内容过滤要好一些,我用firefox浏览的时候,基本不会留下什么空白,但用ie、TW、GB时就会发现很多空白(不知道opera怎么样),所以用header加上一部分内容过滤足以,不用再为空白部分添加 新的规则了(如果用ie,嘿嘿, )。sixsheeps wrote:看了一遍,发现写的很全。用这个过滤一般人都够用了!呵呵。厉害啊。之前一直在研究web page的单个网站的过滤,现在再加上header的通用过滤,就够用了。
有一个问题:这个header过滤是不是每次浏览网页都把那么多内容全部匹配一遍呢?
至于是否全部匹配,我想应该是的