Search found 65 matches

by Ray4
Jan 24 2009, 22:34
Forum: 一般应用交流
Topic: UTF-8编码网页中中文的处理方法
Replies: 11
Views: 36797

Re: UTF-8编码网页中中文的处理方法

这里有个工具,可能将中文字符直接转换为[%xx]的形式,可以自动将转换后的形式添加到指定文件
http://site.halfmoon.jp/movielist/96.html
by Ray4
Jan 24 2009, 10:02
Forum: 特定网站规则讨论
Topic: google.com 网页快照增强
Replies: 7
Views: 17224

Re: google.com 网页快照增强

这个mem-temp是退出的时候清空?有没有办法让prox主动清空?
by Ray4
Dec 26 2008, 17:07
Forum: 一般应用交流
Topic: Privoxy 这个同类软件有人用过?
Replies: 9
Views: 8217

Re: Privoxy 这个同类软件有人用过?

首先一点就是没有界面..用起来相对某些人很麻烦......当然我是无所谓.....不过他好像没有PROX这么方便的TEST 这个就差很多了 写一个语句出来 TEST是很重要的........ 然后就是PRIV好像倾向于把几乎所有的东西全写到一个文件里......这在后期的时候是很要命的事情.......特别是规则越来越多的时候...... 再有一点.......我认为 PRIV用的人多不是因为他的功能真的很强大.......而只是因为他是开源的 是FOR LINUX的软件....有些人有迷信开源......有些人在LINUX下不得不用.......... 不是(倾向)所有的东西写到一个文件,...
by Ray4
Aug 20 2008, 17:22
Forum: 特定网站规则讨论
Topic: google.com 网页快照增强
Replies: 7
Views: 17224

google.com 网页快照增强

其实proxomitron的应用原理本论坛基本都有了,规则再怎么变,也只是具体形式的变化而不是本质的变化,所以以后更多的规则只能算是推荐了 :!: 很多人都会遇到这种情况,好不容易找到自己想要的信息,打开链接,发现服务器当了,打开快照,却又发现需要的东西其实不在当前网页,而是在此服务器上更深的地方,这时就又要手动搜索这个链接,麻烦! :oops: 今天在userscripts上发现了她 :twisted: : Google Cache Continue Redux ,它会在google网页快照页面内的所有超链接旁生成一个名为cache的链接,点击它会自动在google的cache里继续搜索新打...
by Ray4
Aug 06 2008, 09:48
Forum: 一般应用交流
Topic: 过滤文字型的链接广告
Replies: 4
Views: 6319

Re: 过滤文字型的链接广告

哦。问题不是blockfile。问题是那个规则还不具有普适性。 举个例子页面,这是一个在百度上随意搜到的传奇私服的列表,网页有点大,并且不保证没有木马。只是用来举例。 http://www.zt1888.com/sf766.html 其中有一个td,是专门用来放置 “下载专用登录器” 这个链接的,符合<a href=链接 [其他属性]>文字</a>这样的格式。 但我在这个规则里添加 “登录器” 或者 “下载专用登录器” 等关键词都无法过滤。有时候还会在prox里死循环。 我这里没有问题 a.png 另外,你给的例子,用这个规则应该不能过滤完全的,用下面这个试试(我没测试太多,就拿了个新浪首页...
by Ray4
Aug 05 2008, 11:39
Forum: 通用规则讨论
Topic: PC上模拟手机上WAP网站
Replies: 6
Views: 16830

PC上模拟手机上WAP网站

不知道哪个是原贴 http://www.wllj.net/board/dis.asp?id=497 http://tieba.baidu.com/f?kz=74285910 1.找一个直接wap的浏览器,设置代理服务器为proxomitron监听的端口如127.0.0.1:8080 设置The Proxomitron 2.双击打开The Proxomitron软件,会看到The Proxomitron default菜单,只选择 web page Filters 和 Outgoing Header Filters 并保存(上面那个存盘的标志)。 3.点击右侧的 Headers ,删除里面的全部...
by Ray4
Jul 23 2008, 14:34
Forum: 一般应用交流
Topic: 嵌套div如何清除的问题
Replies: 10
Views: 11447

Re: 嵌套div如何清除的问题

现在可以了........ 不过我的问题也来了...... 这个bounds match和matching expression有什么区别么 我把 <div class="clearfix">$INEST(<div*>,</div>)</div> 不管放到哪里都能正常过滤........ 想不明白bounds match有什么用 另外顺便再问一下 我想定义URL结束 该怎么写 比如只匹配 http://www.sina.com.cn/ 不匹配 http://www.sina.com.cn/abc/ 我记得正则应该是 后面加 $ 可我试了好像不行........ bound...
by Ray4
Jul 02 2008, 14:00
Forum: 特定网站规则讨论
Topic: sina.com.cn 过滤规则分享
Replies: 19
Views: 51555

Re: sina.com.cn 过滤规则分享

也就是说 <td width="640" valign="top" class="lc_blue"> $SET(0=<td width="940" valign="top" class="lc_blue">) 这句的意思是把前面的替换成后面的 是么....... 可是我看了一下 他是把前面的给替换成了上面规则里的 <!-- sixsheeps --> 后面的根本就没出来......... 这是为什么呢 因为它虽然设置了\0为<td width="940"...
by Ray4
Jun 17 2008, 17:15
Forum: 通用规则讨论
Topic: 用proxomitron配合curl下载制作电子书
Replies: 4
Views: 22119

Re: 用proxomitron配合curl下载制作电子书

foleo wrote:curl这条命令下载 会在每段文件开头加上相应的--_curl_-- url字符
翻了curl帮助 没看到哪里可以设置去除
我也没看到相关的参数,不过这个问题很好解决的,对于此文中的例子,可以直接用批处理解决。另外很多文本编辑的软件都可以做到,最好后期还是稍微排一下版,这样阅读起来也比较舒服。
by Ray4
Jun 13 2008, 18:12
Forum: 通用规则讨论
Topic: 用proxomitron配合curl下载制作电子书
Replies: 4
Views: 22119

Re: 用proxomitron配合curl下载制作电子书

*<div class=tianya>*</div> 如果不使用bounds match,匹配表达式应尽量避免以*开始,否则会严重影响效率。你试试在*前加个 <!DOC ,然后在Test Window里比较下速度。 Prox里的 * 类似于正则里的 .*? ,关于效率的问题,你有兴趣的话可参考下正则里关于backtracking的解释。 这里有必要补充一下,这个仅仅是个例子,不要局限于此。在这里我并没有考虑效率的问题,因为在这里,主要是用到了proxomitron的正则不用为了临时的目的增加学习时间和成本,毕竟远水解不了近渴嘛 :P 要提取的部分是在 <div class=tianya>*<...