Page 1 of 1

[求助]如何配置使sidki只过滤但不插入多余的源代码??

Posted: Sep 01 2008, 00:15
by tor524e
收集了很多网页(主要是用Scrapbook),最近打算整理一下, 谁知道用IE打开来看,
发现收集的静态页面几乎都多了很多"垃圾代码",甚至到了有碍观瞻的地步了:
每个文件的末端都被prx加上了浏览时的控制码(就是点击页面空白处出现的圆圈
三角符号里面菜单的那些代码),而且是静态的.....
mass.png
mass.png (8.98 KiB) Viewed 10209 times
对我来说简直是晴天霹雳啊, 几百个文件啊....哪位支招修复一下吧? (本人正则不是很熟).

后来又测试了一下,发现sdki config set对于用Scrapbook网页收集来说简直就是魔鬼....
举例来说, 一个简单的网页 http://www.comicer.com/stronghorse/soft ... orever.htm
打开proxomitron, Scrapbook采集到的index.html为 59K
跳过proxomitron, Scrapbook采集到的index.html为71.4K,

试了"Minimal Mode", 通过查看源代码发现还是会插入多余的代码.......

请问:有没有办法使sidki只过滤但不插入多余的源代码??

Re: [求助]如何配置使sidki只过滤但不插入多余的源代码??

Posted: Sep 01 2008, 08:30
by ddbb
自己修改sidki的过滤语句.................
:D

Re: [求助]如何配置使sidki只过滤但不插入多余的源代码??

Posted: Sep 01 2008, 10:25
by phoenix
以下表达式可以匹配sidki在网页前后插入的代码,要使用single line或Dot matches newline模式。

Code: Select all

<!-- PROX: (Header Top|Bottom) Insertion Begins \[""''\] -->.*?Ends -->
sidki的所有模式都会插入代码,但Minimal Mode不会插入Prox Menu,保存网页的时候用Prox Menu临时切换到Minimal Mode就可以了。

Re: [求助]如何配置使sidki只过滤但不插入多余的源代码??

Posted: Sep 01 2008, 10:59
by tor524e
谢谢...
自己慢慢再琢磨一下...