收集了很多网页(主要是用Scrapbook),最近打算整理一下, 谁知道用IE打开来看,
发现收集的静态页面几乎都多了很多"垃圾代码",甚至到了有碍观瞻的地步了:
每个文件的末端都被prx加上了浏览时的控制码(就是点击页面空白处出现的圆圈
三角符号里面菜单的那些代码),而且是静态的.....
对我来说简直是晴天霹雳啊, 几百个文件啊....哪位支招修复一下吧? (本人正则不是很熟).
后来又测试了一下,发现sdki config set对于用Scrapbook网页收集来说简直就是魔鬼....
举例来说, 一个简单的网页 http://www.comicer.com/stronghorse/soft ... orever.htm
打开proxomitron, Scrapbook采集到的index.html为 59K
跳过proxomitron, Scrapbook采集到的index.html为71.4K,
试了"Minimal Mode", 通过查看源代码发现还是会插入多余的代码.......
请问:有没有办法使sidki只过滤但不插入多余的源代码??
[求助]如何配置使sidki只过滤但不插入多余的源代码??
Moderator: phoenix
Re: [求助]如何配置使sidki只过滤但不插入多余的源代码??
自己修改sidki的过滤语句.................


Re: [求助]如何配置使sidki只过滤但不插入多余的源代码??
以下表达式可以匹配sidki在网页前后插入的代码,要使用single line或Dot matches newline模式。
sidki的所有模式都会插入代码,但Minimal Mode不会插入Prox Menu,保存网页的时候用Prox Menu临时切换到Minimal Mode就可以了。
Code: Select all
<!-- PROX: (Header Top|Bottom) Insertion Begins \[""''\] -->.*?Ends -->
Re: [求助]如何配置使sidki只过滤但不插入多余的源代码??
谢谢...
自己慢慢再琢磨一下...
自己慢慢再琢磨一下...