很多小说网站用拼音替换关键字(把交替换成jiāo),例如:
http://www.19wxw.com/files/article/html ... 34247.html
怎样才能恢复原来的文字?好像要用堆栈吧?
求助:小说网站关键字替换
Moderator: cre
Forum rules
- 软件自带帮助是最好的入门教程,请仔细阅读;在您掌握最基本知识前,我们没法帮助您
- 提问前请先查阅软件帮助文件和论坛相关讨论
- 查阅软件帮助和论坛相关讨论即可解决的问题帖将直接删除,以免浪费他人时间
- 请学会如何提问,尽量将问题描述清楚,不明确的提问将被直接删除
Re:
请仔细观看拙文
浅谈\#的使用及可能遇到的问题解决
http://forum.proxcn.info/viewtopic.php?f=2&t=412
的\#基础用法那段来理解
给你写了个Demo:
照着这格式自行添加|吧.
至于规则我觉得很晕,每页就那几个,你想收集全也不容易
如果有ji jiao混合[假设没声调]的话 我觉得就不好办了
口技 口角 基本 脚本 上下文也能弄死人
浅谈\#的使用及可能遇到的问题解决
http://forum.proxcn.info/viewtopic.php?f=2&t=412
的\#基础用法那段来理解
给你写了个Demo:
Code: Select all
[Patterns]
Name = "19wxw.com Ch-py [11.10.13] [Core] [Demo]*"
Active = TRUE
URL = "www.19wxw.com"
Bounds = "$NEST(<div class="txt",</div>)"
Limit = 12000
Match = "(\#)((\#)((jiāo$SET(#=交)|fǔ$SET(#=府))))+\#"
Replace = "\@"
至于规则我觉得很晕,每页就那几个,你想收集全也不容易
如果有ji jiao混合[假设没声调]的话 我觉得就不好办了
口技 口角 基本 脚本 上下文也能弄死人
- Attachments
-
- 2011-10-13_030317.png (37.17 KiB) Viewed 12368 times
Re: 求助:小说网站关键字替换
非常感谢cre!
这个\#的用法说实话是看不太懂,不过能用就够了。
我搜集整理的替换规则如下:【为了看起来方便,分行了。如果要用,要整理成一行。另外,2个拼音一起的话,好像只替换第一个;还有就是yin我替换成淫,还有一个吟用的比较少】
补充一个:一定要加边界条件。否则会cpu 100%。
这个\#的用法说实话是看不太懂,不过能用就够了。
我搜集整理的替换规则如下:【为了看起来方便,分行了。如果要用,要整理成一行。另外,2个拼音一起的话,好像只替换第一个;还有就是yin我替换成淫,还有一个吟用的比较少】
Code: Select all
(\#)((\#)(
(yù$SET(#=玉)|jiāo$SET(#=交)|fǔ$SET(#=府)|dàng$SET(#=荡)jīng$SET(#=精)|xìng$SET(#=性)|
chōu$SET(#=抽)|
mén$SET(#=门)|
chūn$SET(#=春)|
sè$SET(#=色)|
hún$SET(#=混)|
nòng$SET(#=弄)|
bō$SET(#=波)|
xiǎo$SET(#=小)|
yín$SET(#=淫)|
jī$SET(#=激)|
mō$SET(#=摸)|
xiōng$SET(#=胸)|
tǐng$SET(#=挺)|
tuǐ$SET(#=腿)|
cào$SET(#=操)|
yīn$SET(#=阴)|
sī$SET(#=私)|
shì$SET(#=侍)|
huā$SET(#=花)|
nǎi$SET(#=奶)|
huò$SET(#=惑)|
cháo$SET(#=潮)|
mí$SET(#=迷)|
chā$SET(#=插)|
làng$SET(#=浪)|
luàn$SET(#=乱)|
chuáng$SET(#=床)|
nv$SET(#=女)
)))+\#
Re: 求助:小说网站关键字替换
加一个blocklist吧.....
另外规则里面针对单独的一个 多加一些限定 能更准确一些....
比如(^[a-z])sī(^[a-z])
另外规则里面针对单独的一个 多加一些限定 能更准确一些....
比如(^[a-z])sī(^[a-z])
Re: 求助:小说网站关键字替换
你给的页面第一行
Code: Select all
风云jīdàng
Code: Select all
jīdàng$SET(#=激荡)
收集的不错 等你收集全活了也给我份集成下 好东西
顺便找个牛人做个防河蟹发帖替换
Re: 求助:小说网站关键字替换
这几天整理的规则:
发现一个问题: http://www.19wxw.com/files/article/html ... 40082.html
“chún边有三缕胡须轻飘”和“xìng命”之间的文字没有了,不知道是不是堆栈满了还是规则有误?
Code: Select all
(\#)((\#)((bī$SET(#=逼)|bō$SET(#=波)|cào$SET(#=操)|cháo$SET(#=潮)|chā$SET(#=插)|chéng$SET(#=成)|chōu$SET(#=抽)|chuáng$SET(#=床)|chūn$SET(#=春)|chún$SET(#=唇)|dàng$SET(#=荡)|dòng$SET(#=洞)|fù$SET(#=妇)|fǔ$SET(#=府)|féi$SET(#=肥)|huā$SET(#=花)|hún$SET(#=混)|huò$SET(#=惑)|jīng$SET(#=精)|jī$SET(#=激)|jiāo$SET(#=交)|jiān$SET(#=奸)|kù$SET(#=裤)|làng$SET(#=浪)|luàn$SET(#=乱)|luǒ$SET(#=裸)|lù$SET(#=露)|máo$SET(#=毛)|méng$SET(#=蒙)|mén$SET(#=门)|mí$SET(#=迷)|mō$SET(#=摸)|nǎi$SET(#=奶)|nòng$SET(#=弄)|nv$SET(#=女)|ròu$SET(#=肉)|sāo$SET(#=骚)|sè$SET(#=色)|sī$SET(#=私)|shè$SET(#=射)|shì$SET(#=侍)|tǐng$SET(#=挺)|tuǐ$SET(#=腿)|tún$SET(#=臀)|wěn$SET(#=吻)|yào$SET(#=药)|yīn$SET(#=阴)|yín$SET(#=淫)|yù$SET(#=欲)|xiǎo$SET(#=小)|xìng$SET(#=性)|xiōng$SET(#=胸)|xùe$SET(#=穴))))+\#
“chún边有三缕胡须轻飘”和“xìng命”之间的文字没有了,不知道是不是堆栈满了还是规则有误?
Re: 求助:小说网站关键字替换
堆栈满不了规则没有误
chún hún 去掉一个 被包含了
这个晕的很,排查好费劲,这个问题出在这,而且还得是相互作用下....只有这俩显示不出来问题.
chún hún 去掉一个 被包含了
这个晕的很,排查好费劲,这个问题出在这,而且还得是相互作用下....只有这俩显示不出来问题.
Re: 求助:小说网站关键字替换
上面的规则似乎弄复杂了,可以直接建一个blocklist用$SET展开变量来替换。