仿照百度搜索的网页快照里关键词跳转

针对特定网站的规则分享、讨论

Moderator: phoenix

Post Reply
imsheng
Posts: 37
Joined: Jan 08 2008, 13:24

仿照百度搜索的网页快照里关键词跳转

Post by imsheng » Jan 21 2010, 23:32

用百度搜索,查看网页快照时,点击“您查询的关键词是”后面的那个关键词,会自动跳转到该网页快照里第一次出现该词的位置,现在想在google的缓存里也实现这个功能。

主要问题是,
1,google的q=这个参数里的关键词是经过编码的,怎样在prox里逆编码获得该词?
2,如何搜索在缓存页面里第一次出现该词的位置,并把该词加上一个<a>的锚点以跳转?

imsheng
Posts: 37
Joined: Jan 08 2008, 13:24

Re: 仿照百度搜索的网页快照里关键词跳转

Post by imsheng » Jan 22 2010, 00:13

Code: Select all

[Patterns]
Name = "google.click.1"
Active = TRUE
URL = "74.125.153.132"
Limit = 256
Match = "<span style="background:#ffff66;color:black;font-weight:bold">\1</span>"
Replace = "<a href="\u#word"><span style="background:#ffff66;color:black;font-weight:bold">\1</span></a>"

Name = "google.click.2"
Active = TRUE
URL = "74.125.153.132"
Limit = 512
Match = "<b style="color:black;background-color:#ffff66">\1</b>"
Replace = "<a name="word"><b style="color:black;background-color:#ffff66">\1</b></a>"
第一条规则是给关键词加上<a href="\u#word">链接,第二条规则是给页面里出现的关键词添加name属性,\u这个是prox提供的内部参数,表明是当前网页的地址。

比较理想的版本是可以添加一个参数x,最后name属性可以修改成<a href="\u#wordx" name="wordx+1">,x就是该关键词在当前页面里的排序。这样就可以实现 点击当前关键词之后,可以跳转到下个关键词出现的地方。

存在一点小问题就是google的缓存页面地址可能各个地区不一样,这里用了74.125.153.132这个IP。

Post Reply