首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
V2EX  ›  问与答

怎样获取 Google 搜索结果里的完整摘要?或类似缓存快照?

  •  
  •   AmItheRobot · 236 天前 · 425 次点击
    这是一个创建于 236 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我是文科生,所以表述上肯定不准确,大佬们明白意思就好哈^_^

    例如,Google 搜索这个关键词:

    https://www.google.com/search?q="和 adc 说是兄弟站其实很勉强"
    

    得到唯一的搜索结果

    但会发现,它的链接打不开了。那么假如我们就是想知道该网页的全文,该怎么办呢?

    • 尝试用 http://cachedview.com/ 打开该页面的 Google Cache 和 Archive.org ,发现这俩都没“收录”(或者说爬取,不知道专业术语)
    • 尝试在 archive.today 里找,发现也没有人预先抓过

    到这里我就没辙了。但是很显然,谷歌数据库里存储了该页面的完整摘要(因为能搜索到呀),而且可通过以下链接窥得一二:

    https://www.google.com/search?q="管理员 lurch 为人很有原则而且貌似很有钱"
    https://www.google.com/search?q="估计都捐不了.该站有专门申请邀请的板块"
    

    所以这种能用谷歌搜出来,但却打不开,几大快照服务也没收录的情况,有啥办法还能获得内容么?例如获取谷歌存的摘要?

    PS:这个帖子问的是方法(渔),不是例子(鱼),这篇帖子已经通过其它方法找到全文了…此处只是举例,谢谢

    5 回复  |  直到 2019-06-22 19:12:18 +08:00
        1
    Windelight   235 天前 via Android
    你想做什么?是爬谷歌还是说想要永久存储网页?我唯一建议你云出国。
    我认为你说的是每一条搜索结果下面的标题下面的小字吧?你直接爬出原始链接,然后看 head 里面的 description 就可以了,没有的话直接从正文提取就可以啦。谷歌没有那种说纯文字展示的接口
        2
    Windelight   235 天前 via Android
    @Windelight 如果可以的话请您也把您的方法也贴出来 thanks
        3
    AmItheRobot   235 天前
    继续求助
        4
    o0OoO0o   118 天前
    有结果了吗?
        5
    AmItheRobot   114 天前
    @o0OoO0o #4 没
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4262 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 20ms · UTC 09:08 · PVG 17:08 · LAX 02:08 · JFK 05:08
    ♥ Do have faith in what you're doing.