首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Bash

# [求助] 用 curl 抓取一个网站,网站有很多分页,但不论怎么指 page=[2-100],抓取的都只是 page=1 的内容...

  •  
  •   Ger2EX · 340 天前 · 1182 次点击
    这是一个创建于 340 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人用 curl 抓取http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12内容; 但返回的始终是http://www.gmkfreefonts.com/index.php?letter=a&page=1&res=12的内容;

    浏览器 http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12 可以直接跳转到 page3

    curl -s http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12
    

    小白整了一晚也没整明白,请高手指点 1-2,谢谢!

    5 回复  |  直到 2018-08-10 10:56:15 +08:00
        1
    zhu   340 天前
    & 在命令行是特殊字符。

    你需要修改为:
    curl -s "http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12"
        2
    beaconfire   340 天前
    引号了解一下?
        3
    iwishing   340 天前
    内容都在 index.php 里面了呀
    比方 aajaxsurrealfreak 字体,在第一页的第一个
    你在第三页的源文件里也能搜到
        4
    presoul   340 天前 via Android
    可以直接 f12 里面 copy as bash url
        5
    Ger2EX   340 天前
    谢谢各位! OK
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2523 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 17ms · UTC 12:45 · PVG 20:45 · LAX 05:45 · JFK 08:45
    ♥ Do have faith in what you're doing.