V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
matsuz
V2EX  ›  Python

重金求爬虫大佬帮爬 5w 条数据

  •  
  •   matsuz · 2019-03-25 18:49:20 +08:00 · 3179 次点击
    这是一个创建于 1830 天前的主题,其中的信息可能已经有所发展或是发生改变。

    要求两天内提供数据,酬金 1k+

    爬取阿里健康大药房所有商品数据: https://www.liangxinyao.com/

    wx: c3VubnlfYmV0cmF5LWxpZGFuCg==

    非诚勿扰

    第 1 条附言  ·  2019-03-25 19:21:26 +08:00
    感谢大家的关注,已经拿到数据了,v 站大佬就是牛逼,效率
    21 条回复    2019-04-02 14:41:07 +08:00
    yunye
        1
    yunye  
       2019-03-25 18:52:22 +08:00 via Android
    阿里的一千😁
    murmur
        2
    murmur  
       2019-03-25 18:53:28 +08:00
    1k 把阿里的网站扒下来?
    matsuz
        3
    matsuz  
    OP
       2019-03-25 18:54:27 +08:00
    @yunye @murmur 有点没写清楚啊,阿里大药房数据总量大概只有 5w 条,这个数据量应该不是很大
    crackhopper
        4
    crackhopper  
       2019-03-25 18:55:37 +08:00
    重金...
    matsuz
        5
    matsuz  
    OP
       2019-03-25 18:57:29 +08:00   ❤️ 1
    @crackhopper @murmur @yunye 报酬具体可以谈的哈,不一定就是 1k
    nicevar
        6
    nicevar  
       2019-03-25 19:01:05 +08:00
    如果是往数据库里面写入“ 5w 条数据”这几个字挺划算的,开玩笑。
    出 1k 接你活的人搞不定,真的。
    also24
        7
    also24  
       2019-03-25 19:01:48 +08:00   ❤️ 1
    https://maiyao.liangxinyao.com/search.htm
    这里好像只看到 165 页,165*60-2 = 9898 个?


    BTW:这个二级域名实在是……
    imningfeng
        8
    imningfeng  
       2019-03-25 19:10:28 +08:00
    这个主域名才更值得吐槽吧。。。
    gavindexu
        9
    gavindexu  
       2019-03-25 19:11:16 +08:00 via iPhone
    yangxin0
        10
    yangxin0  
       2019-03-25 19:13:17 +08:00
    前几天有人 3w 找我爬一个“类似”的网站我都觉得低了。。。楼主参考哈
    chushiyan
        11
    chushiyan  
       2019-03-25 19:19:42 +08:00
    确实有没有 5 万药品
    lanpong
        12
    lanpong  
       2019-03-25 19:21:53 +08:00
    阿里的反爬是国内比较厉害的了。1k 怕是有点少哦。
    matsuz
        13
    matsuz  
    OP
       2019-03-25 19:23:16 +08:00
    @nicevar @also24 @imningfeng @gavindexu @yangxin0 @chushiyan 非常感谢大家的关注,已经拿到数据了,非常感谢大家🙏
    zuoakang
        14
    zuoakang  
       2019-03-25 19:24:52 +08:00 via Android
    楼主是没时间自己爬,外包出来的吧?
    nicevar
        15
    nicevar  
       2019-03-25 21:33:16 +08:00
    后面楼主这句话我本来想说出来的,哈哈
    wersonliu9527
        16
    wersonliu9527  
       2019-03-26 09:29:54 +08:00
    我去年爬过阿里健康,楼主是广州 efd 么 0.0
    foxyier
        17
    foxyier  
       2019-03-26 15:13:13 +08:00
    为啥我这边没法访问? 网站被爬的关掉了么?
    mindbx
        18
    mindbx  
       2019-03-26 20:42:46 +08:00
    同求数据,老板愿意共享吗
    matsuz
        19
    matsuz  
    OP
       2019-03-27 09:52:47 +08:00
    @foxyier #17 你的网络有问题吧

    @mindbx #18 哈哈,可以便宜点卖给你
    storefeng
        20
    storefeng  
       2019-03-28 07:42:01 +08:00
    这个网站有大佬们的微信群吗?
    c4f36e5766583218
        21
    c4f36e5766583218  
       2019-04-02 14:41:07 +08:00
    要透露下最终结果吗?比如花了多少钱,得到多少条数据
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5332 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 08:10 · PVG 16:10 · LAX 01:10 · JFK 04:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.