V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
caibou
V2EX  ›  Python

有人做过模拟淘宝登录吗?

  •  
  •   caibou · 2018-09-12 09:31:48 +08:00 · 10763 次点击
    这是一个创建于 2046 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有人做过模拟淘宝登录吗?最近想模拟登录淘宝联盟, 抓取订单信息,但是一直卡在登录这块。

    我用 selenium + chromedriver 模拟登录操作, 但是每次都会显示验证码滑块, 模拟滑块滑过去的操作,就一直提示错误,要我刷新。一直卡在这个步骤。即便我用鼠标自己去操作滑块,也仍然会提示我出现错误,要我刷新。

    但是如果我用浏览器正常打开,是不会有滑块出现的。

    我觉得是 selenium + chromedriver 一开始进入网页就被识别成爬虫了。

    有没有大佬有解决方案

    第 1 条附言  ·  2018-10-19 14:09:30 +08:00
    解决了。 思路是手机请求二维码下来, 然后 xposed 去 hook 淘宝自动扫码
    34 条回复    2019-02-15 13:40:44 +08:00
    murmur
        1
    murmur  
       2018-09-12 09:43:00 +08:00   ❤️ 2
    这个知乎上有讨论
    从爆栈网上其他人的答案来看 淘宝的却会检查自动化防范
    比如识别$cdc_asdjflasutopfhvcZLmcfl_、webdriver 这些关键字
    参考 https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver
    这个 cdc 我以为是个乱码 看上去就是这么检测的
    bmos
        2
    bmos  
       2018-09-12 09:46:53 +08:00
    上次看到一个帖子,网站也是用了 webdriver 关键字屏蔽,好像需要自己修改后再编译才能去除。
    golmic
        3
    golmic  
       2018-09-12 09:48:59 +08:00
    提供基于 http/s 请求的淘宝、天猫、支付宝登录方案,requests 实现,可用于生产环境
    kimqcn
        4
    kimqcn  
       2018-09-12 09:51:48 +08:00
    笨,登陆的时候用 Autoit 啊,进去了再用 selenium.
    xyfan
        5
    xyfan  
       2018-09-12 09:52:36 +08:00
    别说模拟登陆,我正常登陆都登陆不上去,过不去滑块验证,不知道怎么就把我识别为机器人了。
    caibou
        6
    caibou  
    OP
       2018-09-12 10:06:07 +08:00
    @xyfan 正常登录可以呀, 我正常打开 chrome 一切正常。
    imn1
        7
    imn1  
       2018-09-12 10:08:44 +08:00
    @xyfan +1
    me2,虚拟机 ie 进不去,但 host(linux) chromium 则可以
    qwertty01
        8
    qwertty01  
       2018-09-12 10:23:37 +08:00
    @kimqcn 既然登录可以检测,你使用 selenium 一样可以检测,治标不治本。
    xyfan
        9
    xyfan  
       2018-09-12 11:02:54 +08:00 via Android
    @caibou 肯定大部分人都可以正常登录,但是我手动都登录不上去,淘宝的验证方法肯定是有些问题。
    dcatfly
        10
    dcatfly  
       2018-09-12 12:47:51 +08:00
    改一下浏览器头?不太确定这个原理。另外推荐 Puppeteer。
    beforeuwait
        11
    beforeuwait  
       2018-09-12 13:40:41 +08:00
    4 楼靠谱
    slenium 一进去就被识别为爬虫了,过不了的。
    shapl
        12
    shapl  
       2018-09-12 14:16:17 +08:00
    直接调订单接口就是了。。。百度搜一下 taobao.tbk.sc.order.get
    caibou
        13
    caibou  
    OP
       2018-09-12 14:35:50 +08:00
    @shapl 这个要拥有高级权限才可以调用, 行不通的
    nilrust
        14
    nilrust  
       2018-09-12 14:40:31 +08:00
    反正最简单的浏览器油猴脚本完全可以解决需求。
    shapl
        15
    shapl  
       2018-09-12 14:42:21 +08:00
    @caibou #13 搜一下再说。
    caibou
        16
    caibou  
    OP
       2018-09-12 15:10:17 +08:00
    @shapl 兄弟有什么直说呀, 官方这个 api 是要有高级权限才提供的
    sujin190
        17
    sujin190  
       2018-09-12 15:20:40 +08:00
    而且以前似乎登录一次,你只要一直刷新,接近于使用,几乎不会掉出去,但是现在似乎有事没事踢出去,过几分钟就得重新登录一次,烦人的很
    realkenshinji
        18
    realkenshinji  
       2018-09-12 15:30:54 +08:00
    除了这个,我记得以前还要你从下面的图片里选出你曾经购买过的物品....
    jccg90
        19
    jccg90  
       2018-09-12 15:31:11 +08:00
    之前做过,登录部分要手动过验证,自动化总是出问题。。。然后加个微信告警通知,需要登录的时候提醒我连上去登录一下。。。
    caibou
        20
    caibou  
    OP
       2018-09-12 16:12:40 +08:00
    @sujin190
    @realkenshinji
    @jccg90
    我目前在淘宝联盟的订单抓取, 但是 50 分钟登录状态就过期了。 不知道有没有什么好方法。
    手动扫码登录肯定是不行的, 不可能人工 24 小时都在扫
    sujin190
        21
    sujin190  
       2018-09-12 16:48:06 +08:00
    @caibou #20 不知道用按键精灵之类的模拟鼠标点点点,能不能保持住登录状态
    Luxurious
        22
    Luxurious  
       2018-09-12 17:00:55 +08:00
    现在登录必须得选择已经购买的商品才行吧
    JasperYanky
        23
    JasperYanky  
       2018-09-12 17:05:17 +08:00
    1.挂阿里旺旺获取 ie 里面的插件拿 cookie
    2.调用订单接口,目前工具商已经有部分不完美的接口放出
    3.把我加入特别关注
    SpiderXiantang
        24
    SpiderXiantang  
       2018-09-12 18:15:01 +08:00
    我登上去过 selenium 用的微博账号
    SpiderXiantang
        25
    SpiderXiantang  
       2018-09-12 18:15:43 +08:00
    会跳滑块 但是能登陆 是个淘宝的小问题吧
    caibou
        26
    caibou  
    OP
       2018-09-12 21:34:32 +08:00
    @sujin190 不行, 我试过了,50 分钟之后必定要重新登录
    caibou
        27
    caibou  
    OP
       2018-09-13 10:09:18 +08:00
    @JasperYanky 你指的是 window 版的阿里旺旺吗
    JasperYanky
        28
    JasperYanky  
       2018-09-13 10:39:36 +08:00
    @caibou 是的,阿里旺旺会往 ie 里面插快捷登录
    fantasyni
        29
    fantasyni  
       2018-10-27 17:23:37 +08:00
    xposed 去 hook 淘宝自动扫码 怎么弄的?
    yu100
        30
    yu100  
       2019-01-13 13:25:47 +08:00
    @shapl 请问这个有什么特别的地方吗?百度了一圈,又在 top.api 的基础包里查看了,没发现这个权限啊。还请兄弟不吝赐教啊
    yu100
        31
    yu100  
       2019-01-13 13:44:20 +08:00
    @yu100
    @shapl 已明白,谢谢
    wjx1993
        32
    wjx1993  
       2019-02-15 10:21:01 +08:00
    @yu100 还是不太明白,你是怎么解决的?求指导一下
    caibou
        33
    caibou  
    OP
       2019-02-15 11:18:52 +08:00
    @wjx1993 用 28 楼说的方法吧。 我之前用 xposed 插件去自动扫码比较麻烦。
    wjx1993
        34
    wjx1993  
       2019-02-15 13:40:44 +08:00
    "挂阿里旺旺获取 ie 里面的插件拿 cookie"这句是什么意思?在 IE 上登录阿里旺旺,什么插件?@caibou
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1155 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 76ms · UTC 18:19 · PVG 02:19 · LAX 11:19 · JFK 14:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.