V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ruoxuwu
V2EX  ›  问与答

现在还有什么定时抓取微信公众号文章的办法么

  •  
  •   ruoxuwu · 2019-04-27 21:37:53 +08:00 · 2317 次点击
    这是一个创建于 1824 天前的主题,其中的信息可能已经有所发展或是发生改变。

    今天试了一下 huginn,已经不太行了,使用 phantomjs 都无法绕过搜狗的验证码,还有什么其他办法么 公众号未在传送门等其它平台收录

    5 条回复    2020-02-09 19:10:18 +08:00
    qq292382270
        1
    qq292382270  
       2019-04-27 22:12:46 +08:00
    不如考虑下自动化脚本或者 vx 协议的方式. 关注指定公众号后, 有新文章自动抓取
    roberts
        2
    roberts  
       2019-04-27 22:17:11 +08:00
    试试公众平台的抓一下接口文章,之前我用这个抓过,可以获取。或者 hock ?办法还是很多的
    airyland
        3
    airyland  
       2019-04-27 23:18:32 +08:00 via iPhone
    我们开发的某个付费服务。
    love
        4
    love  
       2019-04-28 07:47:21 +08:00 via Android
    @airyland 哪个
    golangggg
        5
    golangggg  
       2020-02-09 19:10:18 +08:00
    发帖已经这么久了 不知道我的回答还能不能帮到你了,
    楼上几种方案 基本现在也都可用
    公众号平台的缺点是 不好自动化和批量化, 脚本的话 批量化和自动化也还算好一些,缺点是可能不太稳定,脚本毕竟是考颜色识别和点击去实现的方案,
    另外就是中间人和脚本基本是相同的 都需要配合脚本 这里就不过多说了
    我这最近做了一套免费的 api 的方案,可以供大家参考
    https://github.com/Edaaaaa/wx-spider

    codes 里面有 php 和 py 的 demo 简单写一点逻辑就可以使用了

    如果对你有帮助的话 记得在 github 点一下 star 谢谢了~
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3443 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 11:29 · PVG 19:29 · LAX 04:29 · JFK 07:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.