V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
kalman03
V2EX  ›  分享创造

花了三个晚上,送出了一份感动自己的礼物

  •  
  •   kalman03 · 2019-06-01 22:55:04 +08:00 · 5259 次点击
    这是一个创建于 1784 天前的主题,其中的信息可能已经有所发展或是发生改变。
    2019 年 5 月的一天,QQ 里面冒出了一个临时会话,问我,是否有可能帮助她导出一批公众号的所有历史文章,原因是她想基于这些公众号提取一些论文的依据:



    楼主觉得这个需求着实有意义,遂连续奋战了三个晚上,做了一个成品,于今天完美送出,嗯,我想她确实感动了:


    贴上产品:火星岁月,一个极简的微信公众号历史文章查阅网站.
    访问地址: http://bsbx.vip/

    如果你也有需要,抑或想获取一些历史公众号的文章信息,可以在网站留言。
    第 1 条附言  ·  2019-06-11 09:49:15 +08:00

    推出了rss服务,有需要的可以订阅

    http://bsbx.vip/mp/rss.xml

    27 条回复    2020-03-28 16:01:08 +08:00
    minamike
        1
    minamike  
       2019-06-01 23:31:03 +08:00 via iPhone
    这个人对你很重要吧,那么她是你的什么人呢.jpg
    Takamine
        2
    Takamine  
       2019-06-01 23:56:07 +08:00 via Android
    楼主好人阿。(。ò ∀ ó。)
    FakeLeung
        3
    FakeLeung  
       2019-06-02 00:17:53 +08:00
    🐂🍺
    kalman03
        4
    kalman03  
    OP
       2019-06-02 00:51:18 +08:00
    @minamike 陌生人,觉得有意义,刚好知道怎么爬这部分数据,举手之劳
    minmini
        5
    minmini  
       2019-06-02 00:57:27 +08:00 via Android
    比较好奇既然是陌生人她怎么找上你的?
    kalman03
        6
    kalman03  
    OP
       2019-06-02 01:17:52 +08:00
    @minmini 曾经在简书写了一个可以爬取公众号历史文章的文章
    ghos
        7
    ghos  
       2019-06-02 09:07:34 +08:00 via Android
    我比较好奇怎么爬的
    sindri
        8
    sindri  
       2019-06-02 10:11:34 +08:00
    挺好玩的,用 PYTHON 编的吧?
    weixingna
        9
    weixingna  
       2019-06-02 11:42:59 +08:00
    @sindri 看网站上的绿色小叶子感觉像是 java 的 springboot 框架
    z0ne
        10
    z0ne  
       2019-06-02 12:47:28 +08:00   ❤️ 1
    抓住机遇! 以后就可以和岳父一起 debug 了!
    sindri
        11
    sindri  
       2019-06-02 13:22:35 +08:00
    @weixingna oh,the favorite.ico. thanks~
    Telegram
        12
    Telegram  
       2019-06-02 15:29:38 +08:00
    好奇要是我这种抠脚大汉来找你帮忙,你会不会说很有意义呢??
    yuwangG
        13
    yuwangG  
       2019-06-02 18:33:49 +08:00
    能不能写个破译过程,谢谢
    i0error
        14
    i0error  
       2019-06-02 21:02:00 +08:00
    哇这个界面设计得很不错啊。
    爬取文章的思路应该是公众号后台的搜索?
    kalman03
        15
    kalman03  
    OP
       2019-06-02 22:14:16 +08:00
    @ghos
    @yuwangG
    @i0error
    爬取的思路参考差不多 1 年之前发的一篇文章 https://www.v2ex.com/t/479441

    @Telegram 哈,保持童年的纯真,小兄弟。


    @sindri
    @weixingna
    网站采用 springboot 框架搭建,爬取用什么都 ok,当然楼主用的是 java
    Jaho
        16
    Jaho  
       2019-06-03 09:29:10 +08:00
    微信读书爬公众号 你是怎么想到的 思路清奇
    kalman03
        17
    kalman03  
    OP
       2019-06-03 09:52:44 +08:00
    @Jaho 一年前一次偶尔的发现,发现可以用微信读书打开,出于对产品的好奇,(☄⊙ω⊙)☄
    yuwangG
        18
    yuwangG  
       2019-06-03 14:56:36 +08:00
    @kalman03 god job~ 提供了不错的思路, 感谢大佬
    xhp281
        19
    xhp281  
       2019-06-03 14:58:36 +08:00
    卤煮厉害,已关注。
    jhdss
        20
    jhdss  
       2019-06-07 18:29:39 +08:00
    这个真心厉害
    膜拜
    zyy314680012
        21
    zyy314680012  
       2019-06-10 08:03:01 +08:00 via Android
    厉害啊
    kalman03
        22
    kalman03  
    OP
       2019-06-10 10:19:23 +08:00
    @jhdss
    @zyy314680012
    @xhp281

    死灰复燃了,尴尬.......
    cccicl
        23
    cccicl  
       2019-06-10 19:24:53 +08:00
    厉害啊,页面简洁好用
    dame
        24
    dame  
       2019-06-11 16:15:20 +08:00
    make 一下
    tuiya
        25
    tuiya  
       2019-06-12 11:34:04 +08:00
    12 楼真恶心
    BetterSci
        26
    BetterSci  
       2020-03-28 12:12:26 +08:00
    网站怎么现在打不开了?
    kalman03
        27
    kalman03  
    OP
       2020-03-28 16:01:08 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   998 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 22:43 · PVG 06:43 · LAX 15:43 · JFK 18:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.