V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
simoncos
V2EX  ›  分享创造

知乎社交网络分析 Python

  •  
  •   simoncos ·
    simoncos · 2016-03-19 10:52:55 +08:00 · 5254 次点击
    这是一个创建于 2960 天前的主题,其中的信息可能已经有所发展或是发生改变。

    刚写好的博文:

    代码烂,请轻吐指点。有想要一起做更多分析的小伙伴,约约~

    23 条回复    2016-03-20 08:24:29 +08:00
    vitovan
        1
    vitovan  
       2016-03-19 11:14:07 +08:00
    晦涩。
    或许是我太愚蠢。
    GPU
        2
    GPU  
       2016-03-19 11:23:22 +08:00
    太过专业的文章 , 导致看不懂。
    simoncos
        3
    simoncos  
    OP
       2016-03-19 11:24:14 +08:00
    @vitovan 感觉这种文章不大好写 orz...上篇如果觉得没意思可以看看下,感觉稍微接地气一点~
    simoncos
        4
    simoncos  
    OP
       2016-03-19 11:26:15 +08:00
    @GPU 可以只看下篇哈哈~我个人觉得要更有趣一点,结论也好懂一些
    boter
        5
    boter  
       2016-03-19 11:27:10 +08:00
    这个很有价值呀
    wizardforcel
        6
    wizardforcel  
       2016-03-19 12:08:58 +08:00
    知乎是典型的马太效应,由于答案权重参照该领域的历史回答。
    simoncos
        7
    simoncos  
    OP
       2016-03-19 12:21:05 +08:00
    @wizardforcel 更一般来说,只要新连接对连接数高的结点有偏好,就会产生幂律,答案的赞同也是,用户的关注也是。
    onelove
        8
    onelove  
       2016-03-19 12:47:29 +08:00 via iPhone
    有兴趣,在学 python ,也想做类似的分析。
    wizardforcel
        9
    wizardforcel  
       2016-03-19 12:51:45 +08:00 via Android
    @simoncos 所以光有干货很容易被埋没,还需要特别的技巧。
    simoncos
        10
    simoncos  
    OP
       2016-03-19 12:53:10 +08:00
    @wizardforcel 终于知道事事凭关系的社会是怎么来的了 233
    simoncos
        11
    simoncos  
    OP
       2016-03-19 12:54:31 +08:00
    @onelove 了解了解爬虫,再学点基础的分析知识,然后看看 networkx 之类的网络分析库
    mfinal
        12
    mfinal  
       2016-03-19 13:05:51 +08:00
    滋瓷,要是来点其他 John 的 centrality 就看起来更高端了🤓
    simoncos
        13
    simoncos  
    OP
       2016-03-19 13:43:18 +08:00 via Android
    @mfinal 一眼看到 john 还以为看错了
    wizardforcel
        14
    wizardforcel  
       2016-03-19 17:50:35 +08:00
    @simoncos 实际上点赞排位也没什么,如果一个赞是看人点的,其它用户可以点踩把它踩下去。目前知乎踩的权重还是相当高的。

    但是我说的是,一个用户在某个话题历史回答的累计赞数也对排位有影响。这个就是“马太效应”了。
    chengzhoukun
        15
    chengzhoukun  
       2016-03-19 17:50:57 +08:00
    不错啊 很多数学统计方面的知识
    simoncos
        16
    simoncos  
    OP
       2016-03-19 17:57:47 +08:00
    @wizardforcel 没错,看来知乎上的马太效应的偏好源头不止一个,有来自用户的,有来自答案排位的,而答案排位又受一些因素影响。
    fengxiang
        17
    fengxiang  
       2016-03-19 18:46:56 +08:00 via Android
    我就想知道首页的算法是啥?
    有段时间每天都能看见什么 48 ,根本没关注过这东西。
    onelove
        18
    onelove  
       2016-03-19 19:06:36 +08:00 via iPhone
    @simoncos 多谢。社交网络分析,很多年前上学的时候“研究”过。毕业工作后,感觉还是有兴趣,顺便学学技术。
    simoncos
        19
    simoncos  
    OP
       2016-03-19 20:15:52 +08:00
    @fengxiang 这个不太清楚,估计是推荐系统搞的鬼把
    akagi
        20
    akagi  
       2016-03-19 23:47:50 +08:00
    cool~ 打算用来验证些东西 真心感谢
    simoncos
        21
    simoncos  
    OP
       2016-03-20 00:37:45 +08:00
    @akagi 有啥有趣的结果分享一下啊~
    llhh
        22
    llhh  
       2016-03-20 01:53:02 +08:00
    挺有意思的,抓取量再大些。
    simoncos
        23
    simoncos  
    OP
       2016-03-20 08:24:29 +08:00 via iPad
    @llhh 因为关注网络需要连接完整,用了广度优先,按平均每个人关注了 100 人来算,下一层就是几百万用户。其实就算现在的几万用户,也只是选了很小的子集进行网络分析,如果是 2.6 万用户这个网络,内部包含的连接数就有百万级别。对分布式计算熟悉度不高,所以觉得自己还是太菜。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1764 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 16:47 · PVG 00:47 · LAX 09:47 · JFK 12:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.