V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
vtoexshan
V2EX  ›  问与答

学习谷歌的三篇经典论文需要什么基础

  •  
  •   vtoexshan · 2016-10-29 14:08:14 +08:00 · 3626 次点击
    这是一个创建于 2735 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近看谷歌的三篇经典论文( gfs,bigtable,mapreduce )发现有些很难看懂,想请问各位大神他这些需要怎样的基础知识呢? 特别是数学方面

    18 条回复    2016-11-02 19:33:30 +08:00
    vtoexshan
        1
    vtoexshan  
    OP
       2016-10-29 14:15:42 +08:00
    这三篇也有 N 年历史了,求稳大神,近几年谷歌有什么潮技术,经典技术总结 paper 吗?谢谢啊
    lll9p
        2
    lll9p  
       2016-10-29 14:19:38 +08:00 via Android
    直接搜 Google 发的论文就行了吧,挑引用高的看
    vtoexshan
        3
    vtoexshan  
    OP
       2016-10-29 14:21:47 +08:00
    还想到一个事儿,名声堪忧的国内那家同行企业,有什么著名技术 paper 流传吗?已知其创始人,确实发表过搜索技术专利
    Andiry
        4
    Andiry  
       2016-10-29 14:23:37 +08:00
    Pregel, Spanner, Borg
    Andiry
        5
    Andiry  
       2016-10-29 14:30:53 +08:00
    百度有个 SDF ,发在 ASPLOS 上。
    miaoever
        6
    miaoever  
       2016-10-29 16:08:15 +08:00
    @vtoexshan 阿里百度都有在诸如 VLDB 等顶会上发表过文章。
    cheneiweei
        7
    cheneiweei  
       2016-10-29 16:12:48 +08:00
    这已经是算简单的论文啊,科班高年级应该没什么问题的
    assassinpig
        8
    assassinpig  
       2016-10-29 16:24:33 +08:00 via Android
    可以提前多看两遍 作为基础
    pandachow
        9
    pandachow  
       2016-10-29 20:21:44 +08:00
    这三篇算是 system 方向的入门 paper 啊。。。你发现有些概念不懂的去查 wiki 就好了。。。
    binux
        10
    binux  
       2016-10-29 20:39:05 +08:00
    如果你没有相关基础,读这三篇论文有什么用呢?
    jsyangwenjie
        11
    jsyangwenjie  
       2016-10-29 21:33:23 +08:00
    不需要什么基础。。直接看。。
    csuzhangxc
        12
    csuzhangxc  
       2016-10-29 22:37:08 +08:00
    YouXia
        13
    YouXia  
       2016-10-29 22:50:46 +08:00
    @vtoexshan

    因为之前国内许多互联网公司对专利以及论文还不是太重视,现在比以前重视了,也特别推荐员工申请专利,发表顶级会议论文,当然知名度高的论文也是有的,比如阿里就有 Fuxi 相关的论文。
    vtoexshan
        14
    vtoexshan  
    OP
       2016-10-30 10:38:05 +08:00
    @Andiry
    @YouXia
    @csuzhangxc
    @miaoever
    @lll9p 各路神仙,还可以再谈谈数学基础吗?貌似现在大数据概率(还是统计)比高数用的多吧?


    @binux 大哥太狠了,直接不让进门和靠近啊
    bravecarrot
        15
    bravecarrot  
       2016-10-30 11:25:28 +08:00 via iPhone
    @vtoexshan 我最近刚把这三篇论文打出来,还没看。你就直接看,不懂去查不就行了吗。没听说谁一定要把先修知识全复习好才开始看论文的
    bravecarrot
        16
    bravecarrot  
       2016-10-30 11:27:56 +08:00 via iPhone
    谷歌还有个 word2vector 一个系列,有三四篇;
    上个月发的一篇谷歌神经机器翻译。
    别的我还没关注
    vtoexshan
        17
    vtoexshan  
    OP
       2016-10-31 09:10:24 +08:00
    @bravecarrot 感谢回复哈,倒不是先先准备数学再着手读三篇这个意思,不是把数学作为大数据先修课程,换个表述吧希望能说清楚,想了解下大数据都涉及到哪些方面的数学知识呢,
    vtoexshan
        18
    vtoexshan  
    OP
       2016-11-02 19:33:30 +08:00
    继续求教大神,哪里有做训练用的大型数据集?
    另外,很多地方案例提到,美帝疾控中心和谷歌合作,在搜索引擎后台,发现可以用检索关键词约 100 个,分析出疾病流行预报,这种模型怎么建立啊?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3869 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 10:26 · PVG 18:26 · LAX 03:26 · JFK 06:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.