V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
jakeyfly
V2EX  ›  问与答

我想问一个悲伤的问题,恳请会大数分析,机器学习的大佬进来一下吧,特别是自学的大佬们

  •  
  •   jakeyfly · 2018-08-15 13:20:52 +08:00 · 1449 次点击
    这是一个创建于 2053 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人会 PYTHON 基,会用 FLASK,DJANGO 做网页(不精通)。会写比较复杂的爬虫

    因为爬了许多某方面的数据,就想做分析与机器学习用数据来训练程序。

    以上这些都是自学的,花了半年时。

    现在悲伤的事情来了,数据分析与机器学习,需要概率论,统计学等基础,最要命的是要会高等数学

    作为一个初中数学水平都达不到的吊丝,我是不是可以放弃了!!!!!

    如果我硬要坚持,我该如何补上我缺失的这些基础!!!!

    16 条回复    2018-08-16 20:19:20 +08:00
    starcraft
        1
    starcraft  
       2018-08-15 13:34:36 +08:00 via iPhone
    你学了是为了兴趣,那就从数分 线代慢慢开始啊。你要为了向往招工信息的年薪五六十万,那就洗洗睡吧,梦里什么都有。挤破了头,还有一堆赶热度渣硕在你前面排着。
    jiangnanyanyu
        2
    jiangnanyanyu  
       2018-08-15 13:34:45 +08:00 via Android
    读个本硕出来吧 2333
    noNOno
        3
    noNOno  
       2018-08-15 13:35:34 +08:00
    推荐<<机器学习导论>>
    一遍一遍地看,遇到没见过的知识就去查资料.
    人一能之己百之,人十能之己千之,虽愚必明...
    ballshapesdsd
        4
    ballshapesdsd  
       2018-08-15 13:40:10 +08:00
    想搞算法研发基本不可能,如果你真能投入那么多精力学到能搞算法研发的程度,干别的事挣的钱更多
    imn1
        5
    imn1  
       2018-08-15 15:14:12 +08:00   ❤️ 1
    这个就是创算法和用算法的区别,实际上就是辅助分析还是分析
    搞算法实际上只是辅助分析,因为算法是通用型的(泛分析),但行业分析却是针对特有数据的
    说个俗一点的例子,数学家对老板说:这个结果表明和 A 数据线性相关;但分析员对老板说:这表明 A 产品会定期消耗,所以会持续购买
    现在的行业招聘有点误区,好像都想找数学家,但能分析出实际因果的才是最好的分析员,因为这个分析员只是分析自家产品,不是做个算法给同行共用啊。有能力做算法的人,其实留不住的,他搞定了这个行业的数据分析,自然就想尝试自己的算法能否用到其他行业,一定走的

    搞分析不一定要创算法,会用也是足够的
    当然,能创是最好的,毕竟不是现成的算法都符合你的数据条件
    上世纪早期的市场统计软件,实际上也没多少用户可写的东西,基本上都是把软件提供的模块组合起来用

    但是,一些基本的概念是需要知道的
    例如,交并差(集合)、行列式计算、数据变形(行列式转换)、量化、移动统计……
    实际上这上面说的很多并不需要高数微积分这些也能算,只是用高数算方便快捷,有些直接可用定理推导
    最最基础的一种分析方法叫做交叉分析,实际上就是交并差,基本会数据库 select 的人都会做,只是很多搞数据库的人没入职过市场调查公司,脑子里不知道该 select 谁跟谁交叉而已

    顺带提一下,移动统计还是比较重要的,现在很多数据有 timeline,前一个记录和后一个有相关性,我移动统计用得越来越频繁

    你不需要看懂现成的算法是怎样实现的,但要清楚这个算法做什么,用在什么条件和场合,数据格式如何

    我高数、线代成绩都不怎么样,大学硬着头皮在 DOS 上自己写马氏距离,做聚类分析
    但现在,现成的马氏距离一些工具都内置了,如 scipy,会用就行

    话分两头说,虽然前面吐槽了一些招聘,但现实就是这样,人家要这样招聘,谁能改变他们的想法,这就是市场需求
    只能满足需求才能成交,怎样做到还是自己想,有本事就自己接单,但前期没点业绩也是没人理你的
    ackfin01
        6
    ackfin01  
       2018-08-15 15:19:25 +08:00
    不可能了。
    对于本科高数线代 85+,概率论 95+,学过矩阵论,最优化方法现在的我来说,数学都忘了不少了,想补起来也没觉的那么容易。
    且不说数学,数据结构和算法你弄懂了么。
    fl2d
        7
    fl2d  
       2018-08-15 15:25:26 +08:00
    其实很多问题,遇到了去查书就可以,比如你不用为了知道 l1、l2 是啥意思,就去刷一遍泛函。

    不过真想好好学的话,高数+线代+概率论与统计,一年半载功夫,也能刷一遍了。
    viator42
        8
    viator42  
       2018-08-15 15:36:05 +08:00   ❤️ 1
    即使学会了能捣鼓一些东西,不是科班出身的野生科学家会有公司要么
    怕就怕机会为〇,怎么努力都没用
    oyosc
        9
    oyosc  
       2018-08-15 15:41:22 +08:00
    为了兴趣爱好就加油,为了挣钱就放弃...
    whereabouts
        10
    whereabouts  
       2018-08-15 16:35:04 +08:00
    自身情况和楼主有好多类似,运维和编程这块都是自学的,当初碰到大数据分析这块要用到高等数学等知识,感觉真要学习的话得有小几年的规划,迫于资金压力的话学习条件有限 学习来可能更困难一些。不过因为大数据这块跟自己的未来职业规划搭边不多+兴趣不大,所以就放弃了,小几年的学习时间学点别的也行。
    3d3ec7a
        11
    3d3ec7a  
       2018-08-15 16:38:52 +08:00
    turicreate 了解一下
    jakeyfly
        12
    jakeyfly  
    OP
       2018-08-15 20:46:37 +08:00
    @imn1 我不是要搞算法呀,我只是用别的库来做自己分析啊!大佬们 我没说我要写算法呀!!我只是要分析数据啊
    jakeyfly
        13
    jakeyfly  
    OP
       2018-08-16 16:00:31 +08:00
    @fl2d 大哥 说的好轻松啊
    jakeyfly
        14
    jakeyfly  
    OP
       2018-08-16 16:05:53 +08:00
    @imn1 谢谢大佬说了这么多,我想这里回复的人只有你是了解我问这人问题的本意的,我其实也就是想会用就行,没有想去创算法,也就是要知道这些模型算法是做什么用的。我了不是为了从事这个行业,只是个人兴趣,有了一个想法想要实现他。按您说的,我应该算是对要分析的数据是比较了解的,等于业内人士,那应该跟你说的相符,那如果要达到你说的那样会用就行,需要什么数学基础呢。
    imn1
        15
    imn1  
       2018-08-16 17:18:00 +08:00
    @jakeyfly
    什么基础难以一一列举
    大致上需要在传入数据到某个算法前,预处理用到的所有相关知识
    因为当你手上的原始数据不符合格式要求,你就必须通过正确的数学方法,「转换」为算法可用的数据格式
    这个转换过程是需要符合逻辑和准确的

    线代和概率论基本是跑不掉的,中间一些定理的推演详解看不明,可以死记硬背前后的形式(最好还是知道大概)
    线代学到线性方程组可以边做边学,概率随机事件可以结合《采样学》一起,学到分布就难了,有实例或者有帮助
    再说下去可以开讲坛了,先搞懂行列式、排列组合、集合、随机取样,到时候你自己就知道下一步要学什么了
    jakeyfly
        16
    jakeyfly  
    OP
       2018-08-16 20:19:20 +08:00
    @imn1 谢谢大佬指点
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5434 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 08:47 · PVG 16:47 · LAX 01:47 · JFK 04:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.