V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
LinkedIn
ligiggy
V2EX  ›  程序员

学习机器学习一定要会推公式吗

  •  
  •   ligiggy · 48 天前 · 3081 次点击
    这是一个创建于 48 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不推公式可以简单上手吗,比如可以把库拿过来就用?

    然后,有无这类的上手书推荐。

    第 1 条附言  ·  47 天前
    感谢 @albert0yyyy 推荐的书,看起来我是适用人群。

    https://tangshusen.me/Dive-into-DL-PyTorch
    35 条回复    2022-08-12 01:08:36 +08:00
    LavaC
        1
    LavaC  
       48 天前
    可以试试 coding train 的 ml5.js 入门视频
    Jooooooooo
        2
    Jooooooooo  
       48 天前
    这和 "编程一定要学网络技术, 操作系统之类的内容吗?" 是一样的问题.

    我看来答案是 要学.

    机器学习里一门相当重要的课是矩阵论, 先把这个学好吧.
    hlpureboy
        3
    hlpureboy  
       48 天前
    如果只是玩玩的话,大概知道怎么回事就行惹,如果想明白具体的损失函数是怎么推出来的,那就得具体学学数学。
    ligiggy
        4
    ligiggy  
    OP
       48 天前
    @hlpureboy 所以要怎么玩,我就只想玩玩看。
    hlpureboy
        5
    hlpureboy  
       48 天前
    @ligiggy 你要具体做什么呀,定义好问题,找到 match 的领域,看看综述啥的,然后找一篇相关顶会论文跟着复现一下,在结合自己的具体问题调整就行惹。如果像是目标检测、图像分类这种问题很多人都讲解过了,跟着看视频就 ok 了
    jarence
        6
    jarence  
       48 天前
    不需要公式推导的情况:要处理的问题有了非常成熟的解决方案以及大量有效的数据。现有很多 autoML 的框架,比如 AutoGluon ,只要数据够多且有效,那么基本没啥问题。
    需要公式推导的情况:没有成熟的解决方案,或者需要做一些定制,又或者遇到了一些奇奇怪怪的问题。
    czfy
        7
    czfy  
       48 天前
    推公式是什么意思?
    ligiggy
        8
    ligiggy  
    OP
       48 天前
    @hlpureboy
    @jarence 好的谢谢。
    ligiggy
        9
    ligiggy  
    OP
       48 天前
    @czfy 应该是有一个复杂的机器学习公式,推公式就是从原理开始讲,建造一个公式,然后一步一步推导到结果。
    albert0yyyy
        10
    albert0yyyy  
       48 天前
    不用吧,pytorch 框架,
    建个模型类,加载数据,前向传播函数调用,反向传播函数调用,看看准确度和损失函数输出

    当然会推肯定是锦上添花的
    ligiggy
        11
    ligiggy  
    OP
       48 天前
    @albert0yyyy 有书籍或者教程推荐吗?想玩玩
    albert0yyyy
        12
    albert0yyyy  
       48 天前
    @albert0yyyy 要推的公式涉及到的也不是很多应该,矩阵运算,导数偏导数求导。好像就没了
    kenvix
        13
    kenvix  
       48 天前
    初学推啥公式啊,又不是专门研究机器学习本身的。你用 java 还要把 jdk 代码全翻一遍不成?
    albert0yyyy
        14
    albert0yyyy  
       48 天前   ❤️ 1
    @ligiggy
    视频和书:动手学深度学习 pytorch (李沐)

    想推公式:深度学习入门( 斋藤康毅)
    pluvet
        15
    pluvet  
       48 天前
    只是用用的话不必。但是这样肯定找不到工作。
    jmc891205
        16
    jmc891205  
       48 天前
    Deep Learning for Coders with Fastai and PyTorch
    jmc891205
        17
    jmc891205  
       48 天前
    nightwitch
        18
    nightwitch  
       48 天前 via Android
    直接拿来用就叫用机器学习,不叫学习机器学习。。
    DefoliationM
        19
    DefoliationM  
       48 天前
    只是用的话无所谓, 要自己写的话主要数学
    ligiggy
        20
    ligiggy  
    OP
       47 天前
    @albert0yyyy 找到资料了,感谢!
    MrZhaoyx
        21
    MrZhaoyx  
       47 天前
    推荐李航老师的《统计学习方法》
    xiang578
        22
    xiang578  
       47 天前
    b 站上也有一个系列视频,手把手教你推公式:白板机器学习。
    ligiggy
        23
    ligiggy  
    OP
       47 天前
    @xiang578 手把手也不喜欢推公式,过了这个年纪了。
    tfdetang
        24
    tfdetang  
       47 天前
    机器学习从业者来回答这个问题: 一般只有要准备面试的时候才会去推公式
    当然我比较水不能代表所有从业者。 其实大部分时候看论文什么的大概能看出是怎么回事,也能看懂就行了,关键是思路,很少真的去推公式
    dabaisuv
        25
    dabaisuv  
       47 天前
    谷歌的机器学习:
    aHR0cHM6Ly9kZXZlbG9wZXJzLmdvb2dsZS5jbi9tYWNoaW5lLWxlYXJuaW5nL2NyYXNoLWNvdXJzZS9tbC1pbnRybw==
    ipwx
        26
    ipwx  
       47 天前   ❤️ 1
    分情况。

    * 如果是用树算法处理工业数据,一般不需要推公式,调参就行。
    * 如果用神经网络处理图片数据,一部分工作者不需要推公式,用 PyTorch 搞就行。
    * 如果用神经网络处理自然语言,推公式的比重会增大。
    * 如果处理的是无监督学习,或者顶会不怎么覆盖的新领域上做深度学习,那就得会大量原理性的东西,做各种 regularization ( loss / 结构),不会公式基本寸步难行。
    ligiggy
        27
    ligiggy  
    OP
       47 天前
    @ipwx 为啥每次问问题,基本上大佬都能知道……太强了。
    ligiggy
        28
    ligiggy  
    OP
       47 天前
    @ipwx 暂时我还没有应用场景,仅限于去了解一下玩玩,还没想当成自己的 工作技能。
    ipwx
        29
    ipwx  
       47 天前
    @ligiggy 其实现在 DL 比较成熟的也就 CV/NLP 。

    大量工业数据没那么规整的,各种不同量纲、不同单位、不同性质的 heterogeneous data ,一般用树算法更舒服。经典的比如 RandomForest ,新锐的比如 GBDT 。除了这些树算法,还有就是 Bagging / Boosting 算法的思想得了解一下。
    ipwx
        30
    ipwx  
       47 天前
    @ligiggy 我上面举的这四个例子都不怎么需要推公式,工业数据上又比较万金油,投入产出比 DL 高。当然它们基本没法处理图片 /NLP ,CV/NLP 还是神经网络得天下。
    ligiggy
        31
    ligiggy  
    OP
       47 天前
    @ipwx OK ,好的,有没有书推荐,我看了下楼上大佬推荐的 pytorch 教程,感觉挺不错的。
    ipwx
        32
    ipwx  
       47 天前
    @ligiggy ummm 很遗憾我已经脱离教材很久了。。。(今年 phd 毕业了
    xz410236056
        33
    xz410236056  
       47 天前
    “比如可以把库拿过来就用”
    当然可以,但是你不会相关的数据你怎么设计自己的神经网络呢?你只能用别人封装好的网络啊。

    https://mofanpy.com/learning-steps/
    推荐个学习网站。
    rpman
        34
    rpman  
       47 天前 via iPhone
    要搭神经网络总得会推公式,不然搭出来一坨
    pkupyx
        35
    pkupyx  
       47 天前
    一定要。未必背下来,但是至少知道分几块步骤,并且能看懂。
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3473 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 05:22 · PVG 13:22 · LAX 22:22 · JFK 01:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.