V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  huzhikuizainali  ›  全部回复第 7 页 / 共 11 页
回复总数  212
1  2  3  4  5  6  7  8  9  10 ... 11  
@babyformula 谢谢回复。很有启发。
“ 如果只是调用 matlab 或者 python 常用库其实在 ML 和 DL 领域可做的东西真的不太多. 举个例子, 研究领域要体现创新性 /突破性势必会要提出一些新的算法或者结构, 那么如何验证这种算法可行或者 benchmark 还是要落在程序的实现上, 这种往往都不是常用库里会出现的. ”———————这段文字所说的创新突破大概是什么段位的创新突破?新的算法或结构又是在什么层面的?例如,现有的“工具”有:k 临近算法,回归,卷积神经网络………。“ 创新性和突破性”是指为这个“工具库”发明添加一些没有的工具么?

“ 如果数据处理(甚至是前处理), 还有训练 /验证框架(甚至是训练代码), 然后还有模型的压缩和部署都由其他专人给处理好, 那剩下的岂不是缓缓键入‘python run.py’就好了. 现实情况下往往这些都是需要 ML/DL engineer 需要考虑的内容
最后模型的效率和具体语言无关, 和硬件 /架构 /数据结构 /计算机系统 /算法优化 等等这些计算机不同方向的关系很大”——————不知道有没有这方面“导论”水平的书推荐。不是单独的算法导论,数据结构导论(这有可能会偏向计算机科学领域了),而是数据科学领域的算法、数据结构,硬件,架构这些需要统筹考虑问题的“导论”
@oneTimeElastic 谢谢回复。你回复的内容对我很有启发。

“如果你做 learning theory 这类 数学要求还是很多的。相反现在深度学习这里很多 paper,如果你去看,其实并没有那么多数学要求。”——————意思是,如果不做数据科学理论的推动者,只是将现有数据科学的理论用于实践,并没有那么多数学要求,对么?(这里说的没有那么多数学要求是没有那么高的“纯数学”要求。但是微积分线代概率统计最优化随机分析……这些依然要会,否则现有的数据科学理论方面的书也看不懂,更加不会灵活应用,也不会调参数,对么???)


“如果你想做 ml engineer 这类,那么你要掌握的就不只是 python spark 这类,你可能还要根据业务学会别的”————这段话中如何定义 ml engineer 的工作内容?还需要根据业务学会什么?可否举个例子?
@babyformula 等于说数学专业转 ML 最大的短板还是在“代码”方面?不过这方面也不会太短吧?毕竟数学专业的日常也会用 Matlab 或者 python 的常用库吧。致于数据库什么的,只要会用 python 或 Matlab 从数据库取数据就可以了吧。毕竟计算机专业的最后工作也不是所有事情都亲力亲为,而是专精某个细分领域。模型运行效率更加不是 ML 专业的人考虑的事情了吧。关注效率的话,至少要用 c 或 c++重写模型吧。
不知道以上认知是否靠谱?如有偏颇还望指正。
@heavenToothpaste
谢谢你的回复。刚看了卷积神经网络的一个小视频。不知道理解的对不对:卷积层实际上就是一个“过滤器” ,即“当某个维度特征是其他维度特征的线性组合的时候,”卷积层就把这个维度“优化掉”。这样就大大减轻了后面的神经网络层处理这些“冗余”维度数据的“压力”。达到同样的识别准确率只需要比较少的神经网络层。或者是需要的训练集更少。
-------------------不知道这样的理解是否恰当?
2021-06-26 04:44:16 +08:00
回复了 huzhikuizainali 创建的主题 Python 再次测试一下我是不是被降权了。
@mcoo1997 请问你是翻到第几页才看到的我的帖子?
2021-06-18 12:38:58 +08:00
回复了 WayTooExplore 创建的主题 反馈 建议 减少降权机制对无关人的影响
@Livid 发链接有用么?
2021-06-18 12:21:25 +08:00
回复了 huzhikuizainali 创建的主题 Python anaconda 配置的几个困惑
@silkriver 我是在一个视频中看别人配置遇到这样的问题。
2021-06-17 14:11:49 +08:00
回复了 huzhikuizainali 创建的主题 Python anaconda 配置的几个困惑
@silkriver 谢谢回复。我的问题主要是关于 anaconda navigator 的。tensorflow 在这里只是一个例子。tensorflow 官方改了。这很好。但是“anaconda 在搜索结果中还显示一个不能用的包。”的问题是否还存在呢?
2021-06-16 18:54:29 +08:00
回复了 huzhikuizainali 创建的主题 Python anaconda 配置的几个困惑
有大佬知道吗?
2021-06-08 00:19:27 +08:00
回复了 huzhikuizainali 创建的主题 机器学习 统计学上是否有典型的方法定义什么是领先指标
@kilasuelika 谢谢回复。
我在维基百科上看到“格兰杰本人在其 2003 年获奖演说中强调了其引用的局限性,以及“很多荒谬论文的出现”( Of course, many ridiculous papers appeared )。格兰杰因果关系检验的结论只是一种统计估计,不是真正意义上的因果关系,不能作为肯定或否定因果关系的根据。同时,格兰杰因果关系检验也有一些不足之处,如并未考虑干扰因素的影响,也未考虑时间序列间非线性的相互关系。一些基于格兰杰因果关系检验的方法一定程度上解决了这些问题”

是否可以理解为。一个指标是另一个数据的领先指标。但这种领先可能是相关性产生的,但不是因果关系造成的?
@kaiwen0110 但是操作系统还是国行 IOS 。所以有点拿不准。
2021-05-21 00:12:11 +08:00
回复了 huzhikuizainali 创建的主题 机器学习 机器学习的成果是否能生成一个打分器
@Donahue 不知道决策树对输入数据维度有什么限制么?比如不止上面的九维数据。100 维呢?每一维度又有 10000 个数据呢?决策树可以“消化么”
2021-05-21 00:09:39 +08:00
回复了 huzhikuizainali 创建的主题 机器学习 机器学习的成果是否能生成一个打分器
@jmc891205 谢谢指教。纠正了我一个思维误区。
2021-05-21 00:08:46 +08:00
回复了 huzhikuizainali 创建的主题 机器学习 机器学习的成果是否能生成一个打分器
@GeruzoniAnsasu 谢谢回复。比如什么方法?
1  2  3  4  5  6  7  8  9  10 ... 11  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2311 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 03:51 · PVG 11:51 · LAX 20:51 · JFK 23:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.