Richard14 最近的时间轴更新
Richard14

Richard14

V2EX 第 531423 号会员,加入于 2021-02-01 03:42:40 +08:00
今日活跃度排名 8493
根据 Richard14 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Richard14 最近回复了
@murmur 简明
@rpman 没有啥发现不发现的吧,现在就是在按顺序学习,但是没有老师学得不好。1L 忘说了,位置编码对情感分析类任务应该是效果更好的,但是我觉得序列任务 lstm 肯定还是有用处不能不了解,所以这贴里不讨论位置编码相关的。。
@conhost 我是查了一些 rnn 的 torch 范例,然后里面设置的都是 batch_first=True ,所以我的文件读取完自然逻辑上输入格式是[32,20,8],我觉得 rnn 理解还是比较抽象,不太理解过程,但是观察到经过 nn.LSTM 变换后它改变的是-1 维度,所以就互换 23 变成[32,8,20],但是这种情况下 8 这个维度的含义就令人疑惑,网上一些基础范例,比如输入一个简单的 y=x^2 的数据,输入是一维的,比如[32, 20]这种比较好理解,加一维不太懂
@conhost 大佬,再问一下,rnn 的输入维度应该怎么理解。我现在假设用 8 个向量表示一个词,rnn 序列循环长度为 20 ,batch size 是 32 ,准备好的输入数据的 shape 就是[32, 20, 8],假设三个维度分别用 123 表示

然后将结尾两个维度 2 和 3 互换,再输入 nn.LSTM(20, 64),会得到一个[32, 8, 64]的数据。这里应该如何理解 8 这个维度呢,循环输入的数据是 20 这个维度吗?网上图解一般是一个输入到一个输出,比较好理解,比如输入是 20 输出也是 20 ,但是 lstm 实际上又可以输入 20 输出 64 ,实在是搞不懂了。。
@conhost CV 有很多项目可以参考,网上教学一般也是从 CNN 开始教起,学完就知道大概设计一个 CNN 网络是个什么形状,叠几层 CNN ,池化,dropout ,全连接层之类的,RNN 有类似的项目可以参考吗?我现在一个人拿着一个 nn.LSTM 在风中凌乱,看网上的例子是一个 lstm 层后面接一层 dense 就输出了,我很质疑生产上大家是这么做的?感觉有点太简单了
@conhost 谢谢,项目地址慢慢学习,很有帮助。NLP 方面 BERT 出来以后 RNN 过气了,但是我看到一些资料说在很多场景中 RNN 还在用,尤其是涉及到计算资源限制方面的,就想都从头了解一下。

所以这里的 LSTM 应该类比类似 CNN 这种结构,是由框架库提供的基础组件,一般不去设计其内部的具体实现方式?

实际生产中使用模型是需要多个 RNN 层叠加实现效果吗,就像多个 CNN 叠加一样?类似方面有什么资料可以参考吗,具体结构,超参调整之类的,不像 CNN 上感觉有很多模型可以参考,RNN 完全一头雾水没有概念应该怎么做
@leeyuzhe 网上教学直接复制的,没注意句号还是错的,害人不浅啊
7 天前
回复了 Richard14 创建的主题 Python Python 日志输出异常的正确姿势?
@SenLief
@fkdtz
@hsfzxjy loguru 很好用,试了下 logger.exception 打印信息很全。一个问题是这个默认输出的是 error 级别的,有无方法调整成 warning 级别。有一些非关键错误想用 warning ,后面还会接一个日志分析,如果 error 就告警,warning 就忽略之类的。。。
@kamal
@cubecube 如何指定字体呢?我是要修改 idea 设置还是 powershell 设置?

@leeyuzhe 试了修改后无变化。主目录下的 idea64.exe.vmoptions 内容有很多行与网上提供的一致,你说的那个位置打开只有一句-Xmx1454m ,不是一个文件啊
关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2057 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 16:30 · PVG 00:30 · LAX 09:30 · JFK 12:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.