V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  secondwtq  ›  全部回复第 5 页 / 共 120 页
回复总数  2398
1  2  3  4  5  6  7  8  9  10 ... 120  
2023-04-04 04:54:28 +08:00
回复了 Pichai 创建的主题 问与答 ChatGPT 是 OpenAI 的应用产品。
OpenAI 一般是指一个机构 /公司,不过他们这个结构本来就很奇怪,有点类似 Mozilla ,比较合适的限定应该是“以 XXX 同志,XXX 同志,XXX 同志等为领导核心的一群人”,毕竟别管是非营利组织还是 capped-profit 公司,核心都是人。
OpenAI 本身不是一个产品,你应该在 ChatGPT 上给这个答案点个踩。(把“人”当“产品”,我很怀疑 ChatGPT 是否使用了大量阿里的资料作为中文训练集)
有些人在指代 ChatGPT 等产品时喜欢带上 OpenAI (比如 GitHub 的"openai"这个 Topic 现在有 3.3k 的项目,和"chatgpt" Topic 差不多),大概是因为 OpenAI 独特的产品思路,他们的 AI 研究不是只发论文,打比赛或者发发公众号吹牛逼,而是做成了技术产品,而开源社区可以指数级地放大这些产品的影响力。ChatGPT 则意外地(这货到现在还在写着“Research Preview”)进一步降低了门槛,各路流量都能来蹭了。

除了产品之外 ChatGPT 也可以指模型。在 API 里,ChatGPT 的模型叫 gpt-3.5-turbo ,用 ChatGPT 称呼这个模型也没问题——因为 OpenAI 自己就是这么叫的:openai.com/blog/chatgpt ,从这个文章来看 ChatGPT 本来指的就是模型,OpenAI 本来想要卖的产品也是这个模型,而 chat.openai.com 这个界面更像是 ChatGPT 这个模型的 demo 。
ChatGPT Plus 性质又不太一样,首先它确实是一个产品,并且是 OpenAI 少有的直接面向大众的产品。而且看起来它并不是“一个”模型——我没有订阅 ChatGPT Plus ,但是看起来它目前是可以在 ChatGPT 和 GPT-4 两个模型间切换,而 GPT-4 模型的使用量是有限制的。

有人喜欢用“ChatGPT3”或者“ChatGPT4”这种称呼,实际上 ChatGPT 就是一个模型。名字就是 ChatGPT 或 gpt-3.5-turbo ,最多只有小的 snapshot 的区别,目前没有其他版本。
GPT 3.5 和 gpt-3.5-turbo 也不一样,按照 OpenAI 自己的说法( platform.openai.com/docs/models/gpt-3-5 platform.openai.com/docs/model-index-for-researchers ),很多 *-davinci-* 的模型都属于 GPT 3.5 的范畴。其中 text-davinci-002/003 是 InstructGPT 模型(而 InstructGPT 还有其他更小的模型 ...),而 code-davinci-002 连 InstructGPT 都没有。
2023-04-02 12:02:25 +08:00
回复了 520discuz 创建的主题 问与答 如果以后 AI 变水军了是不是非常恐怖?
还好吧,公共互联网空间本来大部分就是垃圾,98% 是垃圾和 99% 是垃圾没有本质区别

我觉得可以拿安全里的做法来类比,验证信息的来源主流有两种手段,一种是 CA ,一种是 Web of Trust 。搬到日常网上冲浪上面,CA 对应带平台本身的过滤和推荐,Web of Trust 对应个人的订阅列表。也就是说只从信任的平台和信任的帐号获取内容。个人的经历是有限的,这些渠道的信息量就算是在前 AI 时代也远远超出了个人能够消费的级别。
另一方面,既然 AI 能够用来制造垃圾信息,也能用来过滤垃圾信息,比如垃圾邮件过滤大概也算是最早,最普遍的 AI 应用之一了。以后没准论坛也能加一个垃圾回复过滤。
2023-04-02 11:47:24 +08:00
回复了 Comyn 创建的主题 程序员 读本周阮一峰网络日志有感:什么样的领导算是好领导
> True leadership is giving people the tools to make good decisions locally.

这话说得好

我感觉我打过交道的基层技术管理都很忙,倒不是管下面的人搞得很忙,而是我们习惯把其他组来的需求推到 leader 头上让 TA 去帮忙扯皮,也就是说大部分时间 leader 是个路由器+防火墙的角色 ...
2023-04-01 19:55:07 +08:00
回复了 serafin 创建的主题 OpenAI ChatGPT 把所有意大利 ip 封了
这下“欧洲里的中国”了
2023-03-30 21:22:38 +08:00
回复了 wang1987 创建的主题 程序员 目前 Linux 对 Intel 13 代处理器的支持程度如何
关于 6.0 内核对 RPL 的支持,详细内容见 Phoronix 新闻:www.phoronix.com/review/linux-60-features
可以看到相关的就两条,一个是控制发热的,另一个是监控发热的😂(不过他貌似忘了提一个 Thunderbolt 的 patch ) 6.1 就开始搞 MTL 了
往回倒的话,也是主要集中于外围:音频,PMU ,iGPU ,ME 之类。我不觉得一个典型台式 PC 没有这些会有很大问题。笔记本的话可能会明显一些(比如如果 iGPU 不能用就可能会很蛋疼)。

调度的问题我就没看到互联网上有人说清楚的,前情提要: https://v2ex.com/t/891752#r_12298329
主要是你要知道 Linux 是个散装系统( hell ,它甚至不是“一个”系统),是没法直接做到像 Windows 那样前台程序 P 核跑,后台程序 E 核跑的——虽然这个策略被吐槽很多,不过主要问题是 Windows 写死了改不了,这个在 Linux 倒不是问题,Linux 的问题是这个事情本来就不好做:Kernel 怎么知道哪个是前台哪个是后台?所以光折腾 Kernel 用处有限,这个是需要 userspace 配合的。类似 https://github.com/pop-os/system76-scheduler 之类的东西。

当然,站在操作系统和 userspace 无关的角度,ITD 本身还是可以被 kernel 利用的。上面回复最后引用的 Ricardo Neri 的 patch 是最关键的,因为它才"includes a full implementation for Intel hybrid processors using ITD"。但是我又 pull 了下 mainline 还是没进去,他自己这几个月倒是更新了两遍,这两天还在继续 review:
https://lore.kernel.org/lkml/[email protected]/
https://lore.kernel.org/lkml/[email protected]/
2023-03-30 19:19:14 +08:00
回复了 LianOuPaiGuT 创建的主题 问与答 突然想到一个极端的问题,是不是干坏事社会才能进步?
其实从统计上来看,“正常”的人“正常”的时候,是始终处在一个“business as usual”的状态,就是说今天是这么过的,明天还是这么过的,这顿饭这么吃,下顿饭还是这么吃。
所有的“变化”,无论“进步”与否,都来源于这个“正常”的状态被打破了,很形象的一个例子就是牛顿被苹果砸了一下,然后整出了万有引力定律。当然这个例子不一定是真实的,我想强调的是其背后的逻辑——当有事情发生变化时,相关的人会对其做出反应,这个反应本身又作为一个新的变化继续递归推进这个过程。
这个“变化”不一定非要分“好”“坏”,其导致的结果也不一定要分“好”“坏”,比如疫情蔓延可以提升人们的卫生习惯,而 ChatGPT 诞生后人们又围绕它创造出了一堆工具,而另一方面疫情影响了很多人的生活,而 ChatGPT 出来之后 OpenAI 就被墙了,马一龙看上去也不太高兴。问题是复杂的。

楼主的标题,如果去除价值判断就是“是不是‘变化’社会才会‘变化’”,本来就是个套套逻辑。
2023-03-30 04:10:11 +08:00
回复了 christin 创建的主题 Apple Apple music classical 已出
木有订阅 AM ,但是也可以白嫖元数据和歌单 :)
2023-03-30 02:27:50 +08:00
回复了 johnnyleaf 创建的主题 Python 大家好,想请教一个关于 CPU 与内存运行方式的问题
再次推荐 Memory Barriers: a Hardware View for Software Hackers
或者这个:fgiesen.wordpress.com/2014/07/07/cache-coherency Cache coherency primer | The ryg blog
简单来说,如果 CPU 严格按照缓存一致性协议工作,那对于单个指令对单个 cacheline 的操作,是可以保证原子性的。
但是实际实现中,为了性能,CPU 和缓存都不是教条主义,而可能是机会主义。OoO 核心在做 speculative execution 时,简单的算术指令可以直接由 ALU 执行,结果存放在 PRF 中,但是 store 是有副作用的,数据如果真的存进了 L1D ,那就不是 speculative execution 而是生米煮成熟饭了。所以又加了一层缓存 store buffer ,在 retire 之前,store 的结果只放在这个 buffer 里面,并且随时可以撤回,结果在 retire 之后刷进 L1D ,该 buffer 中的内容只对该 buffer 可见。

锁中包含了 memory barrier ,memory barrier 能绕过这些优化,确保数据的全局可见。
你要到 Resource Monitor 的 Memory tab 下面看(里面的数据是可以拷贝到 Excel 的)
这是个有趣的问题。实际上如果只是想把一个东西做得体积很大很简单,一个真实的故事:
一个算法有 2 个较为固定的参数,每个参数有 5 种可能性,那么如果我把这些参数静态编译进去就是 25 种可能性,如果再考虑到在 5 种不同硬件上的组合,那就是 125 种。如果假设每种的代码有 1KB 大,再有三四十个类似的算法,光这玩意就能整出 4MB 来。

类似地,如果工程中涉及到根据外部数据文件生成可执行代码,如 RPC 协议通信等,随着数据越来越多,附加的代码也会越来越多。

另外,编译器优化也可能导致代码体积的指数增长,常见地例如:
* 如果一个函数里面出现了对其他函数的多次独立调用,而这些函数又被 inline 。该函数实际生成的代码会包含子函数代码的多个拷贝。如果多个函数 inline 了同一个函数,该子函数代码会被在不同函数中多次拷贝。
* 如果一个函数被多次调用,并且调用时使用了常量参数,该函数的代码可能会被拷贝多份,并将常量参数代入其中单独优化。
* 循环的 unroll 会将循环体代码拷贝多份(虽然一般会有一定的长度限制)。
* 循环的向量化会将循环体代码拷贝多份(不同于 unroll ,这个是向量化逻辑所必须的,因此一般不会限制)。

我这有个对比的例子是 GTK3 。目前我这的 GTK3 包一共 49MB ,不过里面有一堆 GTK 元数据和 locale 之类的东西。只看最关键的 libgtk-3.so ,这玩意一共 7.8 MB ,其中 .text 大概有 3.7MB ,由 500 多个 .o 链接而成,这些 .o 的 .text 大小相加和 libgtk-3.so 的 .text 差不多。.text 最大的前 10% 的 .o ,.text 大小加起来大概 1.6MB 。这些 .o 对应的源码大小加起来大概 7.6MB 。总的源码大小是 17MB (只算 .c ,不算 header )。把 .o 的 .text 大小,和对应 .c 文件的大小画个图,可以很清楚地发现 .c 文件的大小大概是 .text 大小的 4-6 倍,平均值是 5 倍左右。

ffmpeg 包一共 37MB ,其中最大的是 libavcodec.so ,15MB 。.text 有 10MB 。大概有 1100 个 .o (我去除了一部分直接汇编出的 .o ,这些 .o 的 .text 加起来大概 1MB )。.text 最大的前 10% 的 .o ,.text 大小加起来大概 5.3MB 。这些 .o 对应的源码大小加起来大概 5.6MB ,总的源码大小是 19MB 。部分 .o 依然满足 4-6 倍的规律,但是整体的分布分散了许多。很多头部的 .o ,其 .c 文件大小是 .text 文件大小的两倍,一倍,甚至零点几倍。总的来说相比 GTK3 ,ffmpeg 编译生成的 .text 要更大。
进一步研究源码发现:
* libavcodec 源码中有很多以 _template.c 结尾的文件,加起来 1MB 左右,这些文件并不会直接编译出 .o (因此并不会计算在上面的 .c 大小上),而主要是被以不同的参数(如位深度)等多次 include 到不同的 .c 中,其实类似于模拟 C++ 的 non-type template parameter 。这些文件中的代码自然也会被拷贝多份。
* 部分源码大量使用了定义宏再多次以不同参数使用宏的技巧,这个还是类似于 non-type template parameter ,同样会导致同样的代码被拷贝多份。
* .o 中的代码存在大量 inline 的痕迹。也出现了一些 constprop 函数。源码中大量函数标记了 always_inline 。

#14 的链接中指出使用 --enable-small 选项(即指示编译器优先优化代码体积)可以数倍降低 libavcodec.so 的大小。暗示编译器优化是巨大体积的重要因素。不过我实测的效果并没有那么吼,.text 大概降低了 40% 左右。相对地,libgtk-3.so 降低了不到 20%。不过确实可以看到很多的 .o 文件 .text 大小成倍地缩小。GTK3 则鲜有缩小超过 30% 的 .o 。
2023-03-25 22:55:23 +08:00
回复了 Heo 创建的主题 Windows 如何评价新版 windowsQQ 采用 32 位
@kkocdko 随便暴论一下 ... 不过这个指针压缩倒是新知识

看了下:
v8.dev/blog/pointer-compression Pointer Compression in V8 · V8
v8.dev/blog/oilpan-pointer-compression Pointer compression in Oilpan · V8
文章写得很好,走过路过不要错过
2023-03-24 19:44:17 +08:00
回复了 tg11 创建的主题 程序员 求推荐带 GUI 的 Linux 系统
在“投入挺大”的微软把 github.com/microsoft/WSL/issues/6982 这个挂了快两年的严重影响可用性的 bug 解决之前,不推荐使用 WSL2 。
Native Linux 最多只需要对付一个 NVIDIA 驱动,现代 Windows 到处都是 NVIDIA 驱动 ...
2023-03-24 19:30:55 +08:00
回复了 pocarisweat 创建的主题 macOS 分享一个有关 M 系芯片内存和 swap 管理问题的视频
哈哈 你也看情書老師嗎?
2023-03-24 19:26:52 +08:00
回复了 Heo 创建的主题 Windows 如何评价新版 windowsQQ 采用 32 位
挺好的,32 位程序里面的指针大小比 64 位小一半。用 32 位可能是为了优化内存占用。
2023-03-20 01:51:11 +08:00
回复了 ecee 创建的主题 硬件 新电脑配件快到了,请大家指导下
CPU 降级的话可能水冷也省了,随便一个便宜风冷应该就行。
水冷最大的问题倒不是价格,这两年价格都在卷。主要是它是个可能的不稳定因素,尤其是对于工作机。

然后我发现你好像没加独显,如果要装 Windows 虚拟机的话,为了 GUI 运行流畅最好还是把 GPU passthrough 过去。然后你这机器里面只有 iGPU 一个 GPU 。我没搞过 single-GPU passthrough ,我猜你这么搞最好的结果就是一个 iGPU 切换着用(然后在 Windows 里面 SSH 进 Linux host ,which 效果跟装 Linux 虚拟机好像区别不大 ...),并且配置起来可能会比较折腾。
你可以等装好之后试一下,如果没法接受的话可能需要淘宝或者咸鱼再收一张亮机卡,做到 host 和 guest 有独立的视频输出。
2023-03-20 01:01:51 +08:00
回复了 ecee 创建的主题 硬件 新电脑配件快到了,请大家指导下
如果你主要是在 Windows 下工作,为什么 host 要装成 Linux (还是 Arch 这种维护成本略高的 distro )再虚拟工作环境,而不是反过来,不是很理解。
而且这个钱是楼主自己出还是公司出?自己出钱的话上旗舰 CPU 有多大必要?印象中 .NET 编译并不是很耗性能
2023-03-20 00:28:35 +08:00
回复了 andyJado 创建的主题 程序员 PDF 是自学者的噩梦,读 Anders 的 Static Program Analysis 窒息
你说的是这本书 https://cs.au.dk/~amoeller/spa
这 PDF 做得不是挺好的么,跳转,复制,搜索都可以

因为以前用过这书,我 iPad 里面有一份 2018 年 10 月版的,我看了一下里面的指针不是上箭头,而是"&"符号
这个 notation 的问题,可以看一下 Guy Steele 的这个 talk: https://www.youtube.com/watch?v=dCuZkaaou0Q It's Time for a New Old Language (The most popular programming language in computer science)
ChatGPT 翻译有时会自己脑补

比如 https://ru.wikipedia.org/wiki/Yadro 这个,最后“Санкции”这段里面的“компания Yadro включена в блокирующий санкционный список США”给我翻译成“Yadro was included in the US Treasury's Office of Foreign Assets Control's (OFAC) Specially Designated Nationals and Blocked Persons List (SDN List)”。原文根本没这么长,直译应该是“US blocking sanction list”,追问一下解释说这个 list“is commonly understood to refer to the OFAC SDN List”
2023-03-18 22:01:23 +08:00
回复了 dariner 创建的主题 OpenAI 看看这个计算结果是怎么回事 我用别人的 chatgpt 也这样
试试这个:

> 1 + 1 + 1 + 1 + 1 + 4 + 6 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = ?

> Let's think step by step:
1  2  3  4  5  6  7  8  9  10 ... 120  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3198 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 13:58 · PVG 21:58 · LAX 06:58 · JFK 09:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.