V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  abbottcn  ›  全部回复第 7 页 / 共 14 页
回复总数  268
1  2  3  4  5  6  7  8  9  10 ... 14  
2021-03-23 11:53:57 +08:00
回复了 xuegy 创建的主题 Linux 学校超算管理员匆忙上线 CentOS 8 结果翻车了
顺便吐槽一下.
很多超算中心写的那个使用说明, 太过于专业化了.
99%的用户, 仅仅是来做计算, 让计算跑起来, 又不是 CS 专业的,
谁理解什么容器啥意思?

手册应该分两版本,
简明版, 只需要讲,
怎么到这个机器来, 怎么拿走数据?
如果你的程序手册告诉你, 是这么运行, 那么在这个机器, 是如此运行.
需要对中心提供的每一个程序都要写类似的说明.

高阶版, 一定要提醒客户, 如果没有任何计算机基础, 请一定找一个 CS 专业的人员, 陪同一起看使用说明.

我课题组的机器,
从单个服务器到计算集群, 自己做.
只要是机器上提供的计算软件,
每一个, 操作流程都是:
用户提供输入控制文件到指定目录; mkdir ~/input
用户拷贝脚本到目录; cp /opt/share/scripts/run-XXX.sh ~/input
需要更换 XXX 为对应的程序名称, 手册有列表.
最后, 运行计算, bash ~/input/run-XXX.sh
所有计算, 会自动加载到队列中. 会自动设定 CPU 核心数目, 内存数目等.

只用如何登录以及拿走数据,
录制视频, 演示 windows + MobaXterm 如何搞.

就是这样的简易使用策略, 学生都能搞错.
还想指望学生能看懂诸如 容器 之类的名词, 是不现实的.
2021-03-23 10:43:25 +08:00
回复了 Joker123456789 创建的主题 MacBook Pro 求推荐一个素质可以匹敌 mac 显示器
2415Q 采用 C to DP,可用。
2021-03-23 10:26:38 +08:00
回复了 xuegy 创建的主题 Linux 学校超算管理员匆忙上线 CentOS 8 结果翻车了
@Jat001 物理机器呀. 你说的那些, 没法跑所谓高性能并行计算. 你说的, 和我用的, 完全是不同的领域.
2021-03-23 08:13:57 +08:00
回复了 xuegy 创建的主题 Linux 学校超算管理员匆忙上线 CentOS 8 结果翻车了
记得有位网友问我,怎么搭建计算用的并行集群?
说自己看了些都是 k8s 集群。
我说你看错方向了。
计算用的和 k8s 集群是两会事。
去小破站找我的视频,能有点帮助。
id 一样的。

后来他搞定了。
2021-03-22 23:19:36 +08:00
回复了 xuegy 创建的主题 Linux 学校超算管理员匆忙上线 CentOS 8 结果翻车了
@Jat001 你说的 Ansible 我不懂, 也用不到. 我自己做的集群, 还用不到这么高级的东西. 实际应用中, 除非硬件损坏, 几乎碰不到节点需要维护的情形.
k8s 没玩过.
计算化学并行计算方面, 使用 singularity 就解决问题了. 十分简单.
对于用户而言, 无非就是,
原来是 mpirun -np $NP AAAA
现在是 mpirun -np $NP singularity exec AAAA
其他方案, 对于用户而言, 学习成本偏高.

用户的水平可以这样描述:
如果在说明里面写, 系统有多个 intel 编译器版本,
使用 XXX 请运行 source /opt/scirpt/enable_intelXXX.sh 激活.
用户会来 BB, 啥, 你到底会不会弄呀,
还让我自己激活 Intel 编译器? 我去那里搞激活码, 序列号?
用户大概都是这个水准的.

以上仅仅来自个人工作经历.
我仅仅管理过顶多 50 节点左右的并行计算集群.
我自己做的集群, 仅限课题组小规模使用.
部分言论, 可能有不严谨, 请见谅.
2021-03-22 21:48:05 +08:00
回复了 xuegy 创建的主题 Linux 学校超算管理员匆忙上线 CentOS 8 结果翻车了
@Jat001 我的应用用,性能几乎无损耗。
测试软件,典型的量子化学电子结构计算软件,gaussian16 。
TF-DFT 计算频率,36 核心,120GB 内存,
主机裸体跑,4 小时左右。
容器方式,多五秒。
软件自己统计的时间。

我认为效率无差异。

可能是,所谓超算的运维,
不晓得容器化技术。
2021-03-22 21:31:36 +08:00
回复了 xuegy 创建的主题 Linux 学校超算管理员匆忙上线 CentOS 8 结果翻车了
从描述来看,
运维经验不足呀.
没有编辑器, 可以结合 cat echo sed 等修改配置文件呀, 不会连 cp cat 等无法使用吧?

至于各种编译, 应该说服管理员安装一个 Singularity 就高枕无忧了.
如果运维方不晓得什么是 Singularity, 让他多看看新闻吧.

我自己也有集群, 仅是规模不大, 系统是混跑的, CentOS 6.x 混 RHEL 6.y, x, y 1~10 均有.
机器是浪潮不同批次送来的.

只要机器能正常运行, 不死机, 不重启, 不 kernel panic,
合理采用各种镜像技术, 完全可以应付好几年的.
数年之后, 机器也就到寿命了.

CentOS 系统并没有说要完犊子. 根据我自己理解官方的说法.
之前是, RedHat 测试, 推送给 RHEL; centOS 社区编译, 推送给 CentOS 用户.
现在是, RedHat 测试, 推送给 CentOS, 再推送给 RHEL.
就是之前滞后的命运要完犊子.
2021-03-16 14:09:52 +08:00
回复了 mashaofeixxx 创建的主题 推广 NUC8i5 黑果套餐返场! 抽一人送西数黑盘.
之前买了一个 NUC8,用得挺好。自己懒得动手弄了。
2021-03-14 20:42:50 +08:00
回复了 xuegy 创建的主题 程序员 从 Linux 换到黑苹果的一些感想
我把一台 mac mini 搞成了 ubuntu,又买了一台内存更大的 NUC8 黑果,能用。2K 显示器给 ubuntu 用,换个 23.8 英寸的 4K 给黑果用。低分辨率显示器在苹果系统下很糟糕。
2021-03-07 18:02:56 +08:00
回复了 xuegy 创建的主题 程序员 如何提升程序抢占内存带宽的能力?
@xuegy 你还没看过,四路 8 系列处理器服务器,用四个 64GB 内存条的。
常见的是,双路机器,8 系列处理器,用四个或者八个内存条的。

来问我,我都说,8 系列处理器,双路,不用 12 个内存条的,基本是傻子。同理,四路机器,v3v4 处理器,用 16 个内存条,8 系列,用 24 个内存条呀。高校一窝蜂做计算的很多,买的机器配置搞笑的特别多。
2021-03-07 17:49:03 +08:00
回复了 xuegy 创建的主题 程序员 如何提升程序抢占内存带宽的能力?
诸如 slurm 之类的调度器,似乎只能限制内存容量,而不能限定带宽。slurm 通过 cgroup 做限定。

另外说个笑话。一个生物课题组计算出了问题,找我解决。我一看,双路机器,两张 GPU,却只有两个 8GB 内存条,计算基本都是内存不足而挂掉的。他们以为,GPU 计算,和 CPU 内存没啥关系。要是再无知点,估计都能用一个内存条。
2021-03-01 15:28:07 +08:00
回复了 mashaofeixxx 创建的主题 推广 回贴抽奖! 2021 NUC 黑果 下单抽牛年福袋
重在参与,祝福马老板生意兴隆,财源广进。
2020-12-23 15:18:07 +08:00
回复了 xwchenhui 创建的主题 NAS 6W 的 CPU 跑了 7 个虚拟机,快冒烟了
罪过, 我看成了六万人民币一颗的处理器了。
2020-11-25 19:18:45 +08:00
回复了 wsgzao 创建的主题 macOS macOS 使用 XQuartz 支持 X11 实现 Linux 图形化界面显示
No need to set DISPLAY.

ssh -X -Y will set everything you need.
2020-10-09 11:39:34 +08:00
回复了 757384557 创建的主题 Linux 大佬们,现在腾讯云的新加坡轻量服务器值得买吗
@xunandotme 支付也是实名的呀!
或者还有匿名支付?
@sjmcefc2 1 、2 GB swap 应该可以救急了。如果经常遇到动用 swap,我个人建议是,增加物理内存,而非扩大 swap 分区。

另,我 Linux 很少用到桌面,也不做日常办公用,也不做编译之类的工作,我尽量都是直接使用物理内存的。以上的建议未必符合你的应用场景。
swap 搞成两倍,纯属外行。
如果机器安装了 24 条 64GB 的内存条,
按照你的逻辑,swap 还搞不定呢。
曾经有一台戴尔台式机,poweroff 会导致机器卡住不动,后来了解到,是电源不兼容,在启动项参数中添加了一个 ACPI=OFF,(可能有写错哦,太久了,记不住)重启问题就解决了。
2020-09-06 17:41:18 +08:00
回复了 nkchn 创建的主题 问与答 wentoy 盘能不能做成系统盘
我做过。速度感人。然后就没有了。
2020-08-12 16:36:26 +08:00
回复了 guiqiqi 创建的主题 Apple 我的 MacBook Pro 16inch 2019 烧掉了
@Zhonghua233 我的机器有这个毛病。
1  2  3  4  5  6  7  8  9  10 ... 14  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2856 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 14:53 · PVG 22:53 · LAX 07:53 · JFK 10:53
Developed with CodeLauncher
♥ Do have faith in what you're doing.