侧边栏壁纸
博主头像
天马行空 博主等级

凡是过往,皆为序章

  • 累计撰写 632 篇文章
  • 累计创建 11 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

自己想攒个四卡的深度学习工作站,硬件来源?(合集转寄)

sortie
2023-05-16 / 0 评论 / 0 点赞 / 0 阅读 / 0 字
转寄人: sortie (sortie)
标 题: 自己想攒个四卡的深度学习工作站,硬件来源?
发信站: 水木社区 (Sun May 24 14:49:33 2026)
来 源: 120.245.106.254
【以下内容由 sortie 转寄于 Hardware 版】
bullr
Sun Apr 9 11:13:49 2023 · #1
请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来?
youxia游侠
Sun Apr 9 16:27:31 2023 · #2
我的cpu 和主板是咸鱼买的。其它的都是新的。 大头是显卡,而且4090不支持nvlink 。
【 在 bullr 的大作中提到: 】 : 请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来?
evilll萎靡
Sun Apr 9 17:20:02 2023 · #3
二楼的方案可以。在其他帖子有细节。 另外推荐个方案: 1.8卡 p100, 16 *8 = 128G显存 2.其他都买浪潮二手服务器自带的cpu、内存 3.配一两块硬盘 p100现在是1400左右,二手服务器+cpu、内存等在9000左右 总价在22000左右.如果p100嫌贵,可以买p40(24G显存,但不支持半精度),900元一块。 优点:价格便宜,2万块出头能组一个128G显存的机器,而且支持半精度 缺点:服务器噪音巨大
LYMing1986LYMing1986
Sun Apr 9 17:59:47 2023 · #4
还可以考虑2080ti 魔改22G版 支持半精度,4090能跑的他也能跑,就是慢了点,售价只有4090的零头
olddognewwit老狗
Sun Apr 9 19:49:54 2023 · #5
这8个卡怎么连接?用pcie太慢了,用nvlink成本不小。
【 在 evilll 的大作中提到: 】 : 二楼的方案可以。在其他帖子有细节。 : 另外推荐个方案: : 1.8卡 p100, 16 *8 = 128G显存
evilll萎靡
Sun Apr 9 19:52:24 2023 · #6
就是pcie的方案。
【 在 olddognewwit 的大作中提到: 】 : 这8个卡怎么连接?用pcie太慢了,用nvlink成本不小。
bullr
Mon Apr 10 10:21:36 2023 · #7
感谢大家指导
【 在 bullr 的大作中提到: 】 : 请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来?
yuhenanyuhenan
Mon Apr 10 17:39:29 2023 · #8
电脑配置
sweanson苏喵喵
Mon Apr 10 18:20:27 2023 · #9
建议资金不富裕就买Quadro K6000*4,资金中等买M6000,资金充裕买 P6000,都有 12G和24G版,价格差1000,单价tb很多。 钱都花那么多了,还不支持双精度计算,投资完全浪费。 可以配个超微 单路 支持 4路双宽的板子3-4000,加个多核cpu+内存。资金有限也可以整3路,性能高的。都有相应的解决方案。 Quadro K6000,单精度浮点性能为5.2TFlops,双精度浮点计算能力大约为1.7TFlops。参考下M比K快30-40%,P比M再快30-40%。
bullr
Wed Apr 12 10:49:58 2023 · #10
多谢
【 在 sweanson 的大作中提到: 】 : 建议资金不富裕就买Quadro K6000*4,资金中等买M6000,资金充裕买 P6000,都有 12G和24G版,价格差1000,单价tb很多。 : 钱都花那么多了,还不支持双精度计算,投资完全浪费。 : 可以配个超微 单路 支持 4路双宽的板子3-4000,加个多核cpu+内存。资金有限也可以整3路,性能高的。都有相应的解决方案。
uliguohongMor730
Fri May 12 10:14:28 2023 · #11
4090在哪买的
【 在 youxia 的大作中提到: 】 : 我的cpu 和主板是咸鱼买的。其它的都是新的。 : 大头是显卡,而且4090不支持nvlink 。
youxia游侠
Fri May 12 12:47:15 2023 · #12
京东自营
【 在 uliguohong 的大作中提到: 】 : 4090在哪买的
smthhzsmthhz
Sun May 14 14:08:41 2023 · #13
搞俩a40组nvlink不行?价格差不多,显存功耗都好多了。
【 在 bullr (肥) 的大作中提到: 】 : 请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来?
LYMing1986LYMing1986
Mon May 15 05:50:49 2023 · #14
看到个东西,仅供参考
【 在 bullr 的大作中提到: 】 : 请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来? [upload=1][/upload]
lvsoftLv(The Last Guardian
Mon May 15 07:47:07 2023 · #15
双精度对ai没啥用。 现在ai都在搞4bit计算了,还双精度...
【 在 sweanson 的大作中提到: 】 : 建议资金不富裕就买Quadro K6000*4,资金中等买M6000,资金充裕买 P6000,都有 12G和24G版,价格差1000,单价tb很多。 : 钱都花那么多了,还不支持双精度计算,投资完全浪费。 : 可以配个超微 单路 支持 4路双宽的板子3-4000,加个多核cpu+内存。资金有限也可以整3路,性能高的。都有相应的解决方案。
lvsoftLv(The Last Guardian
Mon May 15 07:47:58 2023 · #16
pcie x1的垃圾而已
【 在 LYMing1986 的大作中提到: 】 : 看到个东西,仅供参考 : [upload=1][/upload]
haiyy神圣的理想永不磨灭
Mon May 15 10:30:27 2023 · #17
请教一下,我的主板是x79的,用cpu-z查看应该是pcie3.0的,可用gpu-z查看显卡却是工作在pcie2.0下,问题出在哪里?像3090这种pcie4.0的显卡如果工作在pcie3.0或2.0下,对深度学习的训练有多大影响?
【 在 lvsoft 的大作中提到: 】 : pcie x1的垃圾而已
VincentGeVincentGe
Mon May 15 11:37:40 2023 · #18
消费卡不建议多卡,并行效果不好,单卡4090,3090不错。有钱上计算卡,V100 32G性价比不错,三楼的P40也可以考虑。根据你的方向来,如果做NLP一定大显存。 内存4通道打底,200G保底,这个也很重要,看你数据集小。 主板一定要好,二手服务器也可以,他们的机子要定期退的。注意电源,UPS非常重要,IPS是可选的,电源要好,主要空调。 有老板付钱就往上堆,自己就根据方向配。一般来说计算卡比较保值。咸鱼别考虑,淘宝可选,不过有认识那些数据中心人最好。
【 在 bullr 的大作中提到: 】 : 请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来?
lvsoftLv(The Last Guardian
Mon May 15 12:02:11 2023 · #19
最低pcie3.0 x8,等价pcie4.0 x4 再低就有显著影响了。 你的问题可能是接触不良跑在降级的profile上了。
【 在 haiyy 的大作中提到: 】 : 请教一下,我的主板是x79的,用cpu-z查看应该是pcie3.0的,可用gpu-z查看显卡却是工作在pcie2.0下,问题出在哪里?像3090这种pcie4.0的显卡如果工作在pcie3.0或2.0下,对深度学习的训练有多大影响?
lvsoftLv(The Last Guardian
Mon May 15 12:03:37 2023 · #20
ups意义不大。个人用遇到掉电了也无所谓,反正训练过程中会有checkpoint,顶天浪费1-2小时而已。 内存问题看会不会用到off load,不然也一样意义不大,不管是容量还是带宽。
【 在 VincentGe 的大作中提到: 】 : 消费卡不建议多卡,并行效果不好,单卡4090,3090不错。有钱上计算卡,V100 32G性价比不错,三楼的P40也可以考虑。根据你的方向来,如果做NLP一定大显存。 : 内存4通道打底,200G保底,这个也很重要,看你数据集小。 : 主板一定要好,二手服务器也可以,他们的机子要定期退的。注意电源,UPS非常重要,IPS是可选的,电源要好,主要空调。
VincentGeVincentGe
Mon May 15 14:49:42 2023 · #21
内存问题好说,但UPS绝对非常重要。 有一次我一客户出错了,算出了一个意外值,排查了好久,最后判断是显卡意外断电核心烧了,UPS不是为了保模型,是为了保硬件。
【 在 lvsoft 的大作中提到: 】 : ups意义不大。个人用遇到掉电了也无所谓,反正训练过程中会有checkpoint,顶天浪费1-2小时而已。 : 内存问题看会不会用到off load,不然也一样意义不大,不管是容量还是带宽。
haiyy神圣的理想永不磨灭
Mon May 15 15:14:20 2023 · #22
目前两张3090都是运行在pcie2.0 x16
【 在 lvsoft 的大作中提到: 】 : 最低pcie3.0 x8,等价pcie4.0 x4 : 再低就有显著影响了。 : 你的问题可能是接触不良跑在降级的profile上了。
Eikes暴力小坦克
Mon May 15 20:00:14 2023 · #23
推荐,李牧深度学习装机,超赞。感谢我吧,随便转点积分。
【 在 bullr (肥) 的大作中提到: 】 : 请教下,淘宝或闲鱼能买到合适的主板,机箱和电源吗?预计四块4090的样子。总价能多少下来?
lvsoftLv(The Last Guardian
Mon May 15 21:17:52 2023 · #24
这种概率可能还没4090供电线烧了的概率大。 小概率事件无视就行了。 另外,gpu算错很常见的事情,不然你以为为啥ecc会是tesla级的配置?
【 在 VincentGe 的大作中提到: 】 : 内存问题好说,但UPS绝对非常重要。 : 有一次我一客户出错了,算出了一个意外值,排查了好久,最后判断是显卡意外断电核心烧了,UPS不是为了保模型,是为了保硬件。
VincentGeVincentGe
Tue May 16 20:12:55 2023 · #25
关键是硬件太贵了,一个能用的UPS不到2000,不过到底买不买看楼主最后预算吧。 消费卡没有ECC,这个lz需要注意下。
【 在 lvsoft 的大作中提到: 】 : 这种概率可能还没4090供电线烧了的概率大。 : 小概率事件无视就行了。 : 另外,gpu算错很常见的事情,不然你以为为啥ecc会是tesla级的配置?
博主关闭了所有页面的评论