通信人家园

标题: deepseek对HW是不是大利好  [查看完整版帖子] [打印本页]

时间:  2025-2-5 09:55
作者: urock     标题: deepseek对HW是不是大利好

说明低性能的GPU也可以用
对英伟达的依赖小了,国内厂家可以放开采购昇腾了

时间:  2025-2-5 10:03
作者: 愤怒的拳头

应该算是吧
时间:  2025-2-5 10:06
作者: webyu

保持怀疑态度
时间:  2025-2-5 10:30
作者: qishi

性能低可以堆规模,ds的重要意义是打破cuda垄断
时间:  2025-2-5 10:33
作者: 清河人

对英伟达和昇腾的影响是一样的,不需要买太多算力卡了,偏负面。但是对华为的影响偏正向,AI会促进很多产业发展。
时间:  2025-2-5 10:48
作者: 不吹不黑

那厉害了!
时间:  2025-2-5 11:08
作者: xhy133

这个主要感谢硅基流动的撮合,袁总
时间:  2025-2-5 11:52
作者: wjhqr

deepseek主要是通过对美帝各大模型的蒸馏构建了自己的能力,以后美帝堵住这个漏洞,并通过美帝强大算力实现技术迭代升级进化后,deepseek拿什么跟?
时间:  2025-2-5 11:58
作者: 清河人

wjhqr 发表于 2025-2-5 11:52
deepseek主要是通过对美帝各大模型的蒸馏构建了自己的能力,以后美帝堵住这个漏洞,并通过美帝强大算力实现 ...

你都快舔地上了,英伟达又跌了,你知道蒸馏啥意思不
时间:  2025-2-5 12:04
作者: wjhqr

清河人 发表于 2025-2-5 11:58
你都快舔地上了,英伟达又跌了,你知道蒸馏啥意思不

蒸馏说白了不就是把别人的东西提炼后变成自己的么?
时间:  2025-2-5 12:07
作者: hy1234

wjhqr 发表于 2025-2-5 11:52
deepseek主要是通过对美帝各大模型的蒸馏构建了自己的能力,以后美帝堵住这个漏洞,并通过美帝强大算力实现 ...

你担心什么以后印度也会引入deepseek技术,到时就可以回答你了。
时间:  2025-2-5 12:12
作者: wjhqr

清河人 发表于 2025-2-5 11:58
你都快舔地上了,英伟达又跌了,你知道蒸馏啥意思不

股票涨涨跌跌不是很正常?何况英伟达股价都到了天价,调整一下很正常嘛。
去年7月英伟达一波调整就跌了33%,8月又跌了25%,这回也才跌了20%左右嘛
时间:  2025-2-5 12:22
作者: huaweizhongxing

hy1234 发表于 2025-2-5 12:07
你担心什么以后印度也会引入deepseek技术,到时就可以回答你了。

印度没一样行的,
时间:  2025-2-5 12:25
作者: wjhqr

DeepSeek其实远远不止报道的只有2000张卡,实际拥有约1万张A100。幻方量化在2023年接受36氪专访时透露,公司已囤有1万张英伟达A100显卡‌。
此外,DeepSeek在训练过程中还使用了其他类型的GPU,如H100和H800,具体数量未明确说明‌。
时间:  2025-2-5 12:39
作者: wjhqr

梁文锋团队在论文中透露了如下关键细节:
“在深度学习训练中,我们部署了萤火二号系统,该系统配备了1万张A100GPU芯片,在性能上接近DGX-A100。”
一直以来,业内流传的幻方囤着1万张英伟达芯片的说法,在梁文锋的论文中得到了证实。
时间:  2025-2-5 15:49
作者: super_ice

利好
时间:  2025-2-5 16:01
作者: ganvid2008


时间:  2025-2-5 16:43
作者: 狼人克星

wjhqr 发表于 2025-2-5 12:04
蒸馏说白了不就是把别人的东西提炼后变成自己的么?

这么简单,你欧洲,印度为啥不会提炼?
是能力低下弱智吗?
时间:  2025-2-5 17:03
作者: 没事来看看

现实大利好谈不上,但肯定是正向的。

1,训练,预训练,还是推理,不同的场景对于算力,特别是芯片性能要求是不同的。

现阶段,从训练走向推理,特别是边缘侧甚至是端侧,是有这个趋势的,对于芯片性能、功耗之类的要求的确是降低了,利好华为升腾,也包括寒武纪、百度、甚至是海光之类的国产算力芯片。

2,大模型的后续迭代,特别是训练场景,还是英伟达。其实,英伟达也有低端产品可以卖。

3,deepseek 并没有脱离英伟达的CUDA框架,只是工程性优化。
时间:  2025-2-5 17:08
作者: 没事来看看

wjhqr 发表于 2025-2-5 12:04
蒸馏说白了不就是把别人的东西提炼后变成自己的么?

业界质疑比较多的地方:

1,成本,到底花了多少钱

2,蒸馏,到底是否合理?
时间:  2025-2-5 17:18
作者: wjhqr

狼人克星 发表于 2025-2-5 16:43
这么简单,你欧洲,印度为啥不会提炼?
是能力低下弱智吗?

蒸馏是一方面,算力也是必须的,刚才问了一下deepseek:DS一共用了多少张A100卡?答复:DeepSeek(幻方)公开的A100显卡数量为约1万枚,并可能在此基础上扩展其它型号芯片,但具体数据需以官方披露为准。

一万张A100是2023年初的数据,这两年肯定也买了很多H100/H800/H20卡,总数量2万以上是可信的,绝不是只有区区2千张
时间:  2025-2-5 17:37
作者: 请叫我阿宽

今天的股市已经表现了
时间:  2025-2-5 18:23
作者: 清河人

wjhqr 发表于 2025-2-5 12:25
DeepSeek其实远远不止报道的只有2000张卡,实际拥有约1万张A100。幻方量化在2023年接受36氪专访时透露,公司 ...

那还需要蒸馏?
时间:  2025-2-5 18:38
作者: wjhqr

清河人 发表于 2025-2-5 18:23
那还需要蒸馏?

蒸馏的是数据和逻辑,还需要算力来支撑嘛。
好比是拿到了别人的题库包括题目、解题思路和答案,你还需要脑子来消化吸收和举一反三呀,这个脑子就是算力。
DS的举一反三做的不错。
但DS最近经常服务器繁忙卡死,看来这一两万张卡还是远远不够。
时间:  2025-2-5 22:08
作者: coffee198375

wjhqr 发表于 2025-2-5 11:52
deepseek主要是通过对美帝各大模型的蒸馏构建了自己的能力,以后美帝堵住这个漏洞,并通过美帝强大算力实现 ...

企业比您看得清楚,现在不就跟了。。。。
时间:  2025-2-5 22:10
作者: coffee198375

wjhqr 发表于 2025-2-5 12:12
股票涨涨跌跌不是很正常?何况英伟达股价都到了天价,调整一下很正常嘛。
去年7月英伟达一波调整就跌了3 ...

米帝啥东西都正常。。。。
时间:  2025-2-5 22:11
作者: coffee198375

没事来看看 发表于 2025-2-5 17:08
业界质疑比较多的地方:

1,成本,到底花了多少钱

其实这些个质疑没啥意义,花钱多少冷暖自知,是否合理在于主观。。。。
时间:  2025-2-5 22:12
作者: coffee198375

wjhqr 发表于 2025-2-5 12:39
梁文锋团队在论文中透露了如下关键细节:
“在深度学习训练中,我们部署了萤火二号系统,该系统配备了1万张 ...

某人说5万啵,您再估计一下。。。。
时间:  2025-2-5 22:12
作者: coffee198375

国内昇腾是大趋势了。。。。
时间:  2025-2-5 23:29
作者: seaboy000

DS没火之前, 国内昇腾也是趋势.
时间:  2025-2-6 08:14
作者: fjlin


时间:  2025-2-6 08:25
作者: lingmeng447

huaweizhongxing 发表于 2025-2-5 12:22
印度没一样行的,

印度人英语好,不接受反驳
时间:  2025-2-6 09:07
作者: justinliu007

huawei 网站查不到910b的信息了?
时间:  2025-2-6 09:28
作者: oooooooo

lingmeng447 发表于 2025-2-6 08:25
印度人英语好,不接受反驳

比日本人英语还好
时间:  2025-2-6 09:44
作者: 清河人

wjhqr 发表于 2025-2-5 18:38
蒸馏的是数据和逻辑,还需要算力来支撑嘛。
好比是拿到了别人的题库包括题目、解题思路和答案,你还需要 ...

你对AI是一窍不通呀,卡死还跟一万张卡有关系?
时间:  2025-2-6 15:10
作者: hzz2323

开源的意义太大了,1.容易形成生态 2.是我可以选择兼容什么芯片 3.你堵死我我也让你完蛋。
时间:  2025-2-6 15:14
作者: whoami2004

DS的成功是理念和思路的成功
没有人能杀死理念和思路。。。。。
时间:  2025-2-6 16:11
作者: 孙志扬

能低成本发展是件好事,技术存在就有一定的合理性,法无禁止即可。也证明了,并不一定是高性能的硬件才能实现高性能。

时间:  2025-2-6 16:20
作者: 奋斗士

wjhqr 发表于 2025-2-5 12:25
DeepSeek其实远远不止报道的只有2000张卡,实际拥有约1万张A100。幻方量化在2023年接受36氪专访时透露,公司 ...

1万张卡是官方公开说明的,但传言是有5万张,通过新加坡套的,所以现在有新加坡XX公司被禁的新闻
时间:  2025-2-6 16:51
作者: stark

本帖最后由 stark 于 2025-2-6 17:22 编辑

算力为王,靠堆规模没用的。打比方,甲公司芯片3nm制程,一个晶体管体积27nm3,乙公司自主芯片28nm制程,一个晶体管21952nm3,体积相差813倍绝壁的降维打击。
时间:  2025-2-6 17:19
作者: 中油通信2018

来学习
时间:  2025-2-6 18:17
作者: 桂npc

wjhqr 发表于 2025-2-5 11:52
deepseek主要是通过对美帝各大模型的蒸馏构建了自己的能力,以后美帝堵住这个漏洞,并通过美帝强大算力实现 ...

学了一个新词就自以为是了。
这几天openai得了deepseek开源真传,也开始用中文思考问题了!
时间:  2025-2-6 18:22
作者: 桂npc

奋斗士 发表于 2025-2-6 16:20
1万张卡是官方公开说明的,但传言是有5万张,通过新加坡套的,所以现在有新加坡XX公司被禁的新闻

一两百亿买卡,还有各种配套,电费,又要一两百亿,你们给钱?
给完还开源给世界用。
别张口就扯犊子。
时间:  2025-2-6 18:23
作者: 桂npc

stark 发表于 2025-2-6 16:51
算力为王,靠堆规模没用的。打比方,甲公司芯片3nm制程,一个晶体管体积27nm3,乙公司自主芯片28nm制程,一 ...

胡说八道!有这么算的纯属外行到没谱!
时间:  2025-2-7 08:53
作者: chaiminglu

从最近三大运营商都在宣布接入deepseek上来看,应该是一种信号,但不知道后续了,目前对话agent的质量是优于其他的。除了卡。
时间:  2025-2-7 09:09
作者: sjw689

没事来看看 发表于 2025-2-5 17:08
业界质疑比较多的地方:

1,成本,到底花了多少钱

老美几家大公司都准备垄断分蛋糕 deepseek横空出世还是开源的 老美质疑 你怎么做出来的 怎么开源了  
时间:  2025-2-7 09:10
作者: sjw689

huaweizhongxing 发表于 2025-2-5 12:22
印度没一样行的,

不要小看印度人
时间:  2025-2-7 10:11
作者: luojitao

对华为不构成利好,对之前跑自研模型的团队来说不是好消息
时间:  2025-2-8 09:17
作者: sdjninghu

在家安装了DEEPSEEK14B的那个开源大模型,发现还行,电脑带的动,喂了点标书,还能给你写总结
时间:  2025-2-8 14:34
作者: 狼人克星

wjhqr 发表于 2025-2-5 17:18
蒸馏是一方面,算力也是必须的,刚才问了一下deepseek:DS一共用了多少张A100卡?答复:DeepSeek(幻方) ...

喔,欧洲,日本穷,买不起算力卡
时间:  2025-2-8 15:51
作者: nanliang


时间:  2025-2-9 11:14
作者: BH1PXK

升腾的产能本来就不够用了。不用放开。 头部厂商早就在买了。
时间:  2025-2-9 14:52
作者: shamashii

到底什么是蒸馏?
时间:  2025-2-9 16:28
作者: yasu0718

luojitao 发表于 2025-2-7 10:11
对华为不构成利好,对之前跑自研模型的团队来说不是好消息

开发到一半的才难受
时间:  2025-2-9 18:37
作者: homecat123

低端就是低端,不信能够提到先进的芯片。




通信人家园 (https://www.txrjy.com/) Powered by C114