通信人家园
标题: 华为云支撑生产级DeepSeek推理服务上线 [查看完整版帖子] [打印本页]
时间: 2025-2-1 22:42
作者: coffee198375
标题: 华为云支撑生产级DeepSeek推理服务上线
2月1日,华为云发文称,经过硅基流动和华为云团队连⽇攻坚,双方联合⾸发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。
硅基流动表示,无论是在昇腾上适配DeepSeek-R1 & V3双模型,还是在此前上线其他模型的过程中,该公司都得到了DeepSeek与华为云的大力支持。
华为云介绍,这次上线的推理服务有两个特点。
首先,得益于⾃研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球⾼端GPU部署模型的效果。其次,提供稳定的、⽣产级服务能力,让模型能够在⼤规模⽣产环境中稳定运⾏,并满⾜业务商⽤部署需求。华为云昇腾云服务可以提供澎湃、弹性、充⾜的算⼒。
硅基流动提到,这次上线的两款模型具有零部署门槛。让开发者更加专注于应用开发,开发应用时可直接调用SiliconCloud API,带来更轻松易用的使用体验。
根据官方介绍,与DeepSeek官方优惠期价格保持一致,SiliconCloud上的DeepSeek-V3的优惠期价格(截止2月8日24:00)为¥1 / M tokens(输入)&¥2 / M tokens(输出),DeepSeek-R1的价格为¥4 / M tokens(输入)&¥16 / M tokens(输出)。
时间: 2025-2-1 22:42
作者: coffee198375
强强联合。。。。
时间: 2025-2-1 22:55
作者: Colombia.2005
coffee198375 发表于 2025-2-1 22:42 
强强联合。。。。
你发这样的贴子, 客家人又很气了!本来可以过一个年, 你发这样的消息, 客家人的年也过不发子!
时间: 2025-2-2 00:54
作者: 不吹不黑
厉害了!!
时间: 2025-2-2 06:05
作者: undebug25
Colombia.2005 发表于 2025-2-1 22:55
你发这样的贴子, 客家人又很气了!本来可以过一个年, 你发这样的消息, 客家人的年也过不发子!
客总本来就不过春节的好不好,圣诞节才是客总的心头肉
只可惜没出长黄毛,这是客总除了没被华为录取的又一个痛
时间: 2025-2-2 07:31
作者: 五星级用户
没有说是什么产品服务,是大数据广告吗?
时间: 2025-2-2 08:01
作者: 客家人
undebug25 发表于 2025-2-2 06:05
客总本来就不过春节的好不好,圣诞节才是客总的心头肉
只可惜没出长黄毛,这是客总除了没被华为录取的又 ...
你是中专生的骄傲
时间: 2025-2-2 18:51
作者: 吧啦把喇叭
如果应用端也不支持CUDA,github上好多东西玩不了啊。这个生态链如果不尽快起来,怕是热闹一阵就...
时间: 2025-2-2 23:05
作者: coffee198375
客家人 发表于 2025-2-2 08:01 
你是中专生的骄傲
看不懂的客总说点不懂的呗。。。。
时间: 2025-2-2 23:06
作者: coffee198375
吧啦把喇叭 发表于 2025-2-2 18:51 
如果应用端也不支持CUDA,github上好多东西玩不了啊。这个生态链如果不尽快起来,怕是热闹一阵就...
有尝试是好事。。。。
时间: 2025-2-5 09:28
作者: xuchenfeng
Colombia.2005 发表于 2025-2-1 22:55 
你发这样的贴子, 客家人又很气了!本来可以过一个年, 你发这样的消息, 客家人的年也过不发子!
“你发这样的贴子, 客家人又很气了!” - 你。。。客家人。。。这全是发帖人的揣测,毫无意义。
后面的推论,更加滑稽可笑。论坛应该封禁此用户一周,净化空气!
时间: 2025-2-5 11:08
作者: ganvid2008
期待
时间: 2025-2-5 15:22
作者: xhy133
好事
时间: 2025-2-7 09:13
作者: justinliu007
部署DeepSeek-V3模型用BF16权重进行推理至少需要4台Atlas 800I A2(8*64G)服务器,用W8A8量化权重进行推理则至少需要2台Atlas 800I A2 (8*64G)
通信人家园 (https://www.txrjy.com/) |
Powered by C114 |