通信人家园

标题: 华为云支撑生产级DeepSeek推理服务上线  [查看完整版帖子] [打印本页]

时间:  2025-2-1 22:42
作者: coffee198375     标题: 华为云支撑生产级DeepSeek推理服务上线

2月1日,华为云发文称,经过硅基流动和华为云团队连⽇攻坚,双方联合⾸发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。



硅基流动表示,无论是在昇腾上适配DeepSeek-R1 & V3双模型,还是在此前上线其他模型的过程中,该公司都得到了DeepSeek与华为云的大力支持。



华为云介绍,这次上线的推理服务有两个特点。



首先,得益于⾃研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球⾼端GPU部署模型的效果。其次,提供稳定的、⽣产级服务能力,让模型能够在⼤规模⽣产环境中稳定运⾏,并满⾜业务商⽤部署需求。华为云昇腾云服务可以提供澎湃、弹性、充⾜的算⼒。



硅基流动提到,这次上线的两款模型具有零部署门槛。让开发者更加专注于应用开发,开发应用时可直接调用SiliconCloud API,带来更轻松易用的使用体验。



根据官方介绍,与DeepSeek官方优惠期价格保持一致,SiliconCloud上的DeepSeek-V3的优惠期价格(截止2月8日24:00)为¥1 / M tokens(输入)&¥2 / M tokens(输出),DeepSeek-R1的价格为¥4 / M tokens(输入)&¥16 / M tokens(输出)。 




时间:  2025-2-1 22:42
作者: coffee198375

强强联合。。。。
时间:  2025-2-1 22:55
作者: Colombia.2005

coffee198375 发表于 2025-2-1 22:42
强强联合。。。。

你发这样的贴子, 客家人又很气了!本来可以过一个年, 你发这样的消息, 客家人的年也过不发子!
时间:  2025-2-2 00:54
作者: 不吹不黑

厉害了!!
时间:  2025-2-2 06:05
作者: undebug25

Colombia.2005 发表于 2025-2-1 22:55
你发这样的贴子, 客家人又很气了!本来可以过一个年, 你发这样的消息, 客家人的年也过不发子!

客总本来就不过春节的好不好,圣诞节才是客总的心头肉
只可惜没出长黄毛,这是客总除了没被华为录取的又一个痛
时间:  2025-2-2 07:31
作者: 五星级用户

没有说是什么产品服务,是大数据广告吗?
时间:  2025-2-2 08:01
作者: 客家人

undebug25 发表于 2025-2-2 06:05
客总本来就不过春节的好不好,圣诞节才是客总的心头肉
只可惜没出长黄毛,这是客总除了没被华为录取的又 ...

  你是中专生的骄傲
时间:  2025-2-2 18:51
作者: 吧啦把喇叭

如果应用端也不支持CUDA,github上好多东西玩不了啊。这个生态链如果不尽快起来,怕是热闹一阵就...
时间:  2025-2-2 23:05
作者: coffee198375

客家人 发表于 2025-2-2 08:01
你是中专生的骄傲

看不懂的客总说点不懂的呗。。。。
时间:  2025-2-2 23:06
作者: coffee198375

吧啦把喇叭 发表于 2025-2-2 18:51
如果应用端也不支持CUDA,github上好多东西玩不了啊。这个生态链如果不尽快起来,怕是热闹一阵就...

有尝试是好事。。。。
时间:  2025-2-5 09:28
作者: xuchenfeng

Colombia.2005 发表于 2025-2-1 22:55
你发这样的贴子, 客家人又很气了!本来可以过一个年, 你发这样的消息, 客家人的年也过不发子!

“你发这样的贴子, 客家人又很气了!” - 你。。。客家人。。。这全是发帖人的揣测,毫无意义。

后面的推论,更加滑稽可笑。论坛应该封禁此用户一周,净化空气!
时间:  2025-2-5 11:08
作者: ganvid2008

期待
时间:  2025-2-5 15:22
作者: xhy133

好事
时间:  2025-2-7 09:13
作者: justinliu007

部署DeepSeek-V3模型用BF16权重进行推理至少需要4台Atlas 800I A2(8*64G)服务器,用W8A8量化权重进行推理则至少需要2台Atlas 800I A2 (8*64G)




通信人家园 (https://www.txrjy.com/) Powered by C114