通信人家园

标题: 中国联通:针对DeepSeek系列模型优化升级,平均节省30%推理计算量  [查看完整版帖子] [打印本页]

时间:  2025-2-27 15:20
作者: 无名小足     标题: 中国联通:针对DeepSeek系列模型优化升级,平均节省30%推理计算量

中国联通近日宣布,继1月开源元景“自适应慢思考”思维链大模型后,又针对DeepSeek系列模型进行了“自适应慢思考”优化升级,平均可节省约30%的推理计算量,现已开源。这也是目前业界首个对DeepSeek系列思维链模型做“自适应慢思考”优化升级的工作。

时间:  2025-2-27 15:39
作者: xhy133

应用DS率先见成果,给大联通点个赞。
时间:  2025-2-27 18:35
作者: 不吹不黑

省心省事!
时间:  2025-2-28 10:44
作者: 王不留行

这个本来应该叫做自适应快思考,或者自适应按需思考,哪怕叫自适应按需不思考也没有歧义




通信人家园 (https://www.txrjy.com/) Powered by C114