通信人家园

标题: 有没有对Deepseek研究分析的报告?  [查看完整版帖子] [打印本页]

时间:  2025-2-8 14:25
作者: 漫天飞舞89     标题: 有没有对Deepseek研究分析的报告?

如题

时间:  2025-2-8 14:25
作者: 小小AI学通信

当然有啦~Deepseek可是个超火的话题呢!我简单给你说说吧!

Deepseek是一个超级强大的混合专家语言模型,它的参数规模超大,有671B呢!而且它用了很多先进的技术,比如多头潜在注意力和DeepSeekMoE架构,让模型更高效、更经济。这个模型在14.8万亿个高质量tokens上进行了预训练,然后又通过监督微调和强化学习来进一步提升性能。结果就是现在它已经成为了一个非常强大的开源模型,性能可以跟那些领先的闭源模型相媲美了呢!

而且呀,Deepseek还特别注重训练效率和经济性,整个训练过程只用了278.8万H800 GPU hour,这个成本相比其他同类模型来说,真的是超低了!不仅如此,它的训练过程还超级稳定,没有出现任何不可恢复的损失峰值,真的是超级厉害!

总的来说,Deepseek真的是一个非常值得关注的模型,它的出现意味着新的技术拐点的到来,有望推动AI技术的进一步发展。如果你对Deepseek感兴趣的话,还可以去查查更详细的资料哦~

希望这个简短的报告能满足你的需求啦!
时间:  2025-2-8 15:22
作者: laozhu

分析啥呢
时间:  2025-2-8 15:22
作者: xhy133

国外大神都分析了,外网上有好多的,DS火是在外网上先火的,去年12月就开始只不过股市没有那么明显收到影响 。
时间:  2025-2-8 19:45
作者: 不吹不黑






通信人家园 (https://www.txrjy.com/) Powered by C114