wjhqr 发表于 2025-2-5 11:52
deepseek主要是通过对美帝各大模型的蒸馏构建了自己的能力,以后美帝堵住这个漏洞,并通过美帝强大算力实现 ...
hy1234 发表于 2025-2-5 12:07
你担心什么以后印度也会引入deepseek技术,到时就可以回答你了。
wjhqr 发表于 2025-2-5 12:04
蒸馏说白了不就是把别人的东西提炼后变成自己的么?
wjhqr 发表于 2025-2-5 12:25
DeepSeek其实远远不止报道的只有2000张卡,实际拥有约1万张A100。幻方量化在2023年接受36氪专访时透露,公司 ...
wjhqr 发表于 2025-2-5 18:38
蒸馏的是数据和逻辑,还需要算力来支撑嘛。
好比是拿到了别人的题库包括题目、解题思路和答案,你还需要 ...
wjhqr 发表于 2025-2-5 17:18
蒸馏是一方面,算力也是必须的,刚才问了一下deepseek:DS一共用了多少张A100卡?答复:DeepSeek(幻方) ...
通信人家园 (https://www.txrjy.com/) | Powered by C114 |