查看: 1129|回复: 5

DeepSeek-R1发布:比肩 o1价格打骨折 [复制链接]

ttxx

军衔等级：

上尉

注册：2010-4-28 点赞数

10

电梯直达

1^# 大中小

发表于 2025-1-22 09:36:32 |只看该作者 |倒序浏览

DeepSeek-R1 正式版重磅发布，为开放 AI 领域注入一股强劲动力！不仅在性能上与 OpenAI 的旗舰模型 o1 不相上下，更重要的是它完全开源，并附带详细的技术报告，真正做到了开放与透明

亮点一：性能卓越，媲美 OpenAI-o1

DeepSeek-R1 在各种任务上都展现出了惊人的实力，尤其是在数学、代码和推理任务方面，其表现完全可以与 OpenAI-o1 比肩。这意味着开发者和研究人员可以利用 DeepSeek-R1 进行各种复杂的应用开发和前沿研究

亮点二：完全开源，MIT 许可，自由使用

DeepSeek-R1 采用 MIT 许可协议，这意味着任何人都可以自由地使用、修改、分发和商业化该模型，包括模型权重和输出。这一举措彻底打破了以往大型语言模型被少数公司垄断的局面，真正将 AI 技术的力量交到了广大开发者和研究人员的手中，这意味着社区可以更加清晰地了解模型的使用权限，更加自由地利用模型权重和输出进行二次开发，包括微调和蒸馏（但必须在所有副本中保留原始的版权声明和 MIT 许可声明）

亮点三：开源蒸馏模型，赋能社区

除了 DeepSeek-R1 本身，该团队还开源了 6 个从 DeepSeek-R1 蒸馏而来的小型模型。其中，32B 和 70B 模型的性能同样可以与 OpenAI-o1-mini 相媲美。这些小型模型的开源，进一步降低了 AI 应用的门槛，让更多开发者可以参与到 AI 创新中来，极大地赋能了整个开源社区

亮点四：大规模 RL 后训练，显著提升性能

DeepSeek-R1 的一大技术亮点在于其采用了大规模强化学习 (RL) 进行后训练。这项技术仅需少量标注数据，即可显著提升模型的性能，为大型语言模型的训练提供了新的思路。更多技术细节，可查阅官方技术报告：https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

亮点五：开放 API 访问，价格实惠

DeepSeek-R1 已开放 API 访问，开发者可以通过设置<code>model=deepseek-reasoner</code>来使用。定价方面也相当亲民：价格直接把o1按在地上摩擦

缓存命中：$0.14 / 百万输入 tokens
缓存未命中：$0.55 / 百万输入 tokens
输出：$2.19 / 百万输出 tokens

详细的 API 使用指南，请参考：

https://api-docs.deepseek.com/guides/reasoning_model

DeepSeek-R1 的发布是开放 AI 领域的一件大事。它不仅在性能上达到了业界领先水平，更重要的是其完全开源的精神，将极大地推动 AI 技术的普及和发展。DeepSeek 团队通过开源模型、技术报告和 API 访问，真正做到了将 AI 的力量交给了社区，为构建一个更加开放、包容的 AI 未来做出了重要贡献

星标AI寒武纪，好内容不错过

用你的赞和在看告诉我～

求赞

来源：网易

本主题由版主或管理员于 2025-1-22 09:39 审核通过

0 举报本楼

本帖有 5 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-4-20 15:24 , Processed in 0.156131 second(s), 17 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册