查看: 339|回复: 1

DeepSeek之后，一位清华学霸火了 [复制链接]

tayun

军衔等级：

上尉

注册：2015-11-14 点赞数

4

电梯直达

1^# 大中小

发表于 2025-2-19 17:11:36 |只看该作者 |倒序浏览

当DeepSeek刷新国产大模型性能天花板时，产业上下游的一次关键合闸，正悄然引爆更深的变革——潞晨科技宣布与华为昇腾联合推出DeepSeek-R1全栈式推理服务，这枚堪称"优化革命"的重磅弹药，将中国AI算力自主化的想象空间推向新高度。

01 清华极客破茧AI新极

当全球AI军备竞赛尚未燃起狼烟时，一位中国青年已悄然完成技术储备。潞晨科技创始人尤洋——这位拥有传奇学历背景的90后科技精英，在读书期间，就意识到到了“AI是未来，中国人要有自己的技术”。

尤洋在清华就读时，先后斩获校、市两级优秀毕业生桂冠和西贝尔奖学金（该系金额最高学术荣誉）。赴UC Berkeley深造期间，师从电子与计算机学院院长James Demmel院士的尤洋开启学术巅峰。他创纪录地在AAAI、ACL、IPDPS、ICPP四大顶会以领导者身份包揽最佳论文奖项。学术影响力更通过2020年全球HPC领域最高引用博士毕业生头衔印证，而ACM Doctoral Dissertation Award的提名，更是令他在81位伯克利顶尖博士中脱颖而出。

即便手握常春藤盟校教职邀约，尤洋最终选择在新加坡国立大学开辟新战场，成为该校计算机系首位华人"校长青年教授"。毕业后不久，AI的发展浪潮让尤洋看到了其中的创业机遇。在全球关注度最高的OpenAI未大展拳脚的阶段，尤洋就已经在大模型的路上走了很多年，并在2021年创立潞晨科技。

都说VC/PE的眼睛比鹰尖，得知尤洋创业，真格基金、创新工场、蓝驰创投、红杉中国、新加坡电信、大湾区基金、石溪资本、领沨资本、顺禧基金等知名投资机构纷纷递来橄榄枝 (根据天眼查信息)。融到A++轮，潞晨科技的投后估值就翻了超30倍，堪称“中国创投圈估值增速最快的AI初创公司之一。”

02 大模型时代的中国解法

提及为何与昇腾联手，尤洋表示，要“让更多人做出和部署自己的模型，让中国AI走向世界”。

这次Deepseek的爆火，无疑是打开了中国AI的市场空间。而这其中最大的变化，是打破了过去一贯认为的GPU对国产芯片在性能、性价比和利用率方面的碾压。潞晨与昇腾的这次合作，“更像是一个示范案例”，好的软件结合硬件，使得国产芯片的价值彻底发挥了出来。

在尤洋的规划蓝图中，双方联合发布的API、云镜像及推理一体机并非简单的产品矩阵，而是一场破壁实验：通过尽可能的把硬件优化到极致，补全国产芯片生态缺乏的关键软件和高性能算法，潞晨科技成功将DeepSeek系列模型与昇腾适配性进一步增强。尤洋坦言：“这是一件非常有意义的事，企业可以用更低的成本，做更多想做的模型，提升运营效率。” 以潞晨昇腾Deepseek一体机为例，实测数据显示，在华为800I A2集群上，性能最优的满血671BDeepseek-R1大模型可以达到近200名用户的并发，降低了企业部署的算力成本。

这组数据背后，是尤洋及潞晨团队多年来在算力优化这条道路上的不懈挑战与突围。在潞晨科技创立之初，便凭借Colossal-AI深度学习优化以同一举引发开源社区轰动，其中关键的LAMB优化技术，是微软、字节等巨头争相使用的大规模优化方案，被英伟达官方github认证“比业界最佳方案提速17倍”。但是将Colossal-AI运用在国产芯片上，却没有这么简单。受带宽和内存的限制，许多算法需要重新设计，来减少多机计算时的数据传输与通信开销。不过正是一次次克服这些难题与挑战，才让这个近4万人在Github上星标过的开源系统，成长为潞晨科技在算力优化路上的生态壁垒，为尤洋"大模型千人千面"的愿景筑牢地基。

谈及Colossal-AI，尤洋把它比喻成一个会不断吸收、迭代的大脑。尽管在这个细分领域，不论是在创业公司还是高校，都没有比Colossal-AI更大的生态，尤洋还是谦虚地表示“并不是想表达，我比微软、英伟达的人聪明，只是说我们用时间构建壁垒，得到了越来越多的客户认可”。

03 破解MaaS迷思

对于席卷行业的模型调用服务模式，尤洋展现出技术极客的犀利：“MaaS在中国短时间内可能是最差的商业模式。”

“大厂内卷太严重了，各大云公司，使用满血版的DeepSeek-R1，每百万token官方也只能收到16元。如果满血版的DeepSeek-R1每日输出1000亿token的话，那么，如果我们选取英伟达H800服务器，按照每台机器每月7.5万元的费用，每月的机器总成本是4.5亿，亏损4亿，用户越多，亏损越多。”在算力军备竞赛白热化阶段，这道算术题戳破了MaaS服务商的商业幻象。北京八友科技创始人兼CEO梁斌也曾在微博上测算如果用最优的AMD机器，每月营收4500万元的机器成本是3.6亿，跟尤洋的估算大致相似。相比于将MaaS的商业模式，尤洋更看好定制企业或应用专属模型这一市场。尤洋向我们分享了两个例子：一个是李飞飞团队通过不到50美元的算力费用，成功训练出了与Open-AI O1和Deepseek-R1推理能力类似的顶级模型；另一个是来自UC伯克利的团队通过4500美元成功训出DeepScale-1.5B-Preview，能力超越OpenAI的o1-preview。尤洋判断，未来很多企业都会选择使用低成本的强化学习、模型蒸馏、快速微调等手段，打造企业的专属模型。通过将企业宝贵的私有数据和资源融入模型，可以让专属模型达到更高的水平。他预计在未来，这个赛道将会越来越重要，而这，恰好是潞晨科技最擅长部分。

在这方面，尤洋和潞晨科技早已做了许多探索。作为AI Infra公司商业化的重要一环，云算力与优化帮助潞晨在国内拿下了上千家付费客户。尤洋的野心不止如此。在国内潞晨云的商业模式经过验证后，团队迅速将其扩展至全球多个国家，营收几乎呈线性增长。可能正因如此，在同行谨慎谈收入的AI创业早期，这家公司才有底气以近乎"叛逆"的姿态公布商业底牌。据潞晨科技2024年财报显示，公司实现营收（合同）7700万元，营收（确认）4800万元。

提到这不同寻常的公开，尤洋高兴地表示，把Colossal-AI做成软件形态后，大量客户愿意采购潞晨的产品，“我们的员工也在提升工作效率，用员工数量1.8倍的增长，换来2.8倍的营收增长。我们的商业模式走通了，就公开了财务数据，客户信赖我们，大家很喜欢我们创造的AI生态，愿意付费。”

04 视频宇宙的"中国变量"

在我们以及大众的印象中，作为AI Infra的明星企业，潞晨科技一直是专注于to B的业务。然而，从去年开始，潞晨却推出了视频大模型系列，并从Open-Sora一步步迭代出Video Ocean这一风靡全球的产品。

对于我们的好奇，尤洋拿出了“世界模型”这个概念进行解答。在他的描述中，“世界模型”就是能生成任何想要的影视广告、教育、科学、娱乐，甚至物理模拟的工具。而在尤洋眼中，“世界模型”的基础就是视频。同OpenAI的CEO一样，尤洋很赞同现在是视频大模型GPT-1时刻这一观点。此时此刻，正如彼时彼刻，视频模型的价值是“无法想象的巨大”，而未来的三至五年，训出优质的视频大模型无疑是该领域最重要的事情。

这个观点有一部分来自于尤洋自身对视频的喜爱，但是更多的还是他所看重的视频足够大的商业想像空间以及潞晨团队的适配性。用尤洋的原话描述是“我们太适合去做了”。究竟有多适合呢？看看Video Ocean目前取得的成就一切就很清晰了。大洋彼岸，美国的Snapchat在训练视频大模型时使用了潞晨团队的LAMB优化技术。“Snapchat的成功，对我们来说是一个很好的背书”，能够更快更好地训练视频模型，使团队在做Video Ocean时有巨大优势。

与剪映等工具不同，Video Ocean选择更底层的突破路径：借由"一句话生成4K电影级画面"的能力，尤洋将它定位为“未来的相机”。先用相机去拍原始素材，再用大模型生成这些素材，然后放到剪映等软件中去加工。通过这一路径，尤洋为Video Ocean的发展制定了三个阶段：第一阶段，用户群体集中于C端个人。第二阶段，用户群体是抖音/YouTube博主和电商博主这类小B。第三阶段的用户则是广告工作室和制片公司这类大B。

除了巨头公司对Video Ocean技术的认可外，用户层面Video Ocean也收获了很多粉丝。在北美Product Hunt榜单中，Video Ocean一经发布便取得了前三的好成绩。而在V2.0发布时，热度甚至比之前更高。采访时我们了解到，Video Ocean马上要迎来一次小更新，让我们拭目以待。

纵观中国创业史，新兴行业、A+轮，初创期就商业化并发布扰动全球的产品，多少有些不可思议。在投资家网过往对话的创业者里，没人跟尤洋“相似”。科技行业细分领域早期，把技术、产品做到出类拔萃的，不少。但做到扰动全球又赚钱的，几乎没有。

现在，尤洋算一个。

来源：36kr

本主题由版主或管理员于 2025-2-19 17:44 审核通过

0 举报本楼

本帖有 1 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-2-22 09:40 , Processed in 0.158903 second(s), 17 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册