通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  少将

注册:2015-1-2880
跳转到指定楼层
1#
发表于 2024-7-10 12:09:08 |只看该作者 |倒序浏览
快科技7月10日消息,近日,壁仞科技副总裁兼AI软件首席架构师丁云帆在谈及计算瓶颈时表示,解决算力瓶颈问题需要从三个维度考虑:硬件集群算力、软件有效算力、异构聚合算力。

他认为,做好这三个维度的工作,即使国产AI芯片单个算力不强,也能通过综合手段提升算力,满足国内大模型训练的需求。

“我们2020年设计的第一代产品里就做了chiplet架构,国外巨头在今年发布的产品如英伟达B100和英特尔Gaudi 3也采用了同样的思路,他们用最先进的制程,但也需要chiplet来突破摩尔定律限制来提升单卡算力。”丁云帆说道。

据他介绍,壁仞科技用三级的异步checkpoint技术,结合GPU的显存和CPU内存,甚至是多节点内存的备份系统去达到一个平衡,目前已能够大幅降低故障恢复成本。

之前,壁仞科技发布首款通用GPU芯片BR100,创下全球算力纪录,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。

当时,壁仞科技给出的数据显示,其首款旗舰产品BR100对比英伟达在售的旗舰GPU峰值算力在Int8、BF16、TF32/TF32+、FP32数据格式下最少有3.3倍的峰值性能优势,在FP32数据格式下性能优势更是达到了13.1倍。


举报本楼

本帖有 7 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-26 10:37 , Processed in 0.097808 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部