只需一步,快速开始
短信验证,便捷登录
军衔等级:
三级军士长
西风 发自 凹非寺 量子位 | 公众号 QbitAI
从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将其压缩到4-bit时,知识又重新出现了。 这让人不禁想知道在压缩/量化步骤中到底丢失了什么信息。
可能这些知识从未真正丢失,只是被隐藏了。 如果我们把神经网络看作是代码,权重就是源代码,微调实际上可能有效地修改了这些代码,以阻止返回某些结果。 因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消失,它们太微小而无法保留。
0 举报本楼
发表回复 回帖后跳转到最后一页
手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图
GMT+8, 2024-12-12 05:29 , Processed in 0.245851 second(s), 16 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed