通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上等兵

注册:2022-4-24
跳转到指定楼层
1#
发表于 2023-12-26 11:37:31 |只看该作者 |倒序浏览
苹果和哥伦比亚大学的研究人员于今年 10 月低调地发布了一个名为 Ferret 的开源多模态大语言模型。该模型既能精准地识别图像并描述其内容,还能辨别和定位图像中的各种元素。Ferret 有 7B 和 13B 两个版本。此外,为了增强模型的能力,苹果专门收集了一个名为 GRIT 数据集。该数据集包含了 1.1M 个样本,涵盖丰富的层次空间知识。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可,没有受到太多关注。而随着日前苹果发表多篇变革性论文,宣布在 iPhone 上部署大语言模型方面取得了重大突破,AI 社区中的许多人才注意到 Ferret 的发布。

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-12-12 07:28 , Processed in 0.126303 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部