通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上校

注册:2015-1-2852
跳转到指定楼层
1#
发表于 2023-12-26 14:45:05 |只看该作者 |倒序浏览
据华为RL(强化学习)团队负责人Haitham Bou Ammar于社交平台X发文,来自华为诺亚方舟实验室、伦敦大学学院(UCL)、牛津大学的团队于23日发表论文,提出了一种通用框架模型盘古Agent,用于将结构化推理整合到AI Agents的政策中并进行学习。据介绍,该框架利用内在和外在函数的构建,增加了对推理结构的理解,还提供了在每个模块或功能内部学习模型的自适应能力。
论文地址:arxiv.org/abs/2312.14878



举报本楼

本帖有 7 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-5-20 16:22 , Processed in 0.105438 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部