通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  中校

注册:2015-11-149
跳转到指定楼层
1#
发表于 2025-4-8 20:02:23 |只看该作者 |倒序浏览

最新发布的《2025人工智能指数报告》显示,人工智能领域正日趋成熟:AI优化技术持续进步,但与此同时,该技术的应用与滥用也呈现出泛滥态势。

报告于2025年4月7日发布,由斯坦福大学以人为本人工智能研究院(HAI)发起,由来自学术界和产业界的跨学科专家组成的AI指数指导委员会主导编制。

该报告持续追踪人工智能领域多项关键进展,主要包括:年度重大技术突破、基准测试新纪录、生成式AI投资动向、教育领域应用趋势、技术监管立法进程等核心维度

以下是来自该报告的10个核心要点:

01.小模型迎来性能突破

2022年时,能在MMLU多任务语言理解基准测试中达到60%准确率的最小模型是拥有5400亿参数的PaLM。

而到2024年,微软仅38亿参数的Phi-3-mini模型就实现了同等表现,两年间模型体积缩小了142倍。



02.模型使用成本骤降

对于MMLU测试中达到GPT-3.5水平(64.8%准确率)的模型,单次百万token查询成本从2022年11月的20美元,暴跌至2024年10月的0.07美元(Gemini-1.5-Flash-8B模型),18个月内降幅超280倍。不同任务的LLM推理价格年降幅达9-900倍不等



03.中国模型迎头赶上

美国虽仍保持顶尖AI模型数量优势(2024年40个重要模型 vs 中国15个/欧洲3个),但中国模型在质量上快速逼近。

在MMLU、HumanEval等核心基准测试中,中美模型性能差距已从2023年的两位数百分比缩小至2024年的毫厘之间。中国在AI论文发表量和专利数量上持续领跑全球



04.AI滥用事件激增

根据AI事件数据库(AI Incidents Database)统计,2024年AI相关危害事件达233起,创历史新高,较2023年暴增56.4%。典型案例包括深度伪造私密影像、涉嫌导致青少年自杀的聊天机器人等。虽非全貌,但问题激增态势令人震惊。



05.Agent实用性突破  

AI Agent展现初步潜力。2024年推出的RE-Bench为评估Agent复杂任务设立了严格基准:在短时任务(2小时)中,顶级AI系统表现超人类专家4倍;但在长时任务(32小时)中,人类反超AI达2倍优势。

值得注意的是,AI已在特定领域(如编写特定代码)达到专家水平,且效率更高



06.AI投资额飙升  

2024年美国私营领域AI投资高达1090亿美元,几乎是中国(93亿美元)的12倍、英国(45亿美元)的24倍。

在生成式AI领域差距更为显著:美国投资额超出欧盟与英国总和255亿美元,较2023年的211亿美元差距进一步扩大。



07.企业加速拥抱AI技术  

企业正在转向AI。2024年,报告使用AI的受访者比例从2023年的55%跃升至78%。更值得注意的是,将生成式AI应用于至少一项业务职能的企业比例实现翻倍增长,从33%激增至71%



08.医疗AI产品迎来审批爆发   

FDA批准的AI医疗设备数量呈现指数级增长。自1995年首个AI医疗设备获批后,2015年仅累计批准6个,而到2023年这一数字已飙升至223个,展现出医疗AI应用的加速普及态势。



09.美国AI监管:州政府主导推进   

在联邦立法进展缓慢的背景下,美国各州正成为AI监管的主力军。2016年全美仅通过1项州级AI相关法案,到2023年增至49项。

而过去一年间,这一数字更是翻倍增长至131项。尽管联邦层面提出的AI法案数量也有所增加,但实际通过率仍然偏低。



10.亚洲对AI持更多乐观态度   

全球对AI的接受度呈现明显地域差异:在中国(83%)、印尼(80%)和泰国(77%),绝大多数民众认为AI产品利大于弊;而在加拿大(40%)、美国(39%)和荷兰(36%),持此乐观态度的民众比例不足半数。



原文来源于:

1.https://hai.stanford.edu/ai-index/2025-ai-index-report


来源:36kr

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-4-16 12:53 , Processed in 0.173068 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部