刚刚,李飞飞团队发布《2025年人工智能指数报告》:12大趋势证明,AI不再只是关于可能性的故事

科技小艾灵 2025-04-08 收藏 0 评论 0

刚刚,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025 年人工智能指数报告》(Artificial Intelligence Index Report 2025)。

这份长达 456 多页的报告是 Stanford HAI 发布的第 8 份 AI Index 研究,追踪了 2024 年全球人工智能(AI)行业的发展趋势。

今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算,以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据,并扩大了对 AI 在科学和医学中日益重要作用的报道。


完整报告:

https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

Stanford HAI 在官方网站上写道,“AI 对社会的影响从未如此明显......2025 年指数是我们迄今为止最全面、也是在这一重要时刻发布的报告。”

他们还认为,“AI 将是 21 世纪最具变革性的技术。然而,除非我们精心引导 AI 行业的发展,否则这项技术将难以惠及普罗大众。”

这份新报告揭示了 2024 年 AI 行业的 12 大趋势:

1.AI 在苛刻基准上的表现持续提升

2023 年,研究人员引入了新的基准——MMMU、GPQA 和 SWE-bench,以测试高级 AI 系统的极限。仅仅一年后,性能大幅提升:在 MMMU、GPQA 和 SWE-bench 上的得分分别提高了 18.8、48.9 和 67.3 个百分点。在基准测试之外,AI 系统在生成高质量视频方面也取得了重大进展,在某些场景下,语言模型智能体(language model agents)甚至在有限时间预算的编程任务中超越了人类。


图|选择的 Al 指数技术性能基准 vs. 人类表现

2.AI 正越来越多地融入到日常生活中

从医疗保健到交通运输,AI 正迅速从实验室走向日常生活。2023 年,FDA 批准了 223 种 AI 医疗设备,而 2015 年仅为 6 种。在道路上,自动驾驶汽车不再是实验性的:美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶出行,而百度的经济型“萝卜快跑” (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。


图|FDA 批准的 AI 医疗设备数量(1955-2023)

3.企业全力投入 AI,推动投资和使用创历史新高

2024 年,美国私营部门对 AI 的投资增长到 1091 亿美元——几乎是中国(9.3 亿美元)的 12 倍,是英国(4.5 亿美元)24 倍。生成式 AI 尤其强劲,全球吸引私营投资 339 亿美元——比 2023 年增长 18.7%。AI 的商业应用也在加速:2024 年,78% 的组织报告称在使用 AI,比前一年增长 55%。同时,越来越多的研究证实,AI 提高了生产力,在大多数情况下,有助于缩小劳动力中的技能差距。


图|2017-2024 年,表示其所在组织至少在一项职能中使用 AI 的受访者比例

4.在创造顶级 AI 模型方面,中国正在缩小与美国的差距

2024 年,美国机构推出了 40 个引人注目的 AI 模型,显著超过中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先,但中国模型在质量上迅速缩小了差距:在 MMLU 和 HumanEval 等主要基准上的性能差异从 2023 年的两位数缩小到 2024 年的接近相等。同时,中国在 AI 出版物和专利方面继续领先。与此同时,模型开发越来越全球化,中东、拉丁美洲和东南亚等地区也推出了引人注目的新模型。


图|美国顶尖模型与中国顶尖模型在 LMSYS 聊天机器人竞技场中的表现

5.负责任的 AI 生态系统不断发展,但不均衡

人工智能相关事件急剧上升,但在主要工业模型开发者中,标准化的 RAI 评估仍然很少。然而,新的基准如 HELM Safety、AIR-Bench 和 FACTS 为评估事实性和安全性提供了有希望的工具。在公司中,识别 RAI 风险和采取有意义的行动之间存在差距。相比之下,政府表现出更大的紧迫性:2024 年,全球在人工智能治理方面的合作加强,包括经合组织、欧盟、联合国和非盟在内的组织发布了关注透明度、可信度和其他核心负责任人工智能原则的框架。


图|已公布的针对热门基础模型的安全性和负责任 AI 基准

6. 全球 AI 乐观情绪上升,但地区间深层次分歧依然存在

在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家的大多数人认为,人工智能产品和服务是利大于弊的。相比之下,加拿大(40%)、美国(39%)和荷兰(36%)等地的乐观情绪仍然远低于其他国家。然而,情绪正在转变:自 2022 年以来,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)在内的几个先前持怀疑态度的国家,乐观情绪显著增长。


图 | 2022-2024 年,按国家划分认为“使用 AI 的产品和服务利大于弊”的比例

7.AI 变得更加高效、经济实惠和易于获取

由越来越强大的小型模型驱动,在达到 GPT-3.5 水平上的系统推理成本在 2022 年 11 月到 2024 年 10 月间下降了 280 倍。在硬件层面,成本每年下降 30%,而能效每年提高 40%。开放权重模型也在缩小与封闭模型的差距,在某些基准测试中,一年内性能差异从 8%减少到仅 1.7%。这些趋势共同迅速降低了高级人工智能的门槛。


图 | 2022-2024 年,在 MMLU 中得分超过 60% 的最小规模 AI 模型

8.各国政府正在加强对 AI 的监管和投资

2024 年,美国联邦机构出台了 59 项与 AI 相关的法规,是 2023 年的两倍多,发布法规的机构数量也是 2023 年的两倍。在全球范围内,自 2023 年以来,75 个国家的 AI 立法提及率上升了 21.3%,自 2016 年以来增长了 9 倍。在日益受到关注的同时,各国政府也在进行大规模投资:加拿大承诺投资 24 亿美元,中国启动了 475 亿美元的半导体基金,法国承诺投资 1090 亿欧元,印度承诺投资 12.5 亿美元,沙特阿拉伯则发起了一项 1000 亿美元的倡议。


图 | 部分供应商的顶尖模型在 LSYS 聊天机器人竞技场中的表现


9.AI 和计算机科学教育正在扩大,但普及程度仍不够

如今,已有 2/3 的国家提供或计划提供 K-12 计算机科学教育,是 2019 年的两倍,其中非洲和拉丁美洲取得的进展最大。在美国,拥有计算机学士学位的毕业生人数在过去 10 年中增加了 22%。然而,在许多非洲国家,由于电力等基础设施的不足,获得计算机学位的机会仍然有限。在美国,81% 的 K-12 计算机科学教师表示,AI 应该成为计算机科学基础教育的一部分,但只有不到一半的教师认为自己有能力教授 AI。

10.工业界依然一路领先

2024 年,近 90% 的著名人工智能模型来自工业界,高于 2023 年的 60%,而学术界仍然是高引用率研究的首要来源。模型规模持续快速增长——训练计算每 5 个月翻一番,数据集每 8 个月翻一番,耗电量每年翻一番。然而,性能差距正在缩小:排名第一和第十的模型之间的得分差距在一年内从 11.9% 降至 5.4%,排名前两位的差距现在仅为 0.7%。前沿领域的竞争越来越激烈。


图|AlphaFold 3 与用于蛋白质 - 配体对接的基线方法的性能对比


11.AI 因其对科学的影响而斩获最高荣誉

AI 的重要性与日俱增,这一点从重大科学奖项中就可见一斑:两项诺贝尔奖表彰了 AI 在深度学习(物理学)和蛋白质折叠(化学)中的应用,而图灵奖则表彰了 AI 在强化学习方面的开创性贡献。


图|PlanBench 基准下正确的实例数量


12.复杂推理仍是一项挑战

人工智能模型在国际数学奥林匹克竞赛问题等任务中表现出色,但在 PlanBench 等复杂推理基准测试中仍然面临挑战。即使存在可证明正确的解决方案,它们也常常无法可靠地解决逻辑任务,这限制了它们在精度至关重要的高风险环境中的有效性。


附:来自 AI Index 联合主任 Yolanda Gil 和 Raymond Perrault 的一封信


随着人工智能不断重塑我们的生活、企业界和公共讨论,AI Index 将继续跟踪其进展--提供一个独立的、数据驱动的视角,跨越时间和地域,观察人工智能的发展、应用和影响。




对于人工智能来说,2024 年是多么美好的一年。诺贝尔物理学奖和化学奖,以及因强化学习方面的奠基性工作而获得的图灵奖,都体现了对人工智能在推动人类知识进步方面作用的认可。曾经困难重重的图灵测试已不再被视为一个难以挑战的目标,今天的尖端系统已经超越了它。与此同时,人工智能的应用正以前所未有的速度加速发展,数以百万计的人们正经常在专业工作和休闲活动中使用人工智能。随着高性能、低成本和开放模型的普及,人工智能的可及性和影响力必将进一步扩大。




在经历了短暂的放缓之后,企业对人工智能的投资出现反弹。新近获得融资的生成式人工智能初创企业数量增加了近两倍,在经过多年的低迷之后,企业采用人工智能的速度在 2024 年显著加快。人工智能已从边缘领域成为商业价值的核心驱动力。




政府也在加大参与力度。政策制定者们不再只是在讨论人工智能,而是在投资人工智能。一些国家启动了价值十亿美元的国家人工智能基础设施计划,包括扩大能源能力以支持人工智能发展的重大努力。全球协调不断加强,地方倡议也初具规模。




然而,信任仍是一大挑战。越来越少的人相信人工智能公司会保护他们的数据,对公平性和偏见的担忧依然存在。错误信息继续构成风险,尤其是在选举和深度伪造泛滥的情况下。对此,各国政府正在推进新的监管框架,旨在促进透明度、问责制和公平性。公众的态度也在转变。虽然怀疑的态度依然存在,但 2024 年的一项全球调查显示,人们对人工智能带来广泛社会效益的潜力的乐观态度明显上升。




人工智能不再只是一个关于可能性的故事,而是一个关于现在正在发生的事情,以及我们如何共同塑造人类未来的故事。



全部评论 0

小艾灵 1541篇文章

热门推荐