1、-1-2024 年 9 月 9 日第30期总第 656 期2024年人工智能指数报告年人工智能指数报告【译者按】2024 年 4 月,斯坦福大学发布 2024 年人工智能指数报告。该报告在全球范围内具有极高的影响力,是美国、英国和欧盟等经济体政策制定者的重要参考资料。斯坦福大学已连续 7 年发布人工智能指数报告,今年发布的报告是迄今为止最全面的版本,梳理总结了人工智能的研发、技术性能、负责任的人工智能、经济、科学与医学、教育、政策与治理、舆论等方面的进展情况,分析了人工智能技术进步、公众对人工智能技术的看法以及人工智能发展的地缘政治动态等重要趋势。赛迪智库知识产权所和政策法规所对该报告进行了编
2、译,期望对我国相关决策部门提供参考和借鉴。【关键词】人工智能模型专利政策监管人工智能模型专利政策监管-2-一、研究与开发(一)出版物(一)出版物1.从从 2010 年到年到 2022 年,全球人工智能出版物总数年,全球人工智能出版物总数1增加两倍,机器学习领域出版物自增加两倍,机器学习领域出版物自 2015 年以来增长近七倍年以来增长近七倍从 2010 年到 2022 年,人工智能出版物总数增加近两倍,从2010 年约 88000 篇增加到 2022 年 240000 多篇。过去十年,机器学习领域出版物增长最为迅猛(见图 1),自 2015 年以来增长近七倍。继机器学习之后,2022 年人工智
3、能领域发表出版物最多的是计算机视觉(21309 篇)、模式识别(19841 篇)和流程管理(12052 篇)。图1:2010-2022年按研究领域分列的人工智能出版物数量(不含其他人工智能)人工智能出版物数量(单位:千篇)72.23,机器学习21.31,计算机视觉19.84,模式识别12.05,流程管理10.39,计算机网络9.17,控制理论8.31,算法7.18,语言学6.83,数学优化资料来源:安全与新兴技术中心,2023 年|图表:2024 年人工智能指数报告1今年的出版物数据来自 CSET。自上一次人工智能指数(2023 年)收录 CSET 的数据以来,CSET 用于人工智能出版物分类
4、的方法和数据来源都发生了变化。因此,今年报告的数字与去年报告的数字略有不同。此外,由于人工智能相关出版数据的更新有很大的滞后性,因此只提供到 2022 年的全部数据。建议读者谨慎对待出版数据。-3-2.学术界是过去十年间全球所有地区人工智能研究主要来源学术界是过去十年间全球所有地区人工智能研究主要来源2022 年,大部分人工智能出版物(81.1%)出自学术界,而学术界也是过去十年间全球所有地区人工智能研究主要来源(见图 2)。图 2:2010-2022 年按部门分列的人工智能出版物(占总数百分比)人工智能出版物(占总数百分比)81.07%,教育7.89%,工业6.97%,政府2.62%,非营利
5、组织1.46%,其他资料来源:安全与新兴技术中心,2023 年|图表:2024 年人工智能指数报告(二)专利(二)专利1.近十年,人工智能专利数量显著增加,且全球已授权的人工智能专利大部分来自中国和美国近十年,人工智能专利数量显著增加,且全球已授权的人工智能专利大部分来自中国和美国过去十年,人工智能专利数量显著增加。如 2010 年至 2014年间,人工智能专利授权总量增长了 56.1%;仅从 2021 年到 2022年,人工智能专利数量就增长了 62.7%。截至 2022 年,全球大部分已授权的人工智能专利(75.2%)来自东亚和太平洋地区(见图 3),其次是北美洲,占 21.2%。按地理区
6、域划分,全球已授-4-权的人工智能专利大部分来自中国(61.1%)和美国(20.9%)。图 3:2010-2022 年按地区分列的人工智能专利授权量(占全球总量百分比)人工智能授权专利数量(占全球总量百分比)75.20%,东亚和太平洋地区21.21%,北美洲2.33%,欧洲和中亚0.68%,世界其他地区0.23%,南亚0.21%,拉丁美洲及加勒比地区0.12%,撒哈拉以南非洲0.03%,中东和北非资料来源:安全与新兴技术中心,2023 年|图表:2024 年人工智能指数报告(三)前沿人工智能研究(三)前沿人工智能研究1.自自 2014 年起,产业界开始引领机器学习模型发展年起,产业界开始引领机
7、器学习模型发展2023 年,产业界推出了 51 个著名机器学习模型,而学术界只有 15 个。值得注意的是,2023 年有 21 个著名模型是由产业界/学术界合作产生的,创下新高。创建尖端的人工智能模型需要大量的数据、计算能力和财政资源,产业界的主导地位日益增强。2.2023 年,著名机器学习模型总数年,著名机器学习模型总数2排名前三的国家分别为美国、中国和法国排名前三的国家分别为美国、中国和法国2如果介绍机器学习模型的论文中至少有一位作者与某个国家的机构有关联,那么该模型就被认为与该国家有关。如果一个模型的作者来自多个国家,则可能出现重复计算的情况。-5-2023 年,美国以 61 个著名机器
8、学习模型遥遥领先,中国以15 个紧随其后,法国以 8 个紧随其后。自 2003 年以来,美国生产的模型数量超过了英国、中国和加拿大等其他主要地区。自2019 年以来,欧盟和英国首次在生产的著名人工智能模型数量上超过中国(见图 4)。图 4:2003-2023 年按选定地理区域分列的著名机器学习模型数量著名机器学习模型数量61,美国25,欧盟和英国15,中国来源:Epoch,2023 年|图表:2024 年人工智能指数报告3.机器学习模型中的参数是在训练过程中学习到的数值,参数较多的模型通常优于参数较少的模型机器学习模型中的参数是在训练过程中学习到的数值,参数较多的模型通常优于参数较少的模型自
9、2010 年代初以来,Epoch 数据集中机器学习模型参数总数急剧上升,这反映了人工智能模型设计任务的日益复杂性、数据可用性的提高、硬件的改进以及大型模型经证实的有效性。高参数模型在工业领域尤为突出,这表明 OpenAI、Anthropic 和谷歌-6-等公司有能力承担海量数据训练的计算成本。图 5:2003-2023 年按行业分列的著名机器学习模型参数数量参数数量(对数标度)学术界工业界产学合作研究集体合作政学合作产研集体合作政府出版日期资料来源:Epoch,2023 年|图表:2024 年人工智能指数报告4.模型的复杂程度和训练数据集的大小会直接影响所需的计算量。模型越复杂,底层训练数据越
10、大,训练所需的计算量就越大。模型的复杂程度和训练数据集的大小会直接影响所需的计算量。模型越复杂,底层训练数据越大,训练所需的计算量就越大。最近,著名人工智能模型的计算用量呈指数级增长,3这一趋势在过去五年尤为明显。计算需求的快速增长具有重要影响,如需要更多计算的模型通常会对环境造成更大的影响,而公司通常比学术机构更容易获得计算资源。图 6 显示了自 2012 年以来著名机器学习模型的训练计算量,如2017年发布的原始Transformer3FLOP 代表“浮点运算”。浮点运算是涉及浮点数的单一算术运算,如加法、减法、乘法或除法。处理器或计算机每秒可执行的 FLOP 数量是其计算能力的指标。FL
11、OP 率越高,计算机的计算能力就越强。一个人工智能模型的 FLOP率越高,说明它在训练过程中需要更多的计算资源。-7-需要约 7400 每秒千万亿次浮点运算;谷歌的 Gemini Ultra 是目前最先进的基础模型之一,需要 500 亿每秒千万亿次浮点运算。图 6:2012-2023 年按领域分列的著名机器学习模型的训练计算量训练计算量(每秒千兆次浮点运算对数标度)语言视觉多模态出版日期来源:Epoch,2023 年|图表:2024 年人工智能指数报告二、技术性能(一)时间轴:重要模型发布(一)时间轴:重要模型发布根据人工智能指数指导委员会的选择,以下是 2023 年发布的一些最重要的模型(见
12、表 1)。表 1:2023 年发布的部分重要模型日期模型类型创作者重要意义图片2023 年 3月 14 日Claude大型语言模型AnthropicClaude 是 Anthropic(OpenAI 的主要竞争对手之一)首次公开发布的大型语言模型。Claude 的设计宗旨是尽可能实用、诚实和无害。资料来源:Anthropic,2023 年-8-2023 年 3月 14 日GPT-4大型语言模型OpenAIGPT-4 在 GPT-3 的基础上进行了改进,是迄今为止功能最强大、能力最强的大型语言模型之一,在许多基准测试中的性能都超过了人类。资料来源:Medium,2023 年2023 年 3月 2
13、3 日StableDiffusionv2文本到图像模型Stability AIStable Diffusion v2 是Stability AI 现有文本到图像模型的升级版,可生成分辨率更高、质量更优的图像。资料来源:Stability AI,2023 年2023 年 4月 5 日SegmentAnything图像分割MetaSegment Anything 是一个人工智能模型,能够利用零镜头泛化技术分离图像中的物体。资料来源:Meta,2023 年2023 年 7月 18 日Llama 2大型语言模型MetaLlama 2 是 Meta 旗舰产品大型语言模型的升级版本,采用开放源代码。其较小
14、的变体(7B 和 13B)具有相对较高的性能。资料来源:Meta,2023 年。2023 年 8月 20 日DALL-E3图像生成OpenAIDALL-E3 是 OpenAI 现有文字视觉模型 DALL-E 的改良版。资料来源:OpenAI,2023 年2023 年 8月 29 日SynthID水印谷歌、DeepMindSynthID 是一款对人工智能生成的音乐和图像进行水印处理的工具。它的水印即使在图像更改后仍能被检测到。资料来源:DeepMind,2023 年2023 年 9月 27 日Mistral7B大型语言模型Mistral AIMistral 7B 是法国人工智能公司 Mistra
15、l 推出的一款紧凑型 70 亿参数机型,其性能超过了 Llama 213B,在同类产品中尺寸排名第一。资料来源:Mistral AI,2023 年2023 年10 月 27日Ernie 4.0大型语言模型百度中国跨国科技公司百度推出了文心大模型 4.0,这是迄今为止成绩最好的中国大型语言模型。资料来源:美通社,2023 年2023 年11 月 6 日GPT-4Turbo大型语言模型OpenAIGPT-4 Turbo 是一款升级版的大型语言机型,拥有128K 上下文窗口并降低了价格。资料来源:Tech.co,2023 年-9-2023 年11 月 6 日Whisperv3语音到文本OpenAIW
16、hisper v3 是一个开源的语音到文本模型,以其更高的准确性和更广泛的语言支持而著称。资料来源:人工智能业务,2023 年2023 年11 月 21日Claude2.1大型语言模型AnthropicAnthropic 的最新大型语言模型 Claude2.1 具有业界领先的 200K 上下文窗口,增强了其处理长篇文学作品等大量内容的能力。资料来源:Medium,2023 年2023 年11 月 22日Inflection-2大型语言模型InflectionInflection-2 是由DeepMind 的 MustafaSuleyman 创办的新创公司 Inflection 推出的第二个大型语言模型。Inflection-2 的推出凸显了大型语言模型领域日益激烈的竞争。资料来源:Inflection,2023 年2023 年12 月 6 日Gemini大型语言模型谷歌Gemini是GPT-4的有力竞争者,其变种之一 GeminiUltra 在许多基准测试中都胜过 GPT-4。资料来源:Medium,2023 年2023 年12 月 21日Midjourney v6文本到图像模型Mid