2023年中国人工智能产业研究报告(VI)
来源:爱游戏官方网站入口    发布时间:2024-04-20 14:43:01

  能够制造并使用工具成为人类进化史上一道显著的分水岭,而当下怎么样更好的使用AI工具已然成为人类在产业应用、生产生活与学习工作中的热门议题。随着大模型、生成式AI技术的到来,其强大的数据处理、学习泛化与内容生成能力,高质效加速了各行各业人工智能技术的赋能进程,为AI可赋能的场景领域、扮演角色提供更多创新性与可能性。AI应用正加速扩散,渗透到办公、设计、传媒、法律、游戏、教育、汽车等多领域。对此,艾瑞AI研究团队延续既往5年对AI行业的市场研究,聚焦AI产业发展进程、发展征程、发展旅程的各个发展阶段,集中探讨中国人工智能产业的发展环境、市场动态、产业机会、发展监管等核心要点,为市场提供有公信力、受到广泛认可的数据与观点。

  在人工智能发展历程中,2023年必将被载入史册。相比前代AI,具备高可用性、高拟人化的预训练大模型跨越技术奇点,国内外技术公司、高校、研究院的语言、图像、视频、音频大模型在2023年以极快的速度相继推出和迭代,基于预训练大模型的应用在全球范围内产生了爆炸式的影响,从社会群众到AI从业者,对人工智能技术能够带来的生产生活变革,都实现了颠覆性的再认识。艾瑞通过技术本身、应用变体、算力支持、政策监管和国际局势五个维度,对2023年AI世界的发展进行全面梳理和俯瞰。

  2028年中国人工智能产业规模将超8000亿元,五年复合增长率达到30.6%

  根据艾瑞咨询研究院测算,2023年中国人工智能产业规模已达到2137亿元,大模型带来的底层技术革新将为中国人工智能产业的规模增长带来更多存量扩张与增量空间。2028年,中国人工智能产业规模将达到8110亿元。对比原本大模型未出现涌现能力的人工智能产业规模值,艾瑞测算,大模型带来的产业加成比例在2028年或达到32.9%,在语言语音模态规模加成最为显著。未来大语言模型、语音大模型的产品门槛与应用成本将逐步降低,带来更多API能力调用与产品解决方案的AI能力融入发展,尤其在2024年以后,更多AI产品逐步变现、AI能力下放至边缘侧与端侧之后的影响将更为明显;原本以图像识别为主的计算机视觉市场增长变缓,受政策及政府预算影响,泛安防类的业务增长更多被医疗、工业等CV产品取代,且图像生成市场将在未来3-5年迎来更多商业变现机会,进一步填充计算机视觉模态的市场空间驱力。

  自2019年以来,我国人工智能相关政策始终紧随技术和产业高质量发展步伐,历经广泛试点、建设框架、产业化发展、场景化落地四个阶段,切实推动人工智能从一项新兴技术走向规范应用。2023年,生成式AI为人工智能领域带来重大突破与新的希望,而围绕生成式AI的政策布局也迅速铺开,从数据和算力基础夯实,到快速对生成式AI规范化引导,再到产业扶持,形成一套强有力的组合拳。

  从2017-2022年,随着AI产业成熟度不断提升,融资逐步向中后期过渡,而在AIGC概念火爆的2023年,种子轮与天使轮融资重返主力位,在这其中,近40%的投资事件指向2023年新成立的AIGC公司,这表明AIGC正在引领AI产业新一轮融资周期。与此同时,原有AI各技术赛道也依然保持活力,机器学习使用最广,存在感最为明显,计算机视觉、NLP依然紧随其后。值得注意的是,AIGC相关融资占2023年AI产业全部融资事件的28%,并且在除机器人外的各个赛道均有渗透,成为年度AI融资的最大关键词。

  2023年 中以前,许多投资人对AIGC持观望态度,但仍有不少资本势力躬身入局。从全年战绩来看,2023年资本缔造了5家中国AIGC独角兽和一家准独角兽,其中4家为2023年新开项目,“AIGC速度”充分证明这一轮AI技术爆发对传统AI赛道投资逻辑的改变。一方面,资本对AI所能提供的商业价值普遍产生新的认识,另一方面,从具体公司来看,资本明显看好名人创业+大模型团队的配置。筑造优秀大模型技术企业需要算力资源、数据资源及生态资源的多方加持,方能从技术研究走向商业生态的长久闭环。未来AIGC应用创业公司将成为未来赛道健康成长的关键支柱。

  2023年,共有18家AI公司进入IPO阶段,而其中12家选择港股上市,除了全球化募资的野心外,更大原因在于港股对高新技术企业上市的财务指标要求表现出明显的宽松倾向,预计未来会有更多AI公司选择冲刺港股。与此同时,AI公司上市过程仍旧相对反复曲折,许多公司多次重复交表,而进入问询阶段后,企业面临对长期盈利目标与战略更加严格细致的拷问。

  大模型基座催化AI工业化生产,Decoder only路径引领生成式AI产业变革

  2024年2月,OpenAI发布Sora模型,在全世界内引起剧烈反响。Sora是一个以视频生成为核心的空间模型。它的出现,标志了DiT(Diffusion Transformer)架构的融合成功,且在视觉领域同样可以出现涌现能力,未来持续迭代有望进一步提升视觉模型的生成效果,可喻为视觉生成领域的“GPT 3”时代。此外,随着模型计算规模逐渐增大,模型在物理世界的关键特征、数字和内容的标注理解下,成功建立相应的物理特征与数字关联,具备模拟现实世界中人类、动物和环境,甚至事件生成的能力。因此未来Sora模型不仅可以在影视、医疗、教育等领域提供生产力角色,还能基于对世界空间的认知理解,服务于空间模拟、视频计算、数字孪生等深层需求,成为一款更具通用能力的世界模型。

  “ChatGPT爆火后,NLP技术不存在了”,这类说法在2023年讨论的如火如荼。而艾瑞与人工智能产学研厂商深度交流后认为,NLP小模型仍在被广泛应用,为供给侧厂商完成意图识别、检索匹配等任务。NLP技术不存在更多是从前瞻性学术角度来看,而从产业应用角度,大小模型结合仍是AI产业的当下核心应用落点。随着智算规模扩张、大模型能力提升及应用成本降低之后,大模型的确会对小模型的更多应用场景展开替代趋势,尤其是在大模型擅长的归纳推理、内容生成等语言语音应用场景。

  从产业发展视角,当前大模型明显的痛点一是适配场景有待发掘,二是落地成本偏高。现实世界当中的数据往往是散乱且混合多模态类型,尤其对于自动驾驶、安防等AI产业的主战场,多模态模型相比单一模态,其适用场景将有数倍增长。另一方面,从落地成本出发,大模型剪枝虽然能够有效缩减参数,但也面临应用效果的折扣。MOE架构通过专家模型之间的合作和调用,在降低模型应用成本的同时,还能提升应用效果,将成为未来大模型技术拓展的重要方向。

  全球的自动化及人工智能浪潮正以前所未有的速度推进,深刻重塑着各行各业的运作方式。AI技术在数据分析、机器学习、自然语言处理等方面取得了显著进步,不仅极大地提高了生产效率和服务质量,还显著推动了新产业的诞生和旧产业的转型升级。根据IBM发布的《2023年全球AI采用指数》数据,中国已将AI及自动化技术运用在IT、网络流程、业务流程等业务领域,并将AI技术广泛服务于IT开发、人员运营、销售市场、客户服务等部门人员。

  生成式AI的产品价值在于其强大的内容生成能力,能够为用户提供高度个性化的内容生产,满足企业内外服务的多样化需求。根据IBM发布的《2023年全球AI采用指数》数据,以工业、通信、金融为代表的行业企业是拥抱生成式AI产品的领域先行者,且相较于原本对标“降本增效”的AI产品,生成式AI产品的首要目标更多在于“提升产品服务价值”,尤其是AI高绩效企业表现更为明显。

  根据IBM发布的《2023年全球AI采用指数》的数据显示,2023年,有高达85%的中国企业表示在过去的一段时间里加快了对AI的投入应用,63%的中国企业表示正在积极应用生成式AI,34%的中国企业正在积极探索生成式AI。全球范围内,中国展示出了对AI应用的超前积极姿态,不仅关注投入AI技术的前沿动态,更致力于AI落地探索的实际应用,以获取新技术浪潮下的新一轮竞争性优势。

  人工智能技术正与人类经济生产活动的主要环节达成紧密结合,提供生产办公效率提升、运营管理优化、服务体验增强等效果实现。而随着大模型、生成式AI技术的到来,其强大的数据处理、学习泛化与内容生成能力,高质效加速了各行各业人工智能技术的赋能进程,为AI可赋能的场景领域、扮演角色提供更多创新性与可能性。在对原本计算机视觉产品、对话式AI产品、决策智能产品完成能力优化外,衍生出更多文本生成、代码生成、图像生成等产品功能,由技术底层实现内容生产效率的飞越,并有望进一步变革人机交互方式,以对话形式降低人机交互门槛,高维度优化用户交互体验。

  根据艾瑞咨询研究院测算,2023年中国智能算力市场规模已达到5097亿元。在大模型训推需求影响下,2023年中国智算市场规模相较于2022年完成大比例跃升,一方面AI芯片的单卡算力呈倍数增加,另一方面,以训练场景为主的服务器载卡数量从原来的2-4卡逐步升级到4-8卡的普遍配置。随着中国各地智算产业的投入建设、大模型在边缘侧及端侧的算力释放,2028年,中国智能算力市场规模或将达到3.4万亿元,五年复合增长率达到46.3%。2023年的中国AI基础数据服务市场规模为37亿元,由上层大模型应用带来的数据需求正改变着AI基础数据服务的工作结构。以传统NLP任务为主的分词、词性标注等工作被慢慢取代,且数据服务厂商更加拥抱融合大模型范式的全流程、自动化工作流,将业务重心开拓到大模型训练数据集、RLHF微调、提示词生产、偏见数据库、评测服务等采集生产工作中去,2028年中国AI基础数据服务市场规模将达到117亿元,五年复合增长率达到26.1%。

  中国AI产业发展呈现“倒三角”特征,数据层的规模质量、算力层的规模性能制约着模型层及应用层的飞速发展。2023年3月,中央、国务院印发的《党和国家机构改革方案》对外公布,组建国家数据局。2023年10月25日,国家数据局挂牌成立。国家从政策监管角度积极引导数据要素市场建设,鼓励开展数据确权授权,构建数据流通体系,旨在为大模型训推提供高质量数据市场资源。另外,Sora模型的横空出现点爆产学研界对于视频生成的研究热情,而对图像、视频、多模态模型的训推将指数级加大对AI算力的底层需求。国家及地方政府鼓励并积极开展智算设施建设,同时以“算力券”等形式降低企业的训练成本、提高算力对接效率,更多支持中小企业购买算力服务。

  根据IDC预测,到2025年中国有望成为全球最大的数据圈。从国内AI基础数据供需角度,当前大模型的迅速发展大大提升了对AI训练数据质量、数量和生产效率的要求,传统以人工标注为主的数据生产从成本和效率上都难以满足需要。一方面,AI训练数据生产正在向AI数据标注、全流程自动化方向演进,同时在部分仍需人工标注的场景,配备的人员素质也有了明显提升。另一方面,AI数据的供需问题也使得AI数据合规方面的问题更加突出,我国正在通过行业协会、研究院的力量,推动AI数据标准建立,鼓励开源数据集发展。

  算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力,作为新型信息基础设施的重要组成部分,算力基础设施发展呈现多元泛在、智能敏捷、安全可靠、绿色低碳等特征。在IDC时代,以CPU为主的计算任务场景相对单一或者标准化。而在智算中心时代,以GPU并行计算及AI加速卡为主的异构计算任务变得更加多元多样,面向安防园区、自动驾驶、互联网推荐、人机交互等不同下游场景提供智算资源及训推服务应用。所以艾瑞认为,中国智算中心的发展建设,不仅仅要注重硬件性能、网络带宽、算力规模等硬实力特征,更是要注重与智算中心的硬件设施能力融合,结合产业需求及地域业务,以低成本、高效能、定制适配的软件平成客户场景需求的软实力发展。

  生成式AI产品的出现,让人工智能这一关键词重回人类关注焦点。基于扩散模型的AI电商设计图、基于大语言模型的对话式AI解决方案等热门B端产品率先出圈变现,C端应用也涌现了一批AI搜索对话、图像生成等APP产品。2023年7月,妙鸭相机小程序横空出世,成为AIGC时代下的第一个C端爆款。人们沉浸于生成式AI技术带来的巨大改变,同时也对时代技术的飞速发展产生FOMO情绪,恐惧因新技术的诞生而失去现有平台产品或错失机会。然而与第一轮计算机视觉带动的人工智能浪潮类似的是,AI的技术跃升并未达到无所不能的地步,需在用户预期上做合理规划引导,填补由于市场宣传与落地应用带来的认知差距。互联网时代下,诞生以阿里为代表电商厂商、以腾讯为代表的通讯厂商;长短视频时代下,诞生以爱优腾为代表的长视频厂商、以抖音快手为代表的短视频厂商;社区经济时代下,诞生以小红书为代表的平台厂商。人工智能时代下,以AI驱动的原生生态尚未出现,AI原生应用带来的B端生产重构,及C端的流量洗牌值得期待。

  产学研界对AGI的讨论热度持续不减,但艾瑞认为,技术奇点到来的一刻具备不可预见性,当下关于AGI的时点预测更多是思考大于实际。然而AI的确在朝着范围愈发广泛的普遍性发展,且欲实现接近并超越人类的普遍性,其演进节点是对全人类世界运行逻辑的挑战更新,对全球劳动力结构、产业经济发展、道德伦理制度、社会规则运行,以及技术经济优势带来的的地缘政治以及国际军事都将带来底层逻辑的巨大变数。需量化人工智能的通用性与自主性,理解并定位AGI的演进道路节点,提升AGI实现过程的可预见性及社会稳健性。另外,随着AI能力的通用化提升,具身智能实现了成本更低廉、能力更泛化的产品形态,国内外企业也纷纷加大人形机器人等产品投入,寻路实体社会的“AGI”世界。

  人工智能伴生于信息技术时代,经过数十年的研究积累及经验沉淀,已逐步跨越科学与应用之间的技术鸿沟,迎来新一轮的红利爆发与创新机遇。21世纪以来,全球技术创新进入空前活跃期,生成式AI技术的到来被誉为“最具革命性”的技术进步,未来产业发展是抢占全球创新高地、重构全球创新版图、重塑全球经济结构的关键节点。

  2017年起,国内互联网巨头厂商相继投身预训练大模型的产品研发,百度、华为等产业基因强的巨头厂商已在2022年左右发布过行业大模型矩阵,探索金融、制造、能源、媒体等场景落地。2022年末,ChatGPT掀起生成式AI浪潮,预训练大模型再度成为AI产业焦点。2023年,“大模型热”愈演愈烈。其中,国内互联网厂商持续更新迭代技术底座及模型能力,更多高校与大模型创企加入。2023年5月起,行业大模型发布数量显著增加,互联网巨头达成进一步行业分化及产业伙伴合作,同样受益于开源生态的建设,更多垂类厂商结合开源模型研发契合自身业务的行业大模型产品。根据艾瑞不完全统计,截止2023年底,中国行业大模型的个数占比已经超过8成。以医疗与金融为首要落地领域,分别占比达到21.9%与12.8%。

  2023年8月15日,《生成式人工智能服务管理暂行办法》 正式施行,国家对大模型上线监管采取“备案制”,确保内容安全和意识形态准确性。之前大模型产品多采用邀请注册制,仅开放给企业伙伴或有限名额使用。通过“备案制”的企业则可以正式面向公众开放注册、提供服务。相较于“审核制”,“备案制”监管为生成式人工智能技术的产业发展提供良好培育环境,以动态角度应对管理技术发展的不确定性。2023年8月31日,第一批AI大模型企业获批。截止2024年1月,中国已获备案审批大模型40余家,其中通用和垂直大模型的占比分别为55.8%与44.2%。

  场景产品侧作为预训练大模型及生成式AI技术的核心落点,B端与C端的市场发展成为产业界关注的焦点。从B端场景出发,大模型与企业业务离不开经营数据,需逐步渗透打磨,打通业务逻辑实现更多场景的落地应用闭环,呈延续性曲线融合赋能。因此To B企业需打造足够垂类企业合作基础或良好产业合作生态满足前期场景探索;从C端场景出发,大模型落地应用需从供给侧满足硬件设备条件及大模型能力适配,在软硬件生态成熟后涌现阶梯式能量爆发,C端企业需准备足够资金储备及短期变现方式以应对前期的发展沉寂期。

  大模型可以更好带动云资源(MaaS模式)及行业产品方案的售卖,在B端产品方案融合更多大模型技术,以API调用、SaaS产品及定制方案等方式加速企业智能化赋能。目前C端产品主要以工具定位为主,页面广告、流量变现(如占领用户更多流量及使用时长实现引流花费)等方式尚未进入当下产品,前者主要原因为发展初期以获取语料及用户行为角度为首要,页面广告会影响用户体验与心智占领,后者主要原因在生成式AI产品在软硬件生态能力尚未达到。

  多智体系统是指由多个智能体构成的系统,智能单体具备感知、存、算、通信能力,智能体之间通过协作交互AI相关信息,实现智能在网络内的流动,从而提升各节点及网络平台的智能水平,是未来物联网发展的目标。大模型在各层融合应用对原有云、边、端的算力及调度、通信、感知能力都提出了全新的要求,物联网的智能进化也为大模型落地铺开更广阔的场景与空间。

  2023年,中国AI芯片市场规模约为620亿元。近年来,国央企加大算力基础设施建设,由更多AI产业服务商作为生态伙伴参与共建,强化需求牵引与行业赋能,2028年中国AI芯片市场规模将达到3931亿元,五年复合增长率达到44.7%。在中美关系越发紧张的时代背景下,中国AI芯片厂商坚守自主可控道路,期望早日摆脱对国外厂商以英伟达为代表的高性能卡依赖。以百度昆仑、华为昇腾、中科海光等厂商为代表的芯片产品陆续完成软件生态移植,进入规模化应用阶段。伴随自动驾驶、智慧医疗、智能家居、工业互联网等场景,AI算法与算力调度将从云端逐步下放到边缘侧和端侧。预计2028年云端、边缘侧、端侧AI芯片的比例将分别达到48.6%、27.5%与23.9%,面对大量、复杂任务如何进行与云端的无缝高效的分工配合,是当前边端模型需要解决的关键问题。

  当前,大模型正在从算力统管和场景优化两个维度在边缘侧进行落地尝试。在算力统管方面,大模型能够部分替代和接管原有云端计算中心的算力调度权限与能力,大大减少云—端传输所带来的时间损耗,对边缘侧算力使用效率带来改进。同时,大模型可取代原有边缘侧用于预测、决策、判别、生成等多类任务的小模型,提升场景泛化能力和使用效果,改善ROI。

  当前阶段,大模型已经率先在手机和汽车座舱中得到初步应用,其带来的计算存储需求也在催化终端硬件和网络性能迭代。同时,在大模型裁剪技术以及终端算力制约下,端侧部署大模型参数量小,功能相对有限,部分时刻借助云端大模型能力可以为用户提供更丰富的场景体验。未来随着场景复杂化和用户、设备协同等需求,对端侧和云端模型能力及算力需求也将同步提升。

  从用户感知视角,多模态的人机交互将解放用户双手,AI终端将从存储—应用—交互一体的娱乐/工具机,逐渐演化为用户随身携带的智能BOX。作为智能算力和应用的载体,终端应用的范围和能力也将得到极大拓展。从技术栈层面,操作系统作为全机能力调度的核心将发挥更显著的主体性作用,硬件厂商将以AI操作系统为核心重塑自身生态,原有软件厂商的用户数据与流量入口优势或将被削弱。

  社会层面,人工智能技术值得关注的主要风险在于对用户心智、用户隐私及安全伦理问题的潜在影响。首先,人工智能训练需要大量互联网公开数据,包括图片、文字、音频等,可能包含大量私人数据,存在较高的泄露风险。其次,生成式AI可以用于创建虚假的图像、视频或声音,结合大数据分析,可以个性化地分发新闻,对目标受众的心理和行为产生影响,这可能导致人们被欺骗、误导,甚至被利用危害人的生命健康。

  在企业端,AI技术的内生性缺陷对企业应用的影响更明显,包含人工智能框架、数据、算法、模型任一环节都能给系统带来脆弱性。传统神经网络模型大多面临可解释性不足的问题,而同为神经网络结构的大语言模型作为近年AI领域重大突破,在可信、可解释性和生成内容安全性方面并未得到明显改善,甚至因其应用场景的扩大使得这一矛盾更加突出。根据IBM报告显示,全球范围内绝大部分公司对AI持积极态度,且从2023年3月至今,这种积极性还在持续发酵。但从不同AI成熟度企业关注问题可以看出,企业AI应用当中,数据安全、技术可信和工具迭代等各方面问题依然突出。处于观望或AI应用初级阶段的企业,致力于通过AI统管和AI技能补足,解决AI应用当中必将面临的数据和系统安全问题,实现AI初步可用可落地。同时,这些公司在AI应用过程中也十分需要公司内部顶层设计与政府、行业标准的支持。而少部分已经成熟应用AI并取得较好降本增效成果的企业则已经进入新阶段,其面临的主要难题在于对企业内外部AI模型和工具进行升级。

  基于上述对人工智能发展风险的探讨,未来人工智能的发展需要在技术、行业标准规范和法律监管三个层面持续完善和引导。在技术探讨研究方面,必须加强研究,提高算法的准确性和透明度,以防止偏见和不公平情况出现。在行业标准方面,需建立统一的规范和伦理准则,确保人工智能应用符合道德和社会价值。在法律监管方面,则需制定和修改相关法律法规,保护个人隐私,防止滥用和侵犯权利。