博鳌热议AI大模型，人民网报告梳理产业机遇：端云结合/芯片/开源

2024年3月18日

博鳌亚洲论坛2024年年会期间，人民网正式发布《2024年中国AI大模型产业发展报告》。

报告系统性分析了AI大模型产业发展背景、现状、典型案例、挑战以及未来趋势。旨在给政府部门、行业从业者、社会公众提供价值参考。

大模型热潮中，关于技术解读分析的报告不少，但是由人民网主导发布的不多。而且还选在博鳌这样的重要时间节点上发布，足见其意义非凡。更深层传递出的信息是，大模型产业发展轰轰烈烈，转瞬即逝的机会点会出现在哪里？报告给出了初步判断。

AI大模型产业当下如何？

报告重点关注了AI大模型的当下与未来。

当下阶段，一方面，在大众、厂商、政府等共同推动下，过去一年多时间里，大模型产业发展突飞猛进。

聚焦到中国市场，推动产业发展主要有三大驱动力：

政策驱动力
技术驱动力
市场驱动力

其中，语言大模型技术演进给产业带来本源动力。经典Transformer架构是技术趋势最核心主干，基于人类反馈强化学习（RLHF）、指令微调、模型提示等重点技术，进一步提升语言大模型能力。

市场驱动力以实际存在的广泛需求为主，报告重点提到了办公、制造、金融、医疗、政务等场景。大模型能带来的影响主要体现在降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等。

政策方面，从去年年初大模型趋势发生以来，北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于AI大模型的相关政策，加快各地产业持续发展。

在多方因素影响下，“百模大战”一触即发，并将“战火”延续至今。

按照部署方式划分，已发布模型可分为云端大模型和端侧大模型。云端大模型可进一步分为通用大模型和行业大模型，端侧大模型主要分为手机大模型和PC大模型。

目前，每一个分类中都涌现出了代表玩家和代表案例。深入落地场景包括金融、医疗、政务等。

可以看到，通用大模型代表玩家主要是互联网大厂、初创企业；行业大模型代表玩家以具备专业数据、行业知识壁垒的场景玩家为主；端云协同大模型代表厂商则是终端厂家。

值得一提的是，端云协同是大模型部署方面热议的方向，也是公认的未来趋势，当下正抢先在手机行业落地应用。

报告中以vivo蓝心大模型为例，展开介绍端云结合大模型的特点。

vivo蓝心大模型是行业首个在手机端运行的开源自研大模型，包含十亿、百亿、千亿三个参数数量级，共5款自研大模型（10亿、70亿、700亿、1300亿和1750）。

通过不同参数量级、多种部署方式，矩阵化大模型能够在带来AIGC功能同时，实现低时延推理、低内存占用。

1B和7B的端侧模型，出词更快、内存占用小、安全性高、无网弱网条件都能使用。同时模型具备扎实底座，可实现精准的指令跟随，保持正确的价值观取向。

70B模型是面向云端服务的主力，主要针对角色扮演、知识问答等场景，能兼顾成本和性能。130B和175B两款千亿参数模型专门针对复杂任务。

博鳌热议AI大模型，人民网报告梳理产业机遇：端云结合/芯片/开源

△图片来源：vivo官网（注：榜单信息为 23 年 11 月数据）

而作为内嵌于手机内、和广大手机用户直接交互的大模型，蓝心大模型在底层算法上还强调了3方面：基础能力、指令跟随和价值观取向。

预训练阶段，vivo在Transformer架构上改良了注意力机制、位置编码等模块，采用混合精度训练以及梯度缩放策略缩短训练周期。采用“target only loss”方法，通过聚类分析对指令进行适应性处理，能实现更精准、均衡的指令跟随。

并且专门建立了300人规模的专业审核团队，制定200余项安全审查机制，对模型输出进行筛查和标注，确保模型价值观正确。离线采样策略和双重奖励模型等策略，还进一步提升了模型的安全性。

由此，端云结合大模型能直接以手机为载体，在设备上提供离线/在线AIGC功能。

vivo大模型已经支持了两款应用：

蓝心小V是vivo OriginOS 4上搭载的一款全局智能辅助功能，可提供超能语义搜索（利用自然语言搜索手机照片文档日程等）、超能问答（快速总结文档、基于文档回答问题）、AI路人消除、智能识屏等能力。

蓝心千询则是一个AI私人小帮手APP。它无需付费，支持AI对话和AI灵感两大能力，带来更多生产力功能，如PPT大纲生成、文案创作等。

以上是过去一年里，大模型产业落地取得的成绩。

但从另一面来看，随着趋势演进，大模型产业落地也浮现出更多复杂问题。

报告关注了四方面问题：

算力短缺
主流架构存在局限
高质量训练集需要扩展
爆款应用尚未出现

首先，最具代表性的问题体现在算力方面。

大模型规模呈指数级增长，其训练速度、产出质量都和算力直接相关。一万块英伟达A100，是公认的AI大模型算力门槛。但国内能拥有万卡规模的企业少之又少，相反缺卡才是绝大多数玩家的现状。哪怕是阉割版的英伟达A800，也出现了严重缺货和溢价的情况。我国本土高性能芯片虽在奋力追赶，但与国际领先水平仍存在较大差距。

其次在架构上，主流Transformer本身对算力资源消耗就很大，目前提升模型智能化水平主要靠扩大参数规模，动辄千亿参数规模意味着消耗巨量的算力资源。而且Transformer架构的大模型对存储设备要求也更高，如1000亿个参数的Transformer模型，存储这些参数就需要400GB的空间。

博鳌热议AI大模型，人民网报告梳理产业机遇：端云结合/芯片/开源

并且国内的AI大模型数据存在质量不高、体量严重不足、缺乏数据源调用等问题。行业需要构建高质量训练数据集。

如悟道语料库，其包括文本、图文和对话数据集，最大的仅5TB，其中开源的文本部分仅为200GB。作为对比，GPT-3的训练数据达到45TB。训练数据来源主要来自互联网、电商、社交、搜索等渠道，存在数据类型不全面、信息可信度不高等问题。以及可供大模型训练的有效数据源呈现碎片化分散状态，导致大模型联网无法直接调用的情况（如微信公众号文章仅在搜狗引擎支持调用）。

最后，国内大模型领域仍未出现爆款应用。

报告提出，相比于ChatGPT而言，国内爆款大模型应用打造还任重道远，主要原因在于尚未找到商业化思路，缺乏满足客户需求的个性化应用。我国大模型产业要推出爆款级应用，势必要在应用领域做深做细，让每一个用户都可以充分享受到大模型所带来的的真正便利。