<汇港通讯> 百度集团(09888)副总裁、深度学习技术及应用国家工程研究中心副主任吴甜,今日於百度文心Moment大会上宣布,发布文心大模型5.0正式版本,该版本已透过文心大模型官网及百度智能云千帆平台开放访问。
吴甜介绍,文心大模型5.0最显著的技术亮点在於原生全模态建模,不同於传统分阶段训练的多模态模型,其在训练初始阶段即整合文本、音频、视频、图片等多模态数据进行统一建模,不仅避免了後续训练中的「灾难性遗忘」问题,更实现了基础层面的模态融合与相互增强,大幅提升跨模态任务的泛化能力。
模型采用自回归统一架构,通过对不同模态数据的统一离散化处理,解决了数据差异性带来的建模难题。同时,作为超大型混合专家(MOE)结构模型,其总参数规模高达2.4万亿,激活比例低於3%,在兼具高模型容量与能力上限的同时,实现了训练与推理阶段的高效能运行。
後续训练方面,吴甜指,文心5.0创新引入长程任务增强智能体技术,针对真实场景中复杂长任务数据稀缺的痛点,研发大规模环境与任务轨迹合成技术,构建专属数据集。经测试,模型学习该数据集後,复杂长任务处理效果提升超20个百分点;在基建支持上,依托百度飞桨平台,文心5.0通过分离一步式训练架构、五维混合并行训练等技术,解决了全模态、超大规模、高稀疏MOE带来的训练难题,使训练速度提升240%。
为进一步提升模型的专业度与深度,百度推出「文心导师」生态项目,该项目自2023年启动以来,导师人数从首期10人增至2025年的835人。目前百度仍在持续招募各行业专家加入导师团队,共探AI创新之路。
#百度 #文心大模型5.0 #人工智能
(CW)
新闻来源 (不包括新闻图片): 汇港资讯