文件列表(压缩包大小 189.16M)
免费
概述
大模型(也称预训练模型、基础模型等)是“大数据+大算力+强算法”结合的产物,是凝练了大 数据内在精华的“隐式知识库”,是实现多种人工智能应用的通用载体。大模型是连接人工智能 技术生态和产业生态的桥梁,向下带动基础软硬件发展,向上支撑智能应用百花齐放,是未来 整个人工智能生态的核心。
大模型通常是在大规模无标注数据上进行训练,学习出一种特征和规则。基于大模型进行应用 开发时,将大模型进行微调(在下游特定任务上的小规模有标注数据进行二次训练),或者不进 行微调,就可以完成多个应用场景的任务。
当前大模型领域较为关注的研究重点包括:大规模的模型参数、创新的模型架构、采用多模态的 数据进行预训练和微调、高效且性能更强的预训练和微调方法、模型训练和推理加速方法等。
大模型在推动AI领域技术体系、智能产业发展的同时,也对算力基础设施和智能产业的生态提 出了更高的要求,带动相关领域的发展。
当前全球大模型产业落地仍处于早期探索阶段,大模型落地过程中,最为重要的是减少企业需 要投入的学习、开发和计算成本,同时还要能够满足企业进行模型开发定制的需求。目前产业 领域典型的有API、开源、PaaS和“交互主体化”四种落地模式。
大模型技术快速发展,目前在内容创意生成、语言/风格转换、对话、搜索等领域的落地进展较 快。此外,利用大模型进行编程,也成为探索的热点。随着未来模型性能的不断提升,模型相关 的平台不断完善,大模型或将成为下一代AI基础平台,为各行各业赋能。
大模型发展至今也带来了一系列问题。一是模型配套的产业、监管体系相对薄弱。二是深度学习 技术本身存在的缺陷。
随着模型配套的产业生态逐步建立和完善,大模型技术将变得更为可靠和可控。
发布单位:北京智源人工智能研究院
如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈
评论(0)