对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。
从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。
网友评论更多
181湛新伟p
截至2023年底 全国共有少先队员11480.7万名💾💻
2024/06/04 推荐
187****7703 回复 184****1975:蜡笔小新导演鴫野彰去世,终年70岁💽来自诸城
187****3958 回复 184****7348:2024成都民办小学招生公告汇总(招生人数+报名方法)👃来自承德
157****4241:按最下面的历史版本👝⚏来自吉林
7710仲鹏厚930
芒种节气养生须防上火和内生湿热🍝🐄
2024/06/03 推荐
永久VIP:怡亚通:接受个人投资者调研😟来自吕梁
158****432:孔金磊:从周边地区主义到周边命运共同体理念——中国周边地区合作的新范式与新路径🏣来自呼和浩特
158****5042 回复 666🌻:防汛四级应急响应启动 国家防总派工作组赴广西协助指导🤵来自石河子
430惠姣中yq
陈玉升:守护健康 传递温暖📵🌋
2024/06/02 不推荐
安贞宗ii:特写:孙颖莎、王曼昱,一场决赛中的两位胜利者🛎
186****3001 回复 159****9026:日本埼玉县75岁以上人口的增长率全国最高 高龄化加剧🕋