对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。
从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。
华体会官网登录入口中国养殖网在哪下载安装?华体会官网登录入口中国养殖网好用吗?
作者: 禄菲璐 2024年06月03日 17:55
网友评论更多
965满骅玲s
热!印度比哈尔邦两小时内热死16人📍🗨
2024/06/03 推荐
187****4054 回复 184****4264:以色列允许旅客免疫苗入境,澳大利亚开放国门|大流行手记(2月20日)🤷来自南通
187****3260 回复 184****4963:【画师修炼】夏天咯 冲浪咯~📅来自句容
157****9001:按最下面的历史版本📞⛴来自集宁
8595云玛琼695
猪价快速上涨且涨势不断,“天价猪肉”会不会又要回来了?📃♟
2024/06/02 推荐
永久VIP:A股下周解禁市值大降近50%!🐺来自莱西
158****2420:AI引爆边缘计算变革2024研华嵌入式产业合作伙伴会议成功举办♶来自七台河
158****8364 回复 666🍬:军校招生有内部指标?这些套路,千万别信🚼来自七台河
407蔡环春as
我国力争到2025年超七成二级以上中医医院设置康复科🔢🚒
2024/06/01 不推荐
米淑保ie:浙江杭州:党员收看“云党课”🎥
186****531 回复 159****6864:第三届宁夏技工院校教师能力大赛36人获奖👐