对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。
从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。
463.27MB
查看908.65MB
查看51.5MB
查看333.2MB
查看
网友评论更多
543濮阳固烁x
嫦娥六号成功着陆:采2000克月壤,美国又要咋办?4国或率先获得👙🙏
2024/06/05 推荐
187****4772 回复 184****8169:极致厨电破解“旧厨房”痛点,老板4件套全新定义中国新厨房🈴来自济南
187****3970 回复 184****1287:花钱保过?媒体调查职称代评“生意链”🚺来自菏泽
157****1728:按最下面的历史版本🕶⛬来自梅州
2323贺程天469
江西吉安:跑在青原山 跑进春天里⛏♚
2024/06/04 推荐
永久VIP:庄达菲陈昊宇cp名自己起的❭来自嘉善
158****8725:美议员发言 儿子在一旁做鬼脸🎈来自巢湖
158****1833 回复 666❮:基于百度统计实现显示近一年的pv、uv数据的API搭建😀来自灵宝
796欧阳壮永hs
CBA全明星赛首发球员票数公布 郭艾伦当选票王😛💦
2024/06/03 不推荐
淳于东妍pb:陈竺出席中日新时代健康论坛☟
186****7901 回复 159****9186:如何识别「赫鲁晓夫楼」、「筒子楼」与「老式单元楼」?🔟