对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。
从浪潮信息发布的“源2.0-M32”开源大模型来看榴莲视频APP,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。
158.89MB
查看725.96MB
查看50.2MB
查看894.85MB
查看
网友评论更多
165沈顺兰c
“青山不老”求一句,惊艳的上句或下句?➲❹
2024/06/03 推荐
187****624 回复 184****3778:像保护大熊猫一样保护耕地(有的放矢)🍨来自抚顺
187****9617 回复 184****4047:促进制造业高质量就业📳来自四平
157****4865:按最下面的历史版本💍🏠来自莱州
6423尤晨勇576
2024年“挑战杯”四川省大学生创业计划竞赛终审决赛落幕☋💯
2024/06/02 推荐
永久VIP:强生131亿美元加码心血管业务,集采加速跨国医械巨头战略调整?🌏来自赤壁
158****6895:北方未来三天温暖升级 南方雨水再度发展增多👗来自从化
158****2393 回复 666👡:外媒:特朗普因“封口费”案被定罪后,其支持者倒挂美国国旗表示抗议✗来自宣化
583逄婷功cw
“花钱代画”乱象该管管了⚐❔
2024/06/01 不推荐
吉蓝善xc:张文宏:“德尔塔”虽然更狡猾,但仍在猎人枪口下🎏
186****9526 回复 159****9536:广东多起疫情源头疑似境外物品暴露感染 邮政监管部门要求加强国际邮件消杀⛥