对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。
从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。
459.43MB
查看317.67MB
查看58.6MB
查看498.65MB
查看
网友评论更多
328缪宁丽c
时间线|新冠病毒最早发现于何时?😸🅱
2024/06/05 推荐
187****2015 回复 184****7418:贴春联、扫房子、准备年夜饭……超九成受访青年会坚持过年的传统习俗🔄来自江都
187****9300 回复 184****7920:基层减负进行时丨各地深化纠治“指尖上的形式主义”🥈来自铜川
157****2309:按最下面的历史版本🍲✡来自佳木斯
1933花桂霞195
【网络迷踪】图中有高速铁路,或其他动车组运行线路时的解题思路,以及相关内容的简要科普⛊📸
2024/06/04 推荐
永久VIP:加快建设旅游强国 业界探讨推动旅游业高质量发展🔥来自思茅
158****1013:急难愁盼|大班没读幼儿园却不退2万预交费?北京朝阳区教委:已责成退费✃来自怀化
158****5763 回复 666🚍:习近平同普京共同出席“中俄文化年”开幕式暨庆祝中俄建交75周年专场音乐会并致辞🍯来自辽源
423聂行奇bw
种地星球恢复直播🖨🛀
2024/06/03 不推荐
长孙怡坚os:金融监管总局披露!商业银行最新净息差1.54%☡
186****861 回复 159****2761:叶雄:水墨丹青德艺双馨的艺术家📡