AMD发布首个AI小语言模型：6900亿token（amd语言设置） - 宝宝百科网

请选择时期：

怀孕准备怀孕分娩宝宝0-1岁宝宝1-3岁宝宝3-6岁

当前位置：首页 > 窍门 > 科技数码

AMD发布首个AI小语言模型：6900亿token（amd语言设置）

来源：最后更新：24-10-03 02:59:17

导读：AMD发布首个AI小语言模型：6900亿token

　　AMD发布了自己的首个小语言模型(SLM)，名为“AMD-135M”。

　　相比于越来越庞大的大语言模型(LLM)，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。

　　AMD-135小模型隶属于Llama家族，有两个版本：

　　一是基础型“AMD-Llama-135M”，拥有多达6700亿个token，在八块Instinct MIM250 64GB加速器上训练了六天。

　　二是延伸型“AMD-Llama-135M-code”，额外增加了专门针对编程的200亿个token，同样硬件训练了四天。

　　它使用了一种名为“推测解码”(speculative decoding)的方法，通过较小的草稿模型，在单次前向传播中生成多个候选token，然后发送给更大的、更精确的目标模型，进行验证或纠正。

　　这种方法可以同时生成多个token，不会影响性能，还可以降低内存占用，但因为数据交易更多，功耗也会增加。

　　AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型，测试了推测解码使用与否的性能。

　　比如在MI250加速器上，性能可提升最多约2.8倍，锐龙AI CPU上可提升最多约3.88倍，锐龙AI NPU上可提升最多约2.98倍。

　　AMD-135M小模型的训练代码、数据集等资源都已经开源，遵循Apache 2.0。

　　按照AMD的说法，它的性能与其他开源小模型基本相当或略有领先，比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M，Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

标签: 首个模型语言

免责声明：本文系转载，版权归原作者所有；旨在传递信息，其原创性以及文中陈述文字和内容未经本站证实。

本文地址:http://www.bbbaike.com/qiaomen/youxi/732695.html

美国载人“龙”飞船与国际空间站对接
网站首页 返回栏目
暂无

1
比心怎么接单比心怎么接单代打

2
如何注销探探账号注销探探账号一定要15天

3
联通流量封顶怎么解除联通流量封顶怎么解除发送什么

4
中国移动初始服务密码中国移动初始服务密码8位

5
拼多多运费险退回来的钱在哪里拼多多运费险退回来的钱在哪里怎么查

6
12306积分怎么用（12306积分怎么用手机兑换车票）

7
tfboys七周年演唱会可以看回放吗（tfboys七周年演唱会可以看回放吗视频）

8
天津河北区保租房在哪里（天津河北区租房房源）

9
个人所得税怎么扣工资多少需要交个人所得税怎么扣

10
十宗罪4中意义深刻的句子（十宗罪4中的经典句）

如何注销探探账号注销探探账号一定要15天

最好听的几首歌古风歌推荐（最好听的几首歌古风歌推荐女生）1、《故人不散》这首歌原创是醉雪和纱朵，纱朵小姐姐的声音真的是
具有历史意义的电视剧（具有历史意义的电视剧排行榜）天津红桥区有保租房吗天津红桥区有保租房吗现在三十而已钟晓芹和陈屿复合了吗（三十而已陈屿钟晓芹离婚片段台词） 2024保运集团医院妇女节健康体检优惠活动一览

2024年保定第七医院妇女节体检优惠活动一览

何谓有特色的淘宝店淘宝网店特色

山东省汽车置换更新小程序怎么进入山东车辆置换补贴政策2020通过微信、支付宝搜索“山东省汽车置换更新”小程序，进入小程序后
中国的希望在延安福建省大中小学同上一堂思政课完整视频苹果手机官换机是什么意思（官换机跟全新机的区别）天津津南区保租房具体地址天津津南区保租房具体地址查询胡歌繁花演员表（胡歌繁花演员表范总）

夏洛特烦恼为什么喜欢秋雅夏洛特烦恼秋雅爱谁

栏目导航

怀孕周期

热门文章

声明：本站文章均来自互联网，不代表本站观点如有异议请与本站联系联系邮箱:kefu#bbbaike.com (请把#替换成@)

关于我们 | 广告服务 | 网站合作 | 免责声明 | 联系我们| 网站地图

© 2022-2024 宝宝百科网 all rights reserved. 沪ICP备2023005727号-4