纯净基地 - 专注分享最好用的电脑系统

纯净基地首页

网站首页 win10系统 win7系统 win11系统系统教程

当前位置：纯净基地 > 微软资讯 > AMD推出自家首款小语言模型“Llama-135m”，助力深度学习发展

AMD推出自家首款小语言模型“Llama-135m”，助力深度学习发展

更新时间：2024-09-29 19:32:44作者：czlaby

9 月 29 日消息，AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m，该模型具有推测解码功能，拥有 6700 亿个 token，采用 Apache 2.0 开源许可，附模型地址如下（点此访问）。

AMD推出自家首款小语言模型“Llama-135m”，助力深度学习发展

据介绍，这款模型主打“推测解码”能力。其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少 RAM 占用，实现效率提升。

AMD 表示，这款模型在四个 AMD Instinct MI250 节点训练了六天，其“编程专用版本”变体 AMD-Llama-135m-code 则额外耗费了四天时间进行微调。

上一篇：微软全新数据治理与安全增强功能详解
下一篇：微星确认AMD平台的DDR5 CUDIMM内存支持：Ryzen 8000/9000系列用户必看

AMD推出自家首款小语言模型“Llama-135m”，助力深度学习发展相关教程

热门推荐

win10无线网络显示地球图标 windows11打开internet选项 win10怎么打开高性能电源模式 win11菜单推荐的项目怎么关闭 windows11如何修改hosts文件 windows11怎么换壁纸桌面 win10如何删除系统多余的系统 win10 thinkpad开机密码忘记了怎么解锁 win10右下角任务栏隐藏 win10无法设置移动热点请打开

微软资讯推荐

win10系统推荐

系统教程推荐

Copyright © 2012-2024 纯净基地版权声明网站地图