> 自媒体 > (AI)人工智能 > 中国人牛,60亿中文大模型ChatGLM6B也支持AMD显卡和手机了
中国人牛,60亿中文大模型ChatGLM6B也支持AMD显卡和手机了
来源:安逸远山滔哥
2023-07-18 15:05:49
1281
管理

ChatGLM6B是目前国内使用最多的大模型了。之前必须在英伟达的显卡上跑。

现在支持AMD显卡和手机,中国人厉害

虽然还是比较慢,但是好歹可以跑了。

实测AMD显卡跑的还是比较快的,手机速度目前还惨不忍睹。期待作者继续优化

项目地址

https://github.com/wangzhaode/ChatGLM-MNN

impl

GPU CPU

CPU only

MNN

0.292

0.877

Pytorch

out of memory

1.344

优化过程

该项目将模型ChatGLM-6B转换到MNN并使用C 进行推理。 在实现上做了如下优化:

对其中的词表做了部分删减,删除了模型中未使用的前20000个图片词;将vocab, embedding, lm_head的大小从150528缩小到130528;Embedding操作调用次数较少,使用fseek, fread加载的方式降低内存;lm_head操作为[num, 4096] @ [4096, 130528],转换为[130528, 4096] @ [4096, 1];原模型对显存要求较高;将模型按层拆分成28个模型,可以根据用户显存大小动态将计算任务分配给GPU和CPU,充分利用GPU与CPU内存与算力; 即使小显存显卡也可以加速生成。针对端侧设备可以逐次加载计算,2G内存的Android设备也可以执行推理(速度较慢)。现已提供ONNX导出方法和模型,可以使用其他框架部署;点击下载
0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三代同堂!是轩逸是产品力太强?还是国产车太弱?
在中国,你想找到一款三代同堂的燃油车,并不容易了。按照一辆燃油车6~8..
国产车造出四电机轿车,发动机只发电不驱动,这车真能原地掉头?..
比亚迪推出高端品牌仰望的旗舰轿车,这台车用2.0T发动机给电池充电,不直..
修车12年,我想跟纠结国产车质量的普通人说句实在话..
我是心心念念,每天跟大家聊点实在的用车、选车干货,更新不赶趟、但每回..
国产车卖得越来越猛,价格战快打不动了,华为悄悄成了幕后推手..
2025年卖车最多的还是比亚迪,卖出460多万辆,差一点就突破500万,上汽紧..
揭秘中国最能打的6款SUV,各个都是国货之,国产车的骄傲!..
想要买SUV的兄弟们注意了,国产最能打的6款SUV车型,无论是动力、配置、..
国产车越做越大,德系豪华也低头,中国用户说了算
北京奔驰最近申报了一款纯电GLC,它用的电池是宁德时代生产的,容量有89..
出口碾压日德,为啥中国人还觉得国产车垃圾?
花二十多万提了辆配置拉满的国产新车,开着顺手、油耗还低,结果逢年过节..
为什么“美国禁止国产车”原因让人心痛
网上流传最广的一个误区,就是说“美国禁止中国汽车品牌进入”,其实根本..
适合穷人开的4台国产车,月薪5000也能开!质量靠谱还倍有面儿!..
兄弟们,想要油耗低,动力好,后期毛病少,最适合普通人开的车,那你就不..
关于作者
乖乖(普通会员)
文章
2050
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110845

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索