搜索

分类列表

Android (1)
Antlr (17)
C和CPlusPlus (72)
Delphi (87)
DotNet (12)
Flex (21)
IPhone (28)
Java (35)
Javascript (1)
Linux (20)
PHP (17)
Python (7)
Sqlite (15)
Symbian (2)
Unreal (14)
Vxworks (11)
Web (6)
共享软件 (14)
多媒体 (20)
开源 (10)
投资理财 (2)
数字货币 (3)
数据库 (2)
杂感 (31)
深度学习 (2)
算法 (4)
风花雪月 (8)

读了一下seamlessM4T的ggml实现

由 hubdog 于星期三, 2024-09-11 02:17 发表

发现它的ggml实现没有做量化处理，虽然提供了一个fp16的转换功能，但是加载到内存中仍然是fp32，量化就是做了个寂寞。medium的权重文件6G的多，转成8bit可以压缩到1.5G，4bit的量化可以搞到800M。seamlessM4T的代码也是搞了个寂寞，那fairseq2那玩意做模型，在本地搞了一个类似数据库的设定，我也是醉了。

hubdog's blog

Delphi, DotNet, Java, C++深度探索-哈巴狗的小窝

搜索

分类列表

导航

读了一下seamlessM4T的ggml实现

最新blog文章

用户登录

聚合