🧬 GLM-4.5-Air 106B · 6-bit · 本地部署

Mac Studio 128GB 本地部署 GLM-4.5-Air 指南 · 6-bit 量化,128K 上下文

📦 硬件配置

⚙️ 推荐配置

项目推荐值
量化版本6-bit
上下文长度128K
预估内存占用~111 GB

🤔 为什么选 6-bit?

📊 量化版本对比参考

量化版本模型权重大小总内存占用 (估算)
8-bit~114.1 GB~138 GB
6-bit~86.7 GB~111 GB ✓
4-bit~64 GB~88 GB
3-bit~46.6 GB~71 GB

🛠️ 工具推荐

⚠️ 注意事项

  1. 从 6-bit 开始测试,效果好可尝试 4-bit
  2. 长上下文预处理速度较慢,建议精简提示词
  3. 可通过终端将最多 120GB 内存分配给 GPU

🎯 结论

Mac Studio 128GB 完全支持运行 GLM-4.5-Air 6-bit 版本,开启 128K 上下文