📓 Notes → 📂 MacStudio Compute
以 Mac Studio (M系列, 128GB 统一内存) 作为算力设备,提供本地 AI API 服务的研究。
本文件夹汇集了在 Mac Studio 上部署大模型推理引擎的实践方案,覆盖部署指南、性能实测、生态集成等。
| # | 文件名 | 类型 | 内容简介 |
|---|---|---|---|
| 1 | MacStudio_Compute_Research_DS4_Guide.html | DS4 | DwarfStar 4 (ds4) — Mac Studio 原生部署 DeepSeek V4 Flash 完整指南 — Redis 创始人 antirez 用纯 C 代码写成的 DeepSeek V4 Flash 专用推理引擎。包含编译步骤、q2 不对称量化模型下载、ds4-server API 启动配置、Claude Code / opencode 生态集成、M3 Max / M3 Ultra 性能实测数据、Disk KV Cache 实战增益及故障排查。 |
| 2 | MacStudio_Compute_Research_MiniMax-Guide.html | MiniMax | MiniMax-M2.7 — Mac Studio 128GB 部署指南(完整版) — 三套方案全覆盖:LM Studio 图形界面(新手首选)、llama.cpp 命令行(灵活调优)、JANGTQ+MLX 专为 Apple Silicon 优化(极致速度 44 tok/s,MMLU 91.5%)。包含 200K 上下文配置、量化方案对比与避坑指南。 |
| 3 | MacStudio_Compute_Research_GLM45-Air-Guide.html | GLM | GLM-4.5-Air — Mac Studio 128GB 本地部署指南 — 使用 LM Studio / mlx-community 部署 GLM-4.5-Air(106B,6-bit 量化),128K 上下文,预估内存占用 ~111GB。包含量化版本对比、工具推荐及注意事项。 |
| 4 | MacStudio_Compute_Research_Qwen36-27B-Guide.html | Qwen | Qwen3.6-27B — Mac Studio 高精度本地部署完整指南 — 270亿稠密多模态模型,编程能力超越千亿级 MoE(SWE-bench 77.2)。涵盖 GGUF 8-bit(30GB)和 MLX 8-bit 两套部署方案,原生多模态支持文本/图像/视频,OpenAI 兼容 API。全面精度对比及性能预期数据。 |