📓 Notes → 📂 MacStudio Compute

MacStudio Compute — 索引

Mac Studio (M系列, 128GB 统一内存) 作为算力设备,提供本地 AI API 服务的研究。
本文件夹汇集了在 Mac Studio 上部署大模型推理引擎的实践方案,覆盖部署指南、性能实测、生态集成等。

📋 部署方案

#文件名类型内容简介
1MacStudio_Compute_Research_DS4_Guide.htmlDS4DwarfStar 4 (ds4) — Mac Studio 原生部署 DeepSeek V4 Flash 完整指南 — Redis 创始人 antirez 用纯 C 代码写成的 DeepSeek V4 Flash 专用推理引擎。包含编译步骤、q2 不对称量化模型下载、ds4-server API 启动配置、Claude Code / opencode 生态集成、M3 Max / M3 Ultra 性能实测数据、Disk KV Cache 实战增益及故障排查。
2MacStudio_Compute_Research_MiniMax-Guide.htmlMiniMaxMiniMax-M2.7 — Mac Studio 128GB 部署指南(完整版) — 三套方案全覆盖:LM Studio 图形界面(新手首选)、llama.cpp 命令行(灵活调优)、JANGTQ+MLX 专为 Apple Silicon 优化(极致速度 44 tok/s,MMLU 91.5%)。包含 200K 上下文配置、量化方案对比与避坑指南。
3MacStudio_Compute_Research_GLM45-Air-Guide.htmlGLMGLM-4.5-Air — Mac Studio 128GB 本地部署指南 — 使用 LM Studio / mlx-community 部署 GLM-4.5-Air(106B,6-bit 量化),128K 上下文,预估内存占用 ~111GB。包含量化版本对比、工具推荐及注意事项。
4MacStudio_Compute_Research_Qwen36-27B-Guide.htmlQwenQwen3.6-27B — Mac Studio 高精度本地部署完整指南 — 270亿稠密多模态模型,编程能力超越千亿级 MoE(SWE-bench 77.2)。涵盖 GGUF 8-bit(30GB)和 MLX 8-bit 两套部署方案,原生多模态支持文本/图像/视频,OpenAI 兼容 API。全面精度对比及性能预期数据。

🔗 外部参考链接

📁 目录结构

MacStudio_Compute/
├── index.html
├── MacStudio_Compute_Research_DS4_Guide.html
├── MacStudio_Compute_Research_MiniMax-Guide.html
├── MacStudio_Compute_Research_GLM45-Air-Guide.html └── MacStudio_Compute_Research_Qwen36-27B-Guide.html

📅 索引创建时间: 2025-05-22 | 共 4 个条目 | 所有本地链接均使用相对路径。