MacStudio Compute

📋 部署方案

#	文件名	类型	内容简介
1	MacStudio_Compute_Research_DS4_Guide.html	DS4	DwarfStar 4 (ds4) — Mac Studio 原生部署 DeepSeek V4 Flash 完整指南 — Redis 创始人 antirez 用纯 C 代码写成的 DeepSeek V4 Flash 专用推理引擎。包含编译步骤、q2 不对称量化模型下载、ds4-server API 启动配置、Claude Code / opencode 生态集成、M3 Max / M3 Ultra 性能实测数据、Disk KV Cache 实战增益及故障排查。
2	MacStudio_Compute_Research_MiniMax-Guide.html	MiniMax	MiniMax-M2.7 — Mac Studio 128GB 部署指南（完整版） — 三套方案全覆盖：LM Studio 图形界面（新手首选）、llama.cpp 命令行（灵活调优）、JANGTQ+MLX 专为 Apple Silicon 优化（极致速度 44 tok/s，MMLU 91.5%）。包含 200K 上下文配置、量化方案对比与避坑指南。
3	MacStudio_Compute_Research_GLM45-Air-Guide.html	GLM	GLM-4.5-Air — Mac Studio 128GB 本地部署指南 — 使用 LM Studio / mlx-community 部署 GLM-4.5-Air（106B，6-bit 量化），128K 上下文，预估内存占用 ~111GB。包含量化版本对比、工具推荐及注意事项。
4	MacStudio_Compute_Research_Qwen36-27B-Guide.html	Qwen	Qwen3.6-27B — Mac Studio 高精度本地部署完整指南 — 270亿稠密多模态模型，编程能力超越千亿级 MoE（SWE-bench 77.2）。涵盖 GGUF 8-bit（30GB）和 MLX 8-bit 两套部署方案，原生多模态支持文本/图像/视频，OpenAI 兼容 API。全面精度对比及性能预期数据。

文件名

类型

内容简介

MacStudio_Compute_Research_DS4_Guide.html

DS4

DwarfStar 4 (ds4) — Mac Studio 原生部署 DeepSeek V4 Flash 完整指南 — Redis 创始人 antirez 用纯 C 代码写成的 DeepSeek V4 Flash 专用推理引擎。包含编译步骤、q2 不对称量化模型下载、ds4-server API 启动配置、Claude Code / opencode 生态集成、M3 Max / M3 Ultra 性能实测数据、Disk KV Cache 实战增益及故障排查。

MacStudio_Compute_Research_MiniMax-Guide.html

MiniMax

MiniMax-M2.7 — Mac Studio 128GB 部署指南（完整版） — 三套方案全覆盖：LM Studio 图形界面（新手首选）、llama.cpp 命令行（灵活调优）、JANGTQ+MLX 专为 Apple Silicon 优化（极致速度 44 tok/s，MMLU 91.5%）。包含 200K 上下文配置、量化方案对比与避坑指南。

MacStudio_Compute_Research_GLM45-Air-Guide.html

GLM

GLM-4.5-Air — Mac Studio 128GB 本地部署指南 — 使用 LM Studio / mlx-community 部署 GLM-4.5-Air（106B，6-bit 量化），128K 上下文，预估内存占用 ~111GB。包含量化版本对比、工具推荐及注意事项。

MacStudio_Compute_Research_Qwen36-27B-Guide.html

Qwen

Qwen3.6-27B — Mac Studio 高精度本地部署完整指南 — 270亿稠密多模态模型，编程能力超越千亿级 MoE（SWE-bench 77.2）。涵盖 GGUF 8-bit（30GB）和 MLX 8-bit 两套部署方案，原生多模态支持文本/图像/视频，OpenAI 兼容 API。全面精度对比及性能预期数据。

🔗 外部参考链接

DS4 / DeepSeek V4 Flash：
GitHub · antirez/ds4 — DwarfStar 4 源码与文档
Hugging Face · antirez/deepseek-v4-gguf — DS4 专用 GGUF 模型
antirez 博客 · A few words on DS4 — 设计哲学与性能解析
知乎专栏 · ds4.c 实战 M3 Ultra 512G 部署 — 基准测试数据
MiniMax-M2.7：
Hugging Face · unsloth/MiniMax-M2.7-GGUF — GGUF 模型下载
LM Studio — 本地推理客户端
JANGTQ 量化版 — Apple Silicon 专属，速度最快（56.5GB）
GLM-4.5-Air：
LM Studio — 图形化管理推理
Hugging Face · mlx-community — 社区量化版本源
Qwen3.6-27B：
Hugging Face · Qwen/Qwen3.6-27B — 官方权重与原始 FP16 版本
Unsloth GGUF 量化仓库 — 动态量化，SOTA 精度保留
MLX Community 8-bit — Apple Silicon 优化版
Apple MLX GitHub — 官方框架与文档

📁 目录结构

MacStudio_Compute/
├── index.html
├── MacStudio_Compute_Research_DS4_Guide.html
├── MacStudio_Compute_Research_MiniMax-Guide.html
├── MacStudio_Compute_Research_GLM45-Air-Guide.html └── MacStudio_Compute_Research_Qwen36-27B-Guide.html

📅 索引创建时间: 2025-05-22 | 共 4 个条目 | 所有本地链接均使用相对路径。

MacStudio Compute — 索引

📋 部署方案

🔗 外部参考链接

📁 目录结构