Gemma 4多模态微调器:开源工具支持Apple Silicon本地AI训练
Available in: 中文
一位开发者发布了开源工具,支持在Apple Silicon上微调Google的Gemma 4多模态模型,填补了MLX缺乏音频微调支持的空白。
一位开发者发布了开源工具,支持在Apple Silicon上微调Google的Gemma 4多模态模型,填补了MLX缺乏音频微调支持的空白。
工具特性
GitHub项目 gemma-tuner-multimodal 支持:
- Gemma 4 多模态模型微调
- Whisper 音频模型微调
- 云端到本地数据流(从Google Cloud Storage训练期间)
- Apple Silicon优化(为64GB RAM的M2 Ultra Mac Studio设计)
起源
开发者六个月前开始尝试在本地微调Whisper,拥有15000小时音频数据在GCS中。他们构建了流式系统,然后加入Gemma 3n支持,最终升级到Gemma 4。
技术挑战
"在长序列上微调很容易OOM!我的Mac Studio只有64GB RAM,经常内存不足。"
为什么重要
- 民主化多模态微调 — 无需云GPU
- Apple Silicon生态增长 — 更多工具支持Mac本地AI开发
- Gemma 4势头 — Google开放模型继续获得关注
- 实际用例 — 音频处理、自定义视觉-语言模型
← Previous: Russia Claims World Energy Markets Have Undergone Fundamental TransformationNext: iPhone 17 Sales Surge 26% Globally in February, Bernstein Reports Strong Demand →
0