AMD Lemonade:支持 GPU 和 NPU 的开源本地 AI 服务器

2026-04-02T12:16:22.000Z·★ 80·1 min read
# AMD Lemonade:支持 GPU 和 NPU 的开源本地 AI 服务器 AMD 发布了 **Lemonade**,一款快速、开源的本地 AI 服务器,可在 GPU 和 NPU 上运行文本、图像和语音模型。该工具代表了 AMD 向本地 AI 推理市场推进的举措,挑战 NVIDIA CUDA 生态系统的主导地位。 ## 什么是 Lemonade? Lemonade 是一个轻量级 AI

AMD 发布了 Lemonade,一款快速、开源的本地 AI 服务器,可在 GPU 和 NPU 上运行文本、图像和语音模型。该工具代表了 AMD 向本地 AI 推理市场推进的举措,挑战 NVIDIA CUDA 生态系统的主导地位。

什么是 Lemonade?

Lemonade 是一个轻量级 AI 推理服务器,通过单一本地服务提供多种模态:

所有功能通过标准 OpenAI 兼容 API 通过统一端点访问。

关键技术特性

特性详情
后端原生 C++,仅 2MB 服务
安装一分钟自动设置
硬件自动配置 GPU 和 NPU
引擎llama.cpp、Ryzen AI SW、FastFlowLM
多模型同时运行多个模型
平台Windows、Linux、macOS(beta)
APIOpenAI 兼容,支持数百个应用

NPU 角度

Lemonade 特别有趣之处在于其 NPU 支持。虽然 GPU 推理已经成熟,但 NPU(神经网络处理单元)在消费硬件中越来越普遍:

Lemonade 在传统 GPU 之外利用这些专用 AI 加速器的能力,可能显著降低本地 AI 的硬件门槛。

生态系统集成

Lemonade 开箱即用地支持流行的 AI 应用:

实际用例

拥有 128GB 统一内存的用户可以加载 gpt-oss-120b 或 Qwen-Coder-Next 等大型模型进行高级工具使用。性能调优方面,--no-mmap 标志可加速加载时间并将上下文大小增加到 64K+ token。

意义

Lemonade 代表了 AMD 的战略押注:AI 推理的未来是本地的和异构的。通过同时支持 GPU 和 NPU,并保持严格的 OpenAI API 兼容性,AMD 正将 Lemonade 定位为云端 AI 服务的直接替代方案。

来源:lemonade-server.ai、Hacker News

← Previous: AMD Lemonade: Open Source Local AI Server Supporting GPU and NPUNext: Middle East Crisis Escalates: Oil Surges Past $110 as Trump Vows "Decisive Victory" Over Iran →
Comments0