AMD Lemonade：支持 GPU 和 NPU 的开源本地 AI 服务器

2026-04-03T03:04:59.000Z·★ 80·1 min read

# AMD Lemonade：支持 GPU 和 NPU 的开源本地 AI 服务器 AMD 发布了 **Lemonade**——一个快速、开源的本地 AI 服务器，可在 GPU 和 NPU 上运行，使开发者和用户能够在自己的硬件上私密运行多个 AI 模型。 ## 什么是 Lemonade？ Lemonade 是一个轻量级、本地优先的 AI 服务器，为多种 AI 模态提供统一 API： - *

AMD 发布了 Lemonade——一个快速、开源的本地 AI 服务器，可在 GPU 和 NPU 上运行，使开发者和用户能够在自己的硬件上私密运行多个 AI 模型。

什么是 Lemonade？

Lemonade 是一个轻量级、本地优先的 AI 服务器，为多种 AI 模态提供统一 API：

文本生成——聊天、代码补全和通用语言任务
图像生成——内置文本到图像功能
语音——转录和语音生成
视觉——图像理解和分析

全部在您自己的硬件上本地运行——无需云服务。

主要特性

技术规格

特性	详情
后端	原生 C++（仅 2MB）
安装时间	约 1 分钟
API 兼容性	OpenAI API 标准
硬件	GPU + NPU 自动配置
引擎支持	llama.cpp、Ryzen AI SW、FastFlowLM
平台	Windows、Linux、macOS（beta）
并发模型	同时运行多个模型

统一 API

一个本地服务处理每种模态：

POST /api/v1/chat/completions 用于文本
用于图像、语音和视觉的标准 API 端点
兼容支持 OpenAI API 的数百个应用

内置 GUI

图形界面让用户可以：

直接下载模型
快速尝试不同模型
无需配置更改即可切换模型

硬件要求

Lemonade 针对实用的本地 AI 工作流进行了优化：

GPU 支持——支持 AMD 和 NVIDIA GPU
NPU 支持——利用神经处理单元提高效率
128GB RAM——可加载大型模型如 gpt-oss-120b 或 Qwen-Coder-Next
自动配置——检测并配置您的特定硬件

为何重要

本地 AI 运动

Lemonade 加入了不断增长的本地 AI 工具生态系统：

隐私——所有数据留在您的机器上
成本——无 API 费用，无订阅成本
速度——直接硬件访问，无网络延迟
控制——完全控制运行哪些模型以及如何运行

AMD 的 AI 策略

对 AMD 来说，Lemonade 代表着战略举措：

生态布局——使 AMD 硬件成为本地 AI 的首选平台
NPU 发挥——展示 AMD 的 NPU 能力（Ryzen AI）
开源——建立社区好感和开发者采用
多引擎——不将用户锁定在单一模型运行时

竞争对比

工具	开发者	GPU	NPU	开源
Lemonade	AMD	✅	✅	✅
LM Studio	Independent	✅	❌	❌
Ollama	Independent	✅	❌	✅
GPT4All	Nomic	✅	❌	✅

Lemonade 的关键差异化优势是 NPU 支持，这可能为 AMD 硬件上的 AI 推理提供显著的能效优势。

快速开始

安装设计得很简单：

下载安装程序
运行一分钟设置（自动配置依赖项）
打开 GUI 下载和尝试模型
将任何 OpenAI 兼容应用指向 localhost 即可开始

从下载到运行第一个模型的整个过程大约只需一分钟。

来源：lemonade-server.ai、Hacker News

Comments0