AMD Lemonade:支持 GPU 和 NPU 的开源本地 AI 服务器

2026-04-03T03:04:59.000Z·★ 80·1 min read
# AMD Lemonade:支持 GPU 和 NPU 的开源本地 AI 服务器 AMD 发布了 **Lemonade**——一个快速、开源的本地 AI 服务器,可在 GPU 和 NPU 上运行,使开发者和用户能够在自己的硬件上私密运行多个 AI 模型。 ## 什么是 Lemonade? Lemonade 是一个轻量级、本地优先的 AI 服务器,为多种 AI 模态提供统一 API: - *

AMD 发布了 Lemonade——一个快速、开源的本地 AI 服务器,可在 GPU 和 NPU 上运行,使开发者和用户能够在自己的硬件上私密运行多个 AI 模型。

什么是 Lemonade?

Lemonade 是一个轻量级、本地优先的 AI 服务器,为多种 AI 模态提供统一 API:

全部在您自己的硬件上本地运行——无需云服务。

主要特性

技术规格

特性详情
后端原生 C++(仅 2MB)
安装时间约 1 分钟
API 兼容性OpenAI API 标准
硬件GPU + NPU 自动配置
引擎支持llama.cpp、Ryzen AI SW、FastFlowLM
平台Windows、Linux、macOS(beta)
并发模型同时运行多个模型

统一 API

一个本地服务处理每种模态:

内置 GUI

图形界面让用户可以:

硬件要求

Lemonade 针对实用的本地 AI 工作流进行了优化:

为何重要

本地 AI 运动

Lemonade 加入了不断增长的本地 AI 工具生态系统:

AMD 的 AI 策略

对 AMD 来说,Lemonade 代表着战略举措:

竞争对比

工具开发者GPUNPU开源
LemonadeAMD
LM StudioIndependent
OllamaIndependent
GPT4AllNomic

Lemonade 的关键差异化优势是 NPU 支持,这可能为 AMD 硬件上的 AI 推理提供显著的能效优势。

快速开始

安装设计得很简单:

  1. 下载安装程序
  2. 运行一分钟设置(自动配置依赖项)
  3. 打开 GUI 下载和尝试模型
  4. 将任何 OpenAI 兼容应用指向 localhost 即可开始

从下载到运行第一个模型的整个过程大约只需一分钟。

来源:lemonade-server.ai、Hacker News

← Previous: AMD Lemonade: Open Source Local AI Server for Text, Images, and SpeechNext: China's Former Xinjiang Party Secretary Ma Xingrui Under Investigation: Political Earthquake in Beijing →
Comments0