Hypura：面向 Apple Silicon 的存储感知 LLM 推理调度器

Available in: 中文

2026-03-25T11:19:15.099Z·1 min read

Hypura 是一个新的开源存储感知 LLM 推理调度器，专为 Apple Silicon 设计，优化模型数据在 RAM 和存储之间的移动，使更大的模型能在内存受限的 Mac 上高效运行。

Hypura 为 Apple Silicon 上的 LLM 推理引入分层存储优化

一个名为 Hypura 的新开源项目推出了一款存储分层感知调度器，用于在 Apple Silicon Mac 上运行 LLM 推理。该工具优化了模型数据在推理期间在内存和存储之间的移动，解决了在内存受限设备上运行大模型的关键瓶颈。

在 Apple Silicon 上运行大型语言模型很流行但充满挑战：

Hypura 为推理管道增加了智能：

Apple Silicon 的统一内存架构既是优势也是约束。虽然内存带宽极佳（M3 Max 为 400 GB/s），但总容量在购买时固定。Hypura 最大化了在任何给定 Mac 配置上能有效运行的模型大小。

该项目可在 GitHub 上以 t8/hypura 获取。

Comments0