将整个Linux内核Git历史导入PostgreSQL:142万次提交变成SQL查询
Available in: 中文
一位开发者成功将完整的Linux内核git历史导入PostgreSQL,使用pgit(一个Git-like CLI,所有数据存储在SQL数据库而非文件系统中)。该项目在HN上获得151分和37条评论。
pgit:Linux内核变成SQL数据库 — 142万次提交,20年开发历史
一位开发者成功将完整的Linux内核git历史导入PostgreSQL,使用pgit(一个Git-like CLI,所有数据存储在SQL数据库而非文件系统中)。该项目在HN上获得151分和37条评论。
导入规模
| 指标 | 数值 |
|---|---|
| 提交数 | 1,428,882 |
| 文件版本 | 24,384,844 |
| 唯一blob | 3,089,589 |
| 唯一路径 | 171,525 |
| 贡献者 | 38,000 |
| 导入时间 | 2小时 |
| 数据大小 | 2.7 GB |
硬件配置
AMD EPYC 7401P (24核/48线程)、512GB DDR4 ECC、2x1.92TB SSD RAID 0、Hetzner芬兰数据中心
有趣发现
- 142万条提交消息中仅发现7个f词(全部来自2个人)
- 665个bug修复指向同一个提交
- 一个文件系统花了13年才合并
技术价值
这使得整个Linux内核开发历史可通过SQL查询,开启了代码考古学、开发者分析和大规模代码库理解的新可能。
来源: oseifert.ch — HN 151分
← Previous: Trump Denies Iran 10-Point Peace Plan as 'Fake News', US Military Stays in IranNext: C# in Unity 2026: Modern Features Most Developers Still Don't Use →
0