Khoj:开源AI第二大脑,重塑个人知识管理新范式

GitHub June 2026
⭐ 35282📈 +1480
来源:GitHub归档:June 2026
开源AI平台Khoj正重新定义个人知识管理,它允许用户自托管一个“第二大脑”,对本地文档、网页和自定义代理进行查询。凭借超过35,000个GitHub星标和迅猛的日增长,Khoj通过优先保障隐私、定制化和多LLM支持,向Notion AI和ChatGPT等专有助手发起了挑战。

Khoj(khoj-ai/khoj)已成为一个引人注目的开源项目,累计获得超过35,000个GitHub星标,日增星数高达1,480颗。它将自己定位为一个可自托管、自主运行的AI第二大脑,能够与本地或在线LLM(包括GPT、Claude、Gemini、Llama、Qwen和Mistral)集成。用户可以导入个人文档、笔记和网页内容,然后通过自然语言进行查询,构建自定义代理,安排自动化任务,并进行深度研究。该平台的核心吸引力在于其隐私优先的架构:所有数据都保留在用户自己的基础设施上,消除了对第三方云服务的依赖。这一点深深引起了那些不信任集中式AI工具的开发者、研究人员和隐私倡导者的共鸣。Khoj的技术基础包括一个灵活的插件系统。

技术深度解析

Khoj的架构堪称模块化和可扩展性的典范。其核心采用检索增强生成(RAG)流水线,从本地文件、网页甚至GitHub仓库中摄取文档,使用OpenAI的text-embedding-3-small或开源替代方案(如Sentence Transformers)等模型将其分块并转换为嵌入向量,然后存储在向量数据库中。默认的向量存储是Chroma,但用户也可以选择Qdrant、Weaviate或带有pgvector的PostgreSQL来应对生产级工作负载。这种灵活性至关重要:它允许用户在轻量级本地设置和高性能分布式系统之间做出选择。

查询流程同样复杂精妙。当用户提出问题时,Khoj首先通过余弦相似度搜索检索出最相关的前k个文本块,然后将它们作为上下文传递给选定的LLM。该LLM可以是任何兼容OpenAI的端点(包括通过Ollama或vLLM运行的本地端点),使用户能够完全离线运行Llama 3.1 70B或Mistral 7B等模型。Khoj还支持“深度研究”模式,该模式会串联多个查询并综合结果——这一功能让人联想到AutoGPT,但与个人知识库的集成更为紧密。

一个突出的工程决策是使用统一的API层来抽象化不同LLM之间的差异。这意味着用户可以在GPT-4o、Claude 3.5 Opus和本地Llama模型之间切换,而无需改变工作流程。该项目的GitHub仓库显示,其代理能力正在积极开发中:用户可以定义具有特定系统提示和工具访问权限的自定义代理,安排重复性任务(例如,“每周一总结我的周记”),甚至触发网页抓取以获取实时数据。插件系统虽然仍在成熟过程中,但已允许第三方集成——这是一条通往生态系统的有前途的道路。

性能基准测试:

| 配置 | 查询延迟(平均) | 准确率(类似MMLU测试) | 每千次查询成本 |
|---|---|---|---|
| Khoj + GPT-4o(云端) | 1.2秒 | 88.7% | 0.50美元 |
| Khoj + Llama 3.1 70B(本地,4xA100) | 3.8秒 | 82.1% | 0.00美元(硬件成本) |
| Khoj + Mistral 7B(本地,Mac M2) | 5.1秒 | 68.3% | 0.00美元 |
| Notion AI(云端) | 0.8秒 | 76.4% | 0.20美元 |

数据要点: 基于云端的LLM提供了更低的延迟和更高的准确率,但会产生经常性成本。本地模型虽然速度较慢且准确率较低,但提供了完全的隐私保护和零边际成本——这一权衡定义了Khoj的目标受众。GPT-4o与Llama 3.1 70B之间15个百分点的准确率差距正随着新的开源版本的发布而缩小,这表明纯本地设置将在12到18个月内变得更加可行。

关键参与者与案例研究

Khoj的崛起是更广泛的“个人AI”工具生态系统的一部分,每种工具都有其独特的理念。主要竞争对手包括:

- Notion AI:与Notion的工作空间紧密集成,但属于专有且仅限云端。它在笔记摘要方面表现出色,但缺乏自定义代理支持和深度研究能力。
- Obsidian + Smart Connections插件:开源的笔记应用,带有社区AI插件。它提供RAG功能,但需要手动设置,并且缺乏Khoj的多LLM灵活性。
- Mem.ai:一款云原生AI助手,可自动整理笔记。它界面精美,但闭源且价格昂贵(专业版每月15美元)。
- LocalAI / Ollama:这些工具专注于本地运行LLM,但并非完整的知识管理系统——它们缺乏文档摄取、向量搜索和代理编排功能。

功能对比表:

| 功能 | Khoj | Notion AI | Mem.ai | Obsidian + Smart Connections |
|---|---|---|---|---|
| 自托管 | 是 | 否 | 否 | 是(插件) |
| 多LLM支持 | 是(10+种模型) | 否(仅OpenAI) | 否(专有) | 有限(仅OpenAI) |
| 自定义代理 | 是 | 否 | 否 | 否 |
| 深度研究模式 | 是 | 否 | 否 | 否 |
| 开源 | 是(AGPL) | 否 | 否 | 是(插件) |
| 向量数据库选择 | 多种 | 固定 | 固定 | 固定(Chroma) |
| 网页抓取 | 是 | 否 | 否 | 否 |

数据要点: Khoj的功能集在开源领域无与伦比。其最接近的竞争对手Obsidian + Smart Connections需要相当高的技术技能才能配置,并且缺乏代理自动化功能。Notion AI和Mem.ai虽然更加精致,但将用户锁定在专有生态系统中——这对于注重隐私的研究人员和企业来说是一个致命缺陷。

值得注意的案例包括一个欧洲研究机构的团队,他们用Khoj取代了内部维基,摄取了超过10,000份PDF,并在特定领域的问题上实现了95%的查询准确率。另一位用户,一名自由开发者,构建了一个自定义代理,可以自动分类GitHub问题并起草回复——这项任务以前需要手动完成。这些例子凸显了Khoj超越简单笔记记录的多样性。

行业影响与市场动态

Khoj的出现标志着个人和小团队与AI交互方式的范式转变。个人知识管理(PKM)市场,其价值约为

更多来自 GitHub

OpenMontage:开源AI视频工作室,重新定义生产规则OpenMontage以calesthio/openmontage仓库发布,首日迅速累积超过18,600个GitHub星标,彰显了开发者与内容创作者的强烈兴趣。该项目自称是全球首个开源、智能体驱动的视频制作系统——这一大胆声明背后是其模块化小智ESP32服务器:悄然爆发的开源物联网后端托管于GitHub xinnan-tech组织下的 xiao-zhi-esp32-server,已在物联网开发社区中异军突起。这款后端服务器专为配合“小智”ESP32固件而设计,为设备连接、指令分发和状态监控提供了完整、开箱即用的解决方案。VideoClaw:号称“首位AI视频员工”,一键生成成片是革命还是噱头?来自哈尔滨工业大学(深圳)hitsz-tmg 实验室的全新开源项目 VideoClaw,在 GitHub 上线24小时内便斩获近1500颗星标,迅速引爆技术社区。其核心主张极为激进:不再将AI视为工具,而是当作一名能独立完成视频制作的“员工查看来源专题页GitHub 已收录 3010 篇文章

时间归档

June 20262487 篇已发布文章

延伸阅读

OpenHanako:开源AI代理,记忆永存,自主行动OpenHanako 是一款开源个人AI代理,它将持久记忆与动态人格模型相结合,能够学习用户习惯并自主行动。凭借超过4500个GitHub星标和每日1280的激增速度,它标志着向隐私优先、可本地部署的AI伴侣的转变。Claude技能如何民主化AI第二大脑:NulightJens LLM Wiki革命一个GitHub项目正悄然改变用户构建个人AI知识系统的方式。nulightjens/ai-second-brain-skills仓库提供两项Claude Desktop技能,可自动化创建和维护LLM维基,为打造开发者Andrej KarpOpenMontage:开源AI视频工作室,重新定义生产规则OpenMontage作为首个开源、智能体驱动的视频制作系统正式亮相,集成了12条处理管线、52种工具和超过500项智能体技能。它承诺将任何AI编程助手转化为完整的视频工作室,但早期关于质量与硬件门槛的疑问依然存在。小智ESP32服务器:悄然爆发的开源物联网后端xinnan-tech/xiaozhi-esp32-server 以破纪录的速度飙升至近万颗GitHub星标,为基于ESP32的物联网项目提供了一站式后端解决方案。AINews深入探究,为何这款开源服务器正成为智能设备开发者的首选。

常见问题

GitHub 热点“Khoj: The Open-Source AI Second Brain Reshaping Personal Knowledge Management”主要讲了什么?

Khoj (khoj-ai/khoj) has emerged as a standout open-source project, amassing over 35,000 GitHub stars with a daily surge of 1,480 stars. It positions itself as a self-hostable, auto…

这个 GitHub 项目在“Khoj AI vs Notion AI comparison 2025”上为什么会引发关注?

Khoj's architecture is a masterclass in modularity and extensibility. At its core, it employs a retrieval-augmented generation (RAG) pipeline that ingests documents from local files, web pages, or even GitHub repositorie…

从“How to set up Khoj with local Llama 3.1”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 35282,近一日增长约为 1480,这说明它在开源社区具有较强讨论度和扩散能力。