技术深度解析
Tend提出的架构基于三大核心支柱:注意力状态模型、协商协议和本地协调引擎。与苹果的“专注模式”或谷歌的“数字健康”等集中式通知服务不同,Tend设想的是一个去中心化协议,用户的设备充当其注意力的主权代理。
注意力状态模型是用户认知上下文的机器可读表示。它超越了简单的“忙碌/空闲”二元状态,包含了以下维度:
- 认知负荷:估算的心理带宽,可能从应用程序使用模式、日历密集度,甚至在获得明确同意后从生物特征数据推断得出。
- 任务上下文:当前活跃的项目或目标,通常从活跃文档、通信线程或任务管理器API中提取。
- 可中断性评分:一个动态值,用于判定中断的成本,受上述因素及历史用户反馈影响。
该状态由轻量级守护进程注意力引擎在本地计算。该引擎接收来自操作系统、应用程序和连接设备的信号,以维持实时模型。一个关键的技术挑战是创建统一的、跨应用程序的上下文模型。Tend的白皮书建议,对窗口标题、文档内容和会议记录(在本地处理)利用自然语言处理技术,生成代表当前关注“主题”的嵌入向量。
协商协议是通信层。当AI智能体或应用程序需要用户注意力时,它会向本地引擎发送结构化的注意力请求。该请求包含元数据:意图(例如“通知”、“查询”、“需要操作”)、预计占用时间(交互将持续多久)、优先级(由请求方声明)以及最佳交互形式(例如横幅通知、音频提示、全屏接管)。本地引擎根据当前注意力状态评估此请求,应用用户配置的规则,并返回响应:“批准”、“拒绝”、“安排稍后”或“请求更多信息”。对于复杂场景,可能会发生简短的来回协商。
一个探索类似领域的相关开源项目是 `calm-notifications`(GitHub: calm-tech/calm-notifications),这是一个用于构建侵入性较低软件的框架。虽然它不是一个协议,但它体现了“平静技术”的理念,这也影响了Tend的方法。另一个是 `activitywatch`(GitHub: ActivityWatch/activitywatch),一个自动记录计算机使用情况的开源时间追踪器。Tend的上下文建模可以集成此类工具,从应用程序切换模式推断认知状态。
| 协议层 | 功能 | 关键创新 |
|---|---|---|
| 状态模型 | 编码用户的认知上下文和可中断性 | 多维、实时、本地计算 |
| 协商协议 | 用于注意力请求/响应的标准化API | 支持机器间就时机和形式进行协商 |
| 协调引擎 | 应用规则和策略的本地代理 | 用户主权;保护隐私;集成操作系统信号 |
核心洞见: 这份技术蓝图揭示了一个转变:从操作系统层面、基于规则的过滤,转向动态的、具备语义感知的代理系统。本地优先架构是出于隐私和响应性考虑的关键设计选择,但这给引擎从嘈杂数据中准确建模复杂人类状态的能力带来了重大负担。
关键参与者与案例研究
注意力管理这个领域参与者众多,但Tend的基础设施方法独树一帜。关键参与者可分为几类:
1. 操作系统级专注模式:苹果的“专注模式”、谷歌的“数字健康”和微软的“专注时段”是现有的解决方案。它们基于规则(时间/地点/应用程序)且由用户配置,但缺乏动态的上下文感知能力,无法与AI智能体协商。它们在屏蔽类别内对所有干扰一视同仁。
2. 企业工作流协调器:像 Zapier、Make 和 n8n 这样的工具在应用程序之间自动化工作流,但它们在数据层而非注意力层运行。它们生成的任务最终会成为其他应用程序中的通知,加剧了Tend旨在解决的问题。
3. AI智能体平台:Cognition Labs(Devon)、OpenAI(带动作的GPTs)和 xAI(Grok)正在构建日益自主的智能体。目前,这些智能体通过聊天界面与用户交互,或通过连接的应用程序生成通知。它们对用户更广泛的注意力状态没有内在理解。与像Tend这样的协议合作或集成将是一个合乎逻辑的演进方向。
4. 研究与学术界:像《注意力跨度》作者 Gloria Mark(加州大学欧文分校)这样的研究人员,已经通过实证记录了任务切换的高昂成本。MIT媒体实验室的“Rainbow”项目探索了使用传感器数据推断认知状态,这为Tend的上下文建模提供了潜在的技术基础。