认知工具:扩展上下文工程框架

"心智不是一个需要被填满的容器,而是一团需要被点燃的火焰。" — 普鲁塔克

从生物学到认知

我们在上下文工程中的旅程遵循了一个生物学隐喻:

┌──────────┐     ┌──────────┐     ┌──────────┐     ┌──────────┐
│          │     │          │     │          │     │          │
│  原子    │────►│  分子    │────►│  细胞    │────►│  器官    │
│          │     │          │     │          │     │          │
└──────────┘     └──────────┘     └──────────┘     └──────────┘
    │                │                │                │
    ▼                ▼                ▼                ▼
┌──────────┐     ┌──────────┐     ┌──────────┐     ┌──────────┐
│          │     │          │     │          │     │          │
│  提示词  │     │  少样本  │     │  记忆    │     │  多智能  │
│          │     │          │     │          │     │   体     │
└──────────┘     └──────────┘     └──────────┘     └──────────┘

现在,我们将通过与人类认知建立类比来扩展这个框架。正如人类思维使用认知工具来高效处理信息一样,我们可以为大语言模型创建类似的结构:

┌─────────────────────────────────────────────────────────────────────┐
│                      认知工具扩展                                    │
├──────────┬───────────────────┬──────────────────────────────────────┤
│          │                   │                                      │
│ 人类     │ 启发式方法        │ 简化复杂问题的心理捷径               │
│ 认知     │                   │                                      │
│          │                   │                                      │
├──────────┼───────────────────┼──────────────────────────────────────┤
│          │                   │                                      │
│ LLM      │ 提示程序          │ 引导模型推理的结构化                 │
│ 类比     │                   │ 提示模式                             │
│          │                   │                                      │
└──────────┴───────────────────┴──────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────────────┐
│                                                                     │
├──────────┬───────────────────┬──────────────────────────────────────┤
│          │                   │                                      │
│ 人类     │ 图式              │ 帮助分类信息的                       │
│ 认知     │                   │ 有组织的知识结构                     │
│          │                   │                                      │
├──────────┼───────────────────┼──────────────────────────────────────┤
│          │                   │                                      │
│ LLM      │ 上下文图式        │ 为模型构建信息的                     │
│ 类比     │                   │ 标准化格式                           │
│          │                   │                                      │
└──────────┴───────────────────┴──────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────────────┐
│                                                                     │
├──────────┬───────────────────┬──────────────────────────────────────┤
│          │                   │                                      │
│ 人类     │ 启动效应          │ 激活某些联想从而影响                 │
│ 认知     │                   │ 后续思维                             │
│          │                   │                                      │
├──────────┼───────────────────┼──────────────────────────────────────┤
│          │                   │                                      │
│ LLM      │ 递归提示          │ 塑造模型行为模式的                   │
│ 类比     │                   │ 自引用提示                           │
│          │                   │                                      │
└──────────┴───────────────────┴──────────────────────────────────────┘

认知工具?

用认知工具引发语言模型中的推理 - IBM苏黎世 2025年6月

作为推理工具调用的提示词和提示程序

"认知工具"将推理操作封装在LLM本身内部 — IBM苏黎世

这些认知工具(作为工具调用的结构化提示模板)通过识别手头的主要概念、提取问题中的相关信息,并突出显示可能有助于解决问题的有意义的属性、定理和技术来分解问题。

这些模板搭建了类似于认知心理捷径的推理层,通常被研究为"启发式方法"。

提示程序:LLM的算法思维(推理工具调用)

提示程序是一种结构化的、可重用的提示模式,旨在引导大语言模型的推理过程——类似于启发式方法如何引导人类思维。

从临时提示到程序化模式

让我们比较一个临时提示和一个简单的提示程序(推理工具调用):

┌───────────────────────────────────────────────────────────────┐
│ 临时提示                                                      │
├───────────────────────────────────────────────────────────────┤
│ "用3段话总结这篇关于气候变化的文章。                         │
│  让它易于理解。"                                              │
└───────────────────────────────────────────────────────────────┘

┌───────────────────────────────────────────────────────────────┐
│ 提示程序                                                      │
├───────────────────────────────────────────────────────────────┤
│ program Summarize(text, paragraphs=3, complexity="simple") {  │
│   // 定义任务                                                 │
│   task = `用${paragraphs}段话总结以下文本。                  │
│           使用${complexity}语言。`;                           │
│                                                               │
│   // 定义过程                                                 │
│   process = ```                                               │
│     1. 识别主题和关键点                                       │
│     2. 按重要性组织要点                                       │
│     3. 创建一个连贯的摘要,包含:                              │
│        - 第一段:主题和背景                                    │
│        - 中间段落:关键支持细节                                │
│        - 最后一段:结论或影响                                  │
│   ```;                                                        │
│                                                               │
│   // 定义输出格式                                             │
│   format = "使用${complexity}语言的${paragraphs}段摘要。";   │
│                                                               │
│   // 构建完整提示                                             │
│   return `${task}\n\n过程:\n${process}\n\n                   │
│           格式:\n${format}\n\n要总结的文本:\n${text}`;       │
│ }                                                             │
└───────────────────────────────────────────────────────────────┘

提示程序方法提供了几个优势:

可重用性:相同的模式可以应用于不同的文本
参数化:轻松定制长度、复杂度等
透明性:清晰的结构使提示的意图明确
一致性:在多次运行中产生更可预测的结果

简单提示程序模板

这里是创建自己提示程序的基本模板:

program [名称]([参数]) {
  // 定义任务
  task = `[使用参数的清晰指令]`;

  // 定义过程
  process = ```
    1. [第一步]
    2. [第二步]
    3. [根据需要添加额外步骤]
  ```;

  // 定义输出格式
  format = "[预期响应结构]";

  // 构建完整提示
  return `${task}\n\n过程:\n${process}\n\n格式:\n${format}\n\n[输入]`;
}

在实践中,这个模板可以通过多种方式实现:

作为文档中的伪代码或协议外壳
作为生成提示的实际JavaScript/Python函数
作为具有变量替换的YAML模板
作为标准化提示构建的JSON模式

推理提示模板(工具调用)

1. 逐步推理

将复杂推理分解为可管理步骤的基本模板。

markdown

# 逐步推理模板

任务:通过将以下问题分解为清晰、逻辑的步骤来解决它。

问题:{{problem}}

请遵循以下过程:
1. **理解**:重述问题并确定需要找到什么。
2. **计划**:概述解决问题的方法。
3. **执行**:详细完成计划的每一步。
   - 步骤1:[第一步的描述]
   - 步骤2:[第二步的描述]
   - 步骤3:[根据需要继续添加步骤]
4. **验证**:根据原始问题检查解决方案。
5. **总结**:清楚地陈述最终答案或结论。

展示所有工作并在每一步解释推理。

Token计数:约130个token(仅模板)

什么是协议外壳?(推理工具调用)

协议外壳是将与AI系统的通信组织成清晰、一致模式的结构化无代码模板。把它们看作建立以下内容的对话蓝图:

意图:你试图完成什么
输入:你提供什么信息
过程:信息应该如何处理
输出:你期望什么结果

基本协议外壳结构

/protocol.name{
    intent="明确的目的声明",
    input={
        param1="value1",
        param2="value2"
    },
    process=[
        /step1{action="做某事"},
        /step2{action="做其他事"}
    ],
    output={
        result1="预期输出1",
        result2="预期输出2"
    }
}

这种结构创建了一个清晰、token高效的框架,你和AI都可以遵循。

反思练习:看看你最近与AI的对话。你能识别出一直在使用的隐式结构吗(即情感上下文、潜在意图、长期目标、矛盾输入等)?将这些形式化为协议外壳并使数据更明确如何改进你的互动?

协议外壳的解剖

让我们剖析协议外壳的每个组件以了解其目的和力量:

┌─────────────────────────────────────────────────────────┐
│                    协议解剖                              │
├─────────────────────────────────────────────────────────┤
│                                                         │
│  /protocol.name{                                        │
│    │       │                                            │
│    │       └── 子类型或特定变体                         │
│    │                                                    │
│    └── 核心协议类型                                     │
│                                                         │
│    intent="明确的目的声明",                             │
│    │       │                                            │
│    │       └── 引导AI理解目标                           │
│    │                                                    │
│    └── 声明目标                                         │
│                                                         │
│    input={                                              │
│        param1="value1",   ◄── 结构化输入数据            │
│        param2="value2"                                  │
│    },                                                   │
│                                                         │
│    process=[                                            │
│        /step1{action="做某事"},     ◄── 有序            │
│        /step2{action="做其他事"} ◄── 步骤               │
│    ],                                                   │
│                                                         │
│    output={                                             │
│        result1="预期输出1",   ◄── 输出                  │
│        result2="预期输出2"    ◄── 规范                  │
│    }                                                    │
│  }                                                      │
│                                                         │
└─────────────────────────────────────────────────────────┘

上下文图式:结构化信息模式

正如人类思维使用图式来组织知识一样,我们可以为LLM创建上下文图式——构建信息以改善模型理解的标准化方法。

基本图式结构

┌───────────────────────────────────────────────────────────────┐
│ 上下文图式                                                     │
├───────────────────────────────────────────────────────────────┤
│ {                                                             │
│   "$schema": "context-engineering/schemas/v1.json",           │
│   "title": "分析请求图式",                                    │
│   "description": "请求分析的标准格式",                        │
│   "type": "object",                                           │
│   "properties": {                                             │
│     "task": {                                                 │
│       "type": "string",                                       │
│       "description": "要执行的分析任务"                       │
│     },                                                        │
│     "context": {                                              │
│       "type": "object",                                       │
│       "properties": {                                         │
│         "background": { "type": "string" },                   │
│         "constraints": { "type": "array" },                   │
│         "examples": { "type": "array" }                       │
│       }                                                       │
│     },                                                        │
│     "data": {                                                 │
│       "type": "string",                                       │
│       "description": "要分析的信息"                           │
│     },                                                        │
│     "output_format": {                                        │
│       "type": "string",                                       │
│       "enum": ["bullet_points", "paragraphs", "table"]        │
│     }                                                         │
│   },                                                          │
│   "required": ["task", "data"]                                │
│ }                                                             │
└───────────────────────────────────────────────────────────────┘

MEM1:学习协同记忆和推理以实现高效长视野智能体 - 新加坡-MIT 2025年6月

"我们的结果展示了推理驱动的记忆整合作为训练长视野交互智能体的可扩展替代方案的前景,在这种方案中效率和性能都得到了优化。" — 新加坡-MIT

从图式到提示

图式可以通过填充结构化模板转换为实际提示:

# 分析请求

## 任务
识别提供文本中的主要主题和支持证据。

## 上下文
### 背景
这是2023年在气候会议上发表的演讲。

### 约束
- 关注科学主张
- 忽略政治声明
- 保持中立

### 示例
- 主题:海平面上升
  证据:"测量显示自2010年以来每年上升3.4毫米"

## 数据
[演讲的完整文本将放在这里]

## 输出格式
bullet_points

这种结构化方法帮助模型准确理解正在提供什么信息以及期望返回什么。

递归提示:自引用改进

递归提示类似于认知启动——它建立影响后续模型行为的模式。关键洞察是让模型反思并改进自己的输出。

基本递归模式

┌───────────────────────────────────────────────────────────────┐
│ 递归提示流程                                                   │
│                                                               │
│  ┌─────────────┐      ┌─────────────┐      ┌─────────────┐    │
│  │             │      │             │      │             │    │
│  │  初始       │─────►│  自我       │─────►│  改进后的   │    │
│  │  响应       │      │  反思       │      │  响应       │    │
│  │             │      │             │      │             │    │
│  └─────────────┘      └─────────────┘      └─────────────┘    │
│        ▲                                          │           │
│        └──────────────────────────────────────────┘           │
│                                                               │
└───────────────────────────────────────────────────────────────┘

简单实现

python

def recursive_prompt(question, model, iterations=2):
    """应用递归提示来改进响应。"""

    # 初始响应
    response = model.generate(f"问题: {question}\n答案:")

    for i in range(iterations):
        # 自我反思提示
        reflection_prompt = f"""
        问题: {question}

        你之前的答案:
        {response}

        请反思你的答案:
        1. 可能缺少什么信息?
        2. 是否有应该质疑的假设?
        3. 如何使解释更清晰或更准确?

        现在,提供一个改进的答案:
        """

        # 生成改进的响应
        response = model.generate(reflection_prompt)

    return response

这种简单的递归模式可以通过鼓励模型批评和完善自己的思维来显著改善响应质量。

整合一切:认知架构

这些认知工具可以组合成一个反映人类思维过程的完整架构:

┌───────────────────────────────────────────────────────────────────────────┐
│                      认知架构                                             │
│                                                                           │
│  ┌─────────────────┐                                                      │
│  │                 │                                                      │
│  │  输入解析器     │  使用图式识别理解用户意图                            │
│  │                 │                                                      │
│  └─────────────────┘                                                      │
│         │                                                                 │
│         ▼                                                                 │
│  ┌─────────────────┐                                                      │
│  │                 │                                                      │
│  │  提示程序       │  选择并应用适当的推理模式                            │
│  │  选择器         │                                                      │
│  │                 │                                                      │
│  └─────────────────┘                                                      │
│         │                                                                 │
│         ▼                                                                 │
│  ┌─────────────────┐                                                      │
│  │                 │                                                      │
│  │  工作记忆       │  在步骤间维护状态和上下文                            │
│  │                 │                                                      │
│  └─────────────────┘                                                      │
│         │                                                                 │
│         ▼                                                                 │
│  ┌─────────────────┐                                                      │
│  │                 │                                                      │
│  │  递归           │  通过反思应用自我改进                                │
│  │  处理器         │                                                      │
│  │                 │                                                      │
│  └─────────────────┘                                                      │
│         │                                                                 │
│         ▼                                                                 │
│  ┌─────────────────┐                                                      │
│  │                 │                                                      │
│  │  输出           │  根据图式格式化最终响应                              │
│  │  格式化器       │                                                      │
│  │                 │                                                      │
│  └─────────────────┘                                                      │
│                                                                           │
└───────────────────────────────────────────────────────────────────────────┘

这个架构可以使用我们讨论过的工具和模式实现为一个完整的系统。

关键要点

提示程序/协议像人类启发式方法一样构建推理
上下文图式像心理知识结构一样组织信息
递归提示创建类似于认知反思的自我改进循环
认知架构将这些工具组合成完整系统

这些对我们上下文工程框架的认知扩展使我们能够创建更复杂但可理解的处理LLM的方法。

练习实践

将你经常使用的提示之一转换为提示程序
为你用LLM执行的常见任务创建一个简单图式
实现基本递归提示以改进响应质量
将这些方法组合成一个迷你认知架构

下一步

在接下来的章节中,我们将探索这些认知工具的实际实现:

演示提示程序实际应用的Jupyter笔记本
创建自己图式的模板
完整认知架构的示例

继续下一节 →

深入探讨:从我们的研究到你的应用

上述认知工具是更高级研究概念的简化表示。对于有兴趣进一步探索的人:

提示程序是研究人员所称的"程序化提示"或"结构化提示框架"的实际实现
上下文图式代表知识表示系统和本体框架的简化版本
递归提示与AI系统中的自我反思、元认知和递归自我改进相关

这些简化框架使高级概念易于理解,同时保持其实用性。

认知工具:扩展上下文工程框架 ​

从生物学到认知 ​

认知工具? ​

用认知工具引发语言模型中的推理 - IBM苏黎世 2025年6月 ​

作为推理工具调用的提示词和提示程序 ​

提示程序:LLM的算法思维(推理工具调用) ​

从临时提示到程序化模式 ​

简单提示程序模板 ​

推理提示模板(工具调用) ​

1. 逐步推理 ​

什么是协议外壳?(推理工具调用) ​

基本协议外壳结构 ​

协议外壳的解剖 ​

上下文图式:结构化信息模式 ​

基本图式结构 ​

MEM1:学习协同记忆和推理以实现高效长视野智能体 - 新加坡-MIT 2025年6月 ​

从图式到提示 ​

递归提示:自引用改进 ​

基本递归模式 ​

简单实现 ​

整合一切:认知架构 ​

关键要点 ​

练习实践 ​

下一步 ​

深入探讨:从我们的研究到你的应用 ​