Skip to content

Token预算:语境的经济学

"获取知识,每天增加事物。获取智慧,每天减少事物。"

— 老子

1. 简介:Token经济为何重要

与AI的每次交互都有一种有限的资源:语境窗口tokens。像任何稀缺资源一样,tokens必须明智地预算以最大化价值。Token预算是分配这个有限空间以实现最优结果的艺术和科学。

将你的语境窗口想象成宝贵的房地产——每个token占据的空间都可以用于其他事物。平庸和卓越的AI交互之间的区别通常归结为你管理这种token经济的有效性。

苏格拉底式问题:你是否曾在重要交互期间用完语境空间?你必须牺牲什么信息,这如何影响结果?深思熟虑的token预算如何改变那次体验?

[文档包含完整的token预算策略、优化技术和实践模式,包括:]

主要内容

2. Token预算的三大支柱

2.1. 分配

  • 系统指令:15-20%
  • 示例:10-30%
  • 历史:30-50%
  • 查询:5-15%
  • 保留:5-10%

2.2. 优化

  • 压缩
  • 修剪
  • 格式化
  • 摘要化
  • 选择性保留

2.3. 适应

  • 渐进式披露
  • 语境循环
  • 优先级转移
  • 重新分配
  • 应急措施

3. Token分配策略

3.1. 40-30-20-10规则

适用于许多场景的通用分配。

3.2. 教程分配

针对教学概念或过程进行优化。

3.3. 创意协作

专为写作或头脑风暴等创意项目设计。

3.4. 研究助手

为深入研究和分析构建。

3.5. 动态分配器

/allocate.dynamic{
    initialization_phase={
        system=40%,
        examples=40%,
        history=5%,
        query=10%,
        reserve=5%
    },
    development_phase={
        system=20%,
        examples=20%,
        history=40%,
        query=15%,
        reserve=5%
    }
}

4. Token优化技术

4.1. 压缩技术

  • 简洁的语言
  • 缩写
  • 格式效率
  • 代码紧凑
  • 信息密度

4.2. 修剪策略

/prune.conversation_history{
    retain={
        decisions=true,
        definitions=true,
        key_insights=true,
        recent_exchanges=5
    },
    remove={
        acknowledgments=true,
        repetitions=true,
        tangential_discussions=true,
        superseded_information=true
    }
}

4.3. 摘要方法

  • 关键点提取
  • 渐进式摘要
  • 基于主题的摘要
  • 以决策为中心的摘要
  • 分层摘要

4.4. 选择性保留

/retain.selective{
    prioritize=[
        {type="definitions", strategy="verbatim", decay="none"},
        {type="decisions", strategy="key_points", decay="slow"},
        {type="context_shifts", strategy="markers", decay="medium"},
        {type="general_discussion", strategy="progressive_summary", decay="fast"}
    ]
}

5. 动态适应

5.1. 渐进式披露

根据需要仅揭示信息。

5.2. 语境循环

将不同信息轮换进出语境。

5.3. 记忆系统

/memory.structured{
    types=[
        {name="episodic", content="conversation history"},
        {name="semantic", content="facts, definitions, concepts"},
        {name="procedural", content="methods, approaches, techniques"}
    ]
}

5.4. 危机管理

处理达到token限制的情况。

6. Token预算模式

6.1. 最小语境模式

为简单、集中的交互设计。

6.2. 专家协作模式

针对与专家AI的复杂来回交流进行优化。

6.3. 长期对话模式

为随时间的扩展交互设计。

6.4. 场感知预算模式

/context.field_aware{
    initial_allocation={
        system_instructions=15%,
        field_state=10%,
        attractor_definitions=10%,
        active_content=50%,
        reserve=15%
    },
    field_management={
        attractors="core concepts, goals, constraints",
        boundaries="permeability based on relevance",
        resonance="strengthen connections between key elements"
    }
}

7. 测量和改进Token效率

关键指标

  • Token利用率
  • 信息密度
  • 重复率
  • 相关性得分
  • 结果效率

8. 高级Token预算

8.1. 多模态Token效率

跨不同类型内容优化。

8.2. Token感知信息架构

设计考虑token效率的信息结构。

8.3. 预测性Token管理

在需求出现之前预测token需求。

8.4. 场论整合

将场论原理应用于token预算。

9. Token预算心智模型

9.1. 房地产模型

将语境窗口想象成宝贵的地产。

9.2. 经济模型

将tokens视为要预算和投资的货币。

9.3. 生态系统模型

将语境视为活的生态系统。

10. 结论:Token经济的艺术

Token预算既是科学也是艺术。科学在于我们探索的指标、技术和模式。艺术在于将这些原则创造性地应用于你的特定需求。

关键原则:

  1. 有意识地分配token
  2. 不懈地优化每个token的最大价值
  3. 动态适应随对话演变
  4. 测量和改进你的token效率
  5. 应用心智模型增强理解

通过实践,你将培养对token经济的直觉感知,实现更强大、更高效、更有效的AI交互。


"完美的达成,不是当没有更多要添加的时候,而是当没有什么可以拿走的时候。"

— 安托万·德·圣埃克苏佩里

基于 MIT 许可发布