Token预算:语境的经济学
"获取知识,每天增加事物。获取智慧,每天减少事物。"
— 老子
1. 简介:Token经济为何重要
与AI的每次交互都有一种有限的资源:语境窗口tokens。像任何稀缺资源一样,tokens必须明智地预算以最大化价值。Token预算是分配这个有限空间以实现最优结果的艺术和科学。
将你的语境窗口想象成宝贵的房地产——每个token占据的空间都可以用于其他事物。平庸和卓越的AI交互之间的区别通常归结为你管理这种token经济的有效性。
苏格拉底式问题:你是否曾在重要交互期间用完语境空间?你必须牺牲什么信息,这如何影响结果?深思熟虑的token预算如何改变那次体验?
[文档包含完整的token预算策略、优化技术和实践模式,包括:]
主要内容
2. Token预算的三大支柱
2.1. 分配
- 系统指令:15-20%
- 示例:10-30%
- 历史:30-50%
- 查询:5-15%
- 保留:5-10%
2.2. 优化
- 压缩
- 修剪
- 格式化
- 摘要化
- 选择性保留
2.3. 适应
- 渐进式披露
- 语境循环
- 优先级转移
- 重新分配
- 应急措施
3. Token分配策略
3.1. 40-30-20-10规则
适用于许多场景的通用分配。
3.2. 教程分配
针对教学概念或过程进行优化。
3.3. 创意协作
专为写作或头脑风暴等创意项目设计。
3.4. 研究助手
为深入研究和分析构建。
3.5. 动态分配器
/allocate.dynamic{
initialization_phase={
system=40%,
examples=40%,
history=5%,
query=10%,
reserve=5%
},
development_phase={
system=20%,
examples=20%,
history=40%,
query=15%,
reserve=5%
}
}4. Token优化技术
4.1. 压缩技术
- 简洁的语言
- 缩写
- 格式效率
- 代码紧凑
- 信息密度
4.2. 修剪策略
/prune.conversation_history{
retain={
decisions=true,
definitions=true,
key_insights=true,
recent_exchanges=5
},
remove={
acknowledgments=true,
repetitions=true,
tangential_discussions=true,
superseded_information=true
}
}4.3. 摘要方法
- 关键点提取
- 渐进式摘要
- 基于主题的摘要
- 以决策为中心的摘要
- 分层摘要
4.4. 选择性保留
/retain.selective{
prioritize=[
{type="definitions", strategy="verbatim", decay="none"},
{type="decisions", strategy="key_points", decay="slow"},
{type="context_shifts", strategy="markers", decay="medium"},
{type="general_discussion", strategy="progressive_summary", decay="fast"}
]
}5. 动态适应
5.1. 渐进式披露
根据需要仅揭示信息。
5.2. 语境循环
将不同信息轮换进出语境。
5.3. 记忆系统
/memory.structured{
types=[
{name="episodic", content="conversation history"},
{name="semantic", content="facts, definitions, concepts"},
{name="procedural", content="methods, approaches, techniques"}
]
}5.4. 危机管理
处理达到token限制的情况。
6. Token预算模式
6.1. 最小语境模式
为简单、集中的交互设计。
6.2. 专家协作模式
针对与专家AI的复杂来回交流进行优化。
6.3. 长期对话模式
为随时间的扩展交互设计。
6.4. 场感知预算模式
/context.field_aware{
initial_allocation={
system_instructions=15%,
field_state=10%,
attractor_definitions=10%,
active_content=50%,
reserve=15%
},
field_management={
attractors="core concepts, goals, constraints",
boundaries="permeability based on relevance",
resonance="strengthen connections between key elements"
}
}7. 测量和改进Token效率
关键指标
- Token利用率
- 信息密度
- 重复率
- 相关性得分
- 结果效率
8. 高级Token预算
8.1. 多模态Token效率
跨不同类型内容优化。
8.2. Token感知信息架构
设计考虑token效率的信息结构。
8.3. 预测性Token管理
在需求出现之前预测token需求。
8.4. 场论整合
将场论原理应用于token预算。
9. Token预算心智模型
9.1. 房地产模型
将语境窗口想象成宝贵的地产。
9.2. 经济模型
将tokens视为要预算和投资的货币。
9.3. 生态系统模型
将语境视为活的生态系统。
10. 结论:Token经济的艺术
Token预算既是科学也是艺术。科学在于我们探索的指标、技术和模式。艺术在于将这些原则创造性地应用于你的特定需求。
关键原则:
- 有意识地分配token
- 不懈地优化每个token的最大价值
- 动态适应随对话演变
- 测量和改进你的token效率
- 应用心智模型增强理解
通过实践,你将培养对token经济的直觉感知,实现更强大、更高效、更有效的AI交互。
"完美的达成,不是当没有更多要添加的时候,而是当没有什么可以拿走的时候。"
— 安托万·德·圣埃克苏佩里