工具大全
ai-tutorials2026年3月18日223 次阅读约 20 分钟阅读

Claude 认证架构师基础考试完全指南:官方考纲深度解析

Claude 认证架构师基础考试完全指南:官方考纲深度解析

Anthropic 正式推出了 Claude Certified Architect – Foundations(Claude 认证架构师基础级)认证考试,面向构建生产级 Claude 应用的解决方案架构师。本文基于 Anthropic 官方发布的考试指南,全面解析考试内容、各知识领域要点、样题解析与备考策略。

资料来源:本文基于 Anthropic, PBC 发布的官方文档 Claude Certified Architect – Foundations Certification Exam Guide(版本 0.1,2025 年 2 月 10 日),内容仅供学习参考。


什么是 Claude 认证架构师基础级认证?

该认证验证从业者能够在使用 Claude 实现真实世界解决方案时,做出明智的权衡决策。考试涵盖以下四大核心技术的基础知识:

  • Claude Code:团队工作流、CLAUDE.md 配置、计划模式
  • Claude Agent SDK:多智能体编排、工具集成、生命周期钩子
  • Claude API:结构化输出、提示工程、批量处理
  • 模型上下文协议(MCP):工具设计、资源接口、后端集成

目标考生

理想考生是拥有 6 个月以上实践经验 的解决方案架构师,具备以下能力:

  • 使用 Claude Agent SDK 构建智能体应用,包括多智能体编排、子智能体委托、工具集成和生命周期钩子
  • 使用 CLAUDE.md 文件、Agent Skills、MCP 服务器集成和计划模式为团队工作流配置 Claude Code
  • 为后端系统集成设计 MCP 工具和资源接口
  • 使用 JSON Schema 和少样本示例设计能产生可靠结构化输出的提示词
  • 在长文档、多轮对话和多智能体切换中有效管理上下文窗口
  • 将 Claude 集成到 CI/CD 流水线,实现自动化代码审查和测试生成
  • 做出合理的升级和可靠性决策,包括错误处理和人工介入工作流

考试格式与评分

项目 详情
题型 单选题(1 个正确答案 + 3 个干扰项)
评分 换算分数 100–1,000
通过分数 720 分
未作答题目 计为错误;猜测无额外惩罚
结果 通过/不通过

考试内容领域与权重

领域 主题 权重
领域 1 智能体架构与编排 27%
领域 2 工具设计与 MCP 集成 18%
领域 3 Claude Code 配置与工作流 20%
领域 4 提示工程与结构化输出 20%
领域 5 上下文管理与可靠性 15%

考试场景

考试采用基于场景的问题。每次考试从以下 6 个场景中随机抽取 4 个:

场景 1:客户支持解决智能体

使用 Claude Agent SDK 构建处理退货、账单纠纷和账户问题等高歧义请求的客户支持智能体。智能体通过自定义 MCP 工具(get_customerlookup_orderprocess_refundescalate_to_human)访问后端系统,目标是 80% 以上的首次联系解决率,同时知道何时升级。

主要领域:智能体架构与编排、工具设计与 MCP 集成、上下文管理与可靠性

场景 2:使用 Claude Code 进行代码生成

使用 Claude Code 加速软件开发,包括代码生成、重构、调试和文档编写。需要将其集成到开发工作流中,使用自定义斜杠命令、CLAUDE.md 配置,并了解何时使用计划模式而非直接执行。

主要领域:Claude Code 配置与工作流、上下文管理与可靠性

场景 3:多智能体研究系统

使用 Claude Agent SDK 构建多智能体研究系统。协调器智能体委托给专门的子智能体:一个搜索网络,一个分析文档,一个综合发现,一个生成报告。

主要领域:智能体架构与编排、工具设计与 MCP 集成、上下文管理与可靠性

场景 4:使用 Claude 提升开发者效率

使用 Claude Agent SDK 构建帮助工程师探索陌生代码库、理解遗留系统、生成样板代码和自动化重复任务的开发者生产力工具。

主要领域:工具设计与 MCP 集成、Claude Code 配置与工作流、智能体架构与编排

场景 5:持续集成中的 Claude Code

将 Claude Code 集成到 CI/CD 流水线,系统运行自动化代码审查、生成测试用例并对 Pull Request 提供反馈。

主要领域:Claude Code 配置与工作流、提示工程与结构化输出

场景 6:结构化数据提取

构建使用 Claude 的结构化数据提取系统。系统从非结构化文档中提取信息,使用 JSON Schema 验证输出,并在保持高准确率的同时优雅地处理边缘情况。

主要领域:提示工程与结构化输出、上下文管理与可靠性


各领域知识点详解

领域 1:智能体架构与编排(27%)

1.1 智能体循环设计

核心知识:

  • 智能体循环生命周期:发送请求 → 检查 stop_reason → 执行工具 → 返回结果
  • stop_reason"tool_use" 时继续,为 "end_turn" 时终止
  • 避免反模式:解析自然语言信号判断终止、设置任意迭代上限、将文本内容作为完成指标

1.2 多智能体编排(轮毂辐条架构)

核心知识:

  • 协调器管理所有子智能体间的通信、错误处理和信息路由
  • 子智能体使用隔离上下文运行——不会自动继承协调器的对话历史
  • 协调器职责:任务分解、委托、结果聚合、根据查询复杂度决定调用哪些子智能体

核心技能:

  • 设计并行子智能体执行:在单个协调器响应中发出多个 Task 工具调用(而非跨多个轮次)
  • 实现迭代精化循环:协调器评估综合输出的差距,重新委托给子智能体,直到覆盖充分

1.3 子智能体调用与上下文传递

核心知识:

  • Task 工具是生成子智能体的机制
  • allowedTools 必须包含 "Task" 才能让协调器调用子智能体
  • 子智能体上下文必须在提示词中显式提供——不会自动继承父级上下文

1.4 多步骤工作流

核心知识:

  • 程序化强制执行(钩子、前置条件门控)> 基于提示词的指导,用于确定性合规
  • 当需要确定性合规时(如金融操作前的身份验证),仅靠提示词指令有非零失败率

1.5 Agent SDK 钩子

核心知识:

  • PostToolUse 钩子:在模型处理前转换工具结果(如数据格式规范化)
  • 工具调用拦截钩子:阻止违反策略的操作(如超过 500 美元的退款)
  • 钩子提供确定性保证,提示词指令只提供概率性合规

1.6 任务分解策略

  • 固定顺序流水线(提示词链):适用于可预测的多方面审查
  • 动态自适应分解:适用于开放式调查任务
  • 大型代码审查分解:每个文件的本地分析 + 单独的跨文件集成分析

1.7 会话状态管理

  • --resume <session-name>:继续特定的先前会话
  • fork_session:从共享分析基线创建独立分支,探索不同方法
  • 先前工具结果陈旧时,以注入摘要开始新会话 > 恢复旧会话

领域 2:工具设计与 MCP 集成(18%)

2.1 有效的工具接口设计

  • 工具描述是 LLM 进行工具选择的主要机制;最简描述会导致不可靠的选择
  • 描述应包含:输入格式、示例查询、边缘情况、边界说明
  • 重命名/拆分工具以消除功能重叠

2.2 结构化错误响应

  • 使用 MCP isError 标志模式
  • 返回结构化错误元数据:errorCategory(瞬态/验证/权限)、isRetryable 布尔值、人类可读描述
  • 区分访问失败(需要重试决策)和有效空结果(无匹配的成功查询)

2.3 工具分配与 tool_choice

  • 工具过多(如 18 个而非 4-5 个)会增加决策复杂度,降低工具选择可靠性
  • tool_choice 选项:"auto"(模型可能返回文本)、"any"(模型必须调用工具)、强制选择({"type": "tool", "name": "..."}
  • 设置 tool_choice: "any" 确保模型调用工具而非返回对话文本

2.4 MCP 服务器集成

  • 项目级(.mcp.json):团队共享工具
  • 用户级(~/.claude.json):个人/实验性服务器
  • .mcp.json 中的环境变量扩展(如 ${GITHUB_TOKEN})用于凭证管理,避免提交密钥
  • MCP 资源作为暴露内容目录的机制,减少探索性工具调用

2.5 内置工具选择

工具 用途
Grep 内容搜索(函数名、错误消息、导入语句)
Glob 文件路径模式匹配(**/*.test.tsx
Read/Write 完整文件操作
Edit 基于唯一文本匹配的定向修改

Edit 因文本不唯一失败时,回退使用 Read + Write


领域 3:Claude Code 配置与工作流(20%)

3.1 CLAUDE.md 层次结构

级别 位置 共享方式
用户级 ~/.claude/CLAUDE.md 仅限该用户,不通过版本控制共享
项目级 .claude/CLAUDE.md 或根目录 CLAUDE.md 通过版本控制与团队共享
目录级 子目录 CLAUDE.md 仅限该目录
  • @import 语法:引用外部文件保持 CLAUDE.md 模块化
  • .claude/rules/:组织主题特定规则文件,替代单体 CLAUDE.md

3.2 自定义斜杠命令与 Skills

  • 项目范围命令:.claude/commands/(版本控制,团队共享)
  • 用户范围命令:~/.claude/commands/(个人使用)
  • Skills 在 .claude/skills/ 中,SKILL.md frontmatter 支持:
    • context: fork:在隔离的子智能体上下文中运行,防止输出污染主对话
    • allowed-tools:限制技能执行期间的工具访问
    • argument-hint:在无参数调用时提示开发者输入所需参数

3.3 路径特定规则

  • .claude/rules/ 文件使用 YAML frontmatter paths 字段(包含 glob 模式)
  • 规则仅在编辑匹配文件时加载,减少无关上下文和 token 消耗
  • 优于目录级 CLAUDE.md:适用于分散在整个代码库的约定(如测试文件)

3.4 计划模式 vs 直接执行

使用计划模式 使用直接执行
大规模变更(45+ 个文件) 单文件 bug 修复(有明确堆栈跟踪)
多种有效方法 简单的单行添加
架构决策 范围清晰的简单变更
多文件修改 无架构影响
  • 使用 Explore 子智能体进行冗长的发现阶段,防止上下文窗口耗尽

3.5 迭代精化技术

  • 具体的输入/输出示例 > 散文描述(当散文被不一致解释时)
  • 测试驱动迭代:先写测试套件,通过分享测试失败来引导改进
  • 访谈模式:让 Claude 在实现前提问,发现开发者未预料到的考虑因素
  • 多个相互影响的问题 → 单条详细消息;独立问题 → 顺序迭代

3.6 CI/CD 集成

  • -p(或 --print)标志:在自动化流水线中以非交互模式运行
  • --output-format json + --json-schema:生成机器可解析的结构化结果,用于自动发布为 PR 内联注释
  • 独立审查实例(非自我审查)更能发现细微问题(生成代码的模型保留了生成时的推理上下文)
  • 重新运行审查时包含先前发现,指示 Claude 只报告新问题或尚未解决的问题

领域 4:提示工程与结构化输出(20%)

4.1 明确审查标准

  • 明确标准 > 模糊指令
    • 好:"仅当声明的行为与实际代码行为矛盾时才标记注释"
    • 差:"检查注释是否准确"
  • 暂时禁用高误报类别以恢复开发者信任,同时改进这些类别的提示词

4.2 少样本提示

  • 对于实现一致格式化、可操作输出最有效的技术
  • 创建 2-4 个针对歧义场景的定向示例
  • 在示例中展示为什么选择一个动作而非合理的替代方案的推理过程
  • 演示正确处理不同文档结构(内联引用 vs 参考书目)

4.3 通过工具使用强制结构化输出

  • tool_use + JSON Schema → 最可靠的保证 Schema 合规的方法,消除 JSON 语法错误
  • 注意:消除语法错误,但不能防止语义错误(行项目不汇总到总计、值在错误字段)
  • tool_choice: "any":当文档类型未知时保证结构化输出
  • 当源文档可能不包含该信息时,将 Schema 字段设计为可选(nullable),防止模型编造值

4.4 验证和重试循环

  • 重试时反馈错误:将具体验证错误附加到提示词,引导模型自我纠正
  • 当所需信息根本不在源文档中时,重试无效(vs 格式或结构错误)
  • 添加 detected_pattern 字段以便分析开发者驳回发现时的误报模式

4.5 批量处理策略

特性 详情
成本 节省 50%
处理时间 最多 24 小时
延迟 SLA 无保证
多轮工具调用 不支持
适用场景 隔夜报告、每周审计、非阻塞工作流
不适用场景 阻塞式预合并检查

使用 custom_id 字段关联请求/响应对。

4.6 多实例审查架构

  • 自我审查限制:模型保留生成时的推理上下文,不太可能质疑自己的决定
  • 独立审查实例(无先前推理上下文)比自我审查指令或扩展思考更有效
  • 多轮审查:每文件本地分析轮次 + 跨文件集成分析轮次,避免注意力稀释

领域 5:上下文管理与可靠性(15%)

5.1 保持对话上下文中的关键信息

核心风险:

  • 渐进式摘要风险:将数值、百分比、日期和客户预期压缩为模糊摘要
  • "丢失在中间"效应:模型可靠处理长输入的开头和结尾,但可能遗漏中间部分

解决方案:

  • 将事务性事实(金额、日期、订单号、状态)提取到持久化"案例事实"块中
  • 在工具结果积累到上下文前,修剪冗长输出只保留相关字段
  • 将关键发现摘要放在聚合输入的开头

5.2 升级和歧义解决

  • 适当的升级触发器:客户要求人工、政策例外/缺口(不仅仅是复杂案例)、无法取得有意义进展
  • 当客户明确要求人工客服时,立即升级,不要先尝试调查
  • 基于情感的升级和自我报告的置信度分数是不可靠的案例复杂度代理
  • 多个客户匹配 → 请求额外标识符,而非使用启发式选择

5.3 多智能体系统中的错误传播

  • 返回结构化错误上下文:失败类型、尝试的查询、部分结果、替代方法
  • 区分访问失败(需要重试决策)和有效空结果(无匹配的成功查询)
  • 子智能体:对瞬态失败进行本地恢复;只将无法解决的错误(含尝试过的方法和部分结果)传播给协调器
  • 反模式:静默抑制错误(将失败标记为成功)或在单次失败时终止整个工作流

5.4 大型代码库探索中的上下文管理

  • 上下文退化:长会话中模型开始给出不一致答案,引用"典型模式"而非先前发现的具体类
  • 暂存文件(Scratchpad):在上下文边界间持久化关键发现
  • 子智能体委托:隔离冗长的探索输出,主智能体协调高层理解
  • 使用 /compact 减少扩展探索会话中的上下文使用

5.5 人工审查工作流

  • 总体准确率指标(如 97%)可能掩盖特定文档类型或字段上的糟糕性能
  • 分层随机采样:测量高置信度提取中的错误率,检测新型错误模式
  • 字段级置信度分数,使用带标签的验证集进行校准
  • 在减少人工审查前,按文档类型和字段验证准确率

5.6 信息溯源与不确定性处理

  • 摘要步骤中源归因丢失(发现被压缩而未保留声明-来源映射)
  • 处理冲突统计:用源归因注释冲突,而不是任意选择一个值
  • 时间数据:要求结构化输出中包含发布/收集日期,防止时间差异被误解为矛盾

样题解析

第 1 题(场景:客户支持智能体)

生产数据显示,在 12% 的案例中,你的智能体完全跳过 get_customer,直接使用客户的姓名调用 lookup_order,偶尔导致账户认错和错误退款。什么改变最能有效解决这个可靠性问题?

  • A)添加程序化前置条件,在 get_customer 返回已验证的客户 ID 之前阻止 lookup_orderprocess_refund 调用 ✅
  • B)增强系统提示词,说明客户验证必须在任何订单操作之前完成
  • C)添加少样本示例,展示智能体即使在客户提供订单详情时也总是先调用 get_customer
  • D)实现路由分类器,为每种请求类型只启用适当的工具子集

答案:A — 当关键业务逻辑需要特定工具顺序时,程序化强制执行提供确定性保证,这是基于提示词的方法无法做到的。选项 B 和 C 依赖于概率性的 LLM 合规,当错误有财务后果时这是不够的。选项 D 解决的是工具可用性问题,而不是工具排序问题。


第 4 题(场景:Claude Code 代码生成)

你想创建一个自定义 /review 斜杠命令,应该在所有开发者克隆或拉取仓库时可用。应该在哪里创建这个命令文件?

  • A)在项目仓库的 .claude/commands/ 目录中 ✅
  • B)在每个开发者主目录的 ~/.claude/commands/
  • C)在项目根目录的 CLAUDE.md 文件中
  • D)在带有命令数组的 .claude/config.json 文件中

答案:A — 存储在 .claude/commands/ 中的项目范围自定义斜杠命令受版本控制,所有开发者克隆或拉取仓库时自动可用。


第 10 题(场景:CI/CD 流水线)

你的流水线脚本运行 claude "分析此 Pull Request 的安全问题" 但作业无限期挂起。日志显示 Claude Code 在等待交互输入。在自动化流水线中运行 Claude Code 的正确方法是什么?

  • A)添加 -p 标志:claude -p "分析此 Pull Request 的安全问题"
  • B)运行命令前设置环境变量 CLAUDE_HEADLESS=true
  • C)从 /dev/null 重定向标准输入
  • D)添加 --batch 标志

答案:A-p(或 --print)标志以非交互模式运行 Claude Code,处理提示词,将结果输出到标准输出,然后退出——这正是 CI/CD 流水线所需要的。其他选项引用不存在的功能或使用不能正确处理 Claude Code 命令语法的 Unix 变通方法。


第 11 题(场景:CI/CD 流水线)

团队有两个工作流:(1) 必须在开发者合并前完成的阻塞式预合并检查;(2) 隔夜生成供次日早上查看的技术债报告。应该将两者都切换到消息批处理 API 以节省 50% 的费用吗?

  • A)仅对技术债报告使用批处理;保持预合并检查的实时调用 ✅
  • B)将两者都切换到批处理,并通过状态轮询检查完成情况
  • C)保持两个工作流的实时调用,避免批处理结果排序问题
  • D)将两者都切换到批处理,并在批处理耗时过长时回退到实时

答案:A — 消息批处理 API 的处理时间最多 24 小时,没有延迟 SLA 保证。这使其不适合开发者等待结果的阻塞式工作流,但非常适合隔夜批量作业。


第 12 题(场景:CI/CD 流水线)

一个 PR 修改了 14 个文件。单次审查所有文件产生不一致结果:一些文件有详细反馈,其他只有表面注释,明显的 bug 被遗漏,并且对相同代码模式有矛盾的反馈。如何重构审查?

  • A)分拆为多轮:单独分析每个文件的本地问题,然后进行单独的集成审查轮次检查跨文件数据流 ✅
  • B)要求开发者在自动审查运行前将大 PR 拆分为 3-4 个文件的较小提交
  • C)切换到具有更大上下文窗口的高级模型,在一轮中给所有 14 个文件足够的注意力
  • D)对完整 PR 运行三次独立审查,只标记在至少两次中出现的问题

答案:A — 分拆审查直接解决根本原因:一次处理多个文件时的注意力稀释。逐文件分析确保一致的深度,而单独的集成轮次捕获跨文件问题。


备考练习

练习 1:构建带有升级逻辑的多工具智能体

  1. 定义 3-4 个 MCP 工具,详细描述每个工具的目的,包含至少两个功能相似、需要仔细描述以避免选择混乱的工具
  2. 实现检查 stop_reason 的智能体循环,正确处理 "tool_use""end_turn"
  3. 添加结构化错误响应:errorCategory(瞬态/验证/权限)、isRetryable 布尔值、人类可读描述
  4. 实现程序化钩子拦截工具调用以强制业务规则,在触发时重定向到升级工作流
  5. 使用多关注点消息测试并验证智能体能分解请求、处理每个关注点并综合统一响应

练习 2:为团队开发工作流配置 Claude Code

  1. 创建带有通用编码标准和测试约定的项目级 CLAUDE.md
  2. 为不同代码区域创建带有 YAML frontmatter glob 模式的 .claude/rules/ 文件(如 paths: ["src/api/**/*"]
  3. .claude/skills/ 中创建具有 context: forkallowed-tools 限制的项目范围 skill
  4. .mcp.json 中配置带有环境变量扩展的 MCP 服务器
  5. 对不同复杂度的任务测试计划模式 vs 直接执行:单文件 bug 修复、多文件库迁移、多种有效实现方法的新功能

练习 3:构建结构化数据提取流水线

  1. 定义具有 JSON Schema 的提取工具(必需/可选字段、带"other"+detail 字符串模式的枚举、当源文档可能不包含信息时的 nullable 字段)
  2. 实现验证-重试循环:验证失败时,发送包含文档、失败提取和具体错误的后续请求
  3. 添加展示从不同格式文档(内联引用 vs 参考书目)提取的少样本示例
  4. 使用消息批处理 API 提交 100 个文档,按 custom_id 处理失败,重新提交修改后的失败文档
  5. 实现人工审查路由策略:模型输出字段级置信度分数,低置信度提取路由到人工审查

练习 4:设计并调试多智能体研究流水线

  1. 构建协调器智能体(allowedTools 包含 "Task"),在提示词中显式传递发现而非依赖自动上下文继承
  2. 在单个响应中发出多个 Task 工具调用实现并行子智能体执行
  3. 设计将内容与元数据分离的子智能体结构化输出(声明、证据摘录、来源 URL、发布日期)
  4. 模拟子智能体超时,验证协调器收到结构化错误上下文(失败类型、尝试的查询、部分结果)
  5. 使用冲突源数据测试,验证综合输出保留两个值和源归因,而非任意选择一个

关键技术参考

技术 核心概念
Claude Agent SDK 智能体循环、stop_reason、PostToolUse 钩子、Task 工具、allowedTools
MCP isError 标志、工具描述、.mcp.json、环境变量扩展
Claude Code CLAUDE.md 层次结构、.claude/rules/、.claude/commands/、.claude/skills/、计划模式
Claude Code CLI -p/--print--output-format json--json-schema
Claude API tool_use、tool_choice(auto/any/强制)、stop_reason、max_tokens
消息批处理 API 50% 成本节省、24 小时窗口、custom_id、不支持多轮工具调用
JSON Schema 必需/可选字段、枚举、nullable、严格模式

超出考试范围的主题(不会出现在考试中)

  • 微调 Claude 模型或训练自定义模型
  • Claude API 身份验证、账单或账户管理
  • 部署或托管 MCP 服务器(基础设施、网络、容器编排)
  • Claude 的内部架构或训练过程
  • Constitutional AI、RLHF 或安全训练方法论
  • 计算机使用(浏览器自动化、桌面交互)
  • 视觉/图像分析能力
  • 流式 API 实现或服务器发送事件
  • 速率限制、配额或 API 定价计算
  • 特定云提供商配置(AWS、GCP、Azure)

最终备考清单

  1. 构建智能体:使用 Claude Agent SDK 实现完整的智能体循环,包括工具调用、错误处理和会话管理
  2. 配置 Claude Code:CLAUDE.md 层次结构、路径特定规则、带 frontmatter 的自定义 skills、至少集成一个 MCP 服务器
  3. 设计和测试 MCP 工具:清晰区分相似工具的描述,结构化错误响应,使用歧义请求测试工具选择可靠性
  4. 构建结构化数据提取流水线:使用 tool_use + JSON Schema,验证-重试循环,可选/nullable 字段,消息批处理 API 批量处理
  5. 练习提示工程技术:为歧义场景写少样本示例,定义明确的审查标准,设计大型代码审查的多轮架构
  6. 学习上下文管理模式:从冗长工具输出中提取结构化事实,实现暂存文件持久化,子智能体委托管理上下文限制
  7. 复习升级和人工介入模式:理解何时升级 vs 自主解决,设计基于置信度路由的人工审查工作流
  8. 完成练习考试:在参加真实考试前完成练习考试(链接将单独提供),涵盖相同场景和问题格式,答题后显示解析

Claude 认证架构师基础级认证代表了 Anthropic 建立 Claude 应用开发专业标准的承诺。无论是构建客户支持智能体、CI/CD 集成,还是复杂的多智能体研究系统,该认证都验证了构建可靠、生产级 Claude 应用所需的架构判断力。