工具调用(Tool Calling)
让模型在需要时调用 API / DB / 文件 / 命令,而不是编造答案。
例:自动生成 SQL 并执行,回写结果。
Agentic AI Engineering
学习构建能调用工具、连接数据、执行流程、可评测可上线的 AI Agent。30 秒看懂方向,10 分钟开始动手。
Core Capabilities
让模型在需要时调用 API / DB / 文件 / 命令,而不是编造答案。
例:自动生成 SQL 并执行,回写结果。
把对话上下文升级为可控知识和状态,支持短期与长期记忆。
例:RAG 检索 + 会话记忆 + 任务状态缓存。
复杂任务拆解为可恢复步骤,支持失败重试与回滚。
例:先列计划,再逐步调用工具执行。
实现角色分工、仲裁与汇总,降低单点智能体失误。
例:Planner / Coder / Reviewer 三代理闭环。
把“看起来很聪明”变为可量化、可回归的指标体系。
例:用 SWE-bench Verified 评估真实修复能力。
默认最小权限 + 白名单 + 审计 + 隔离执行,防止越权行为。
例:对工具层输入输出做治理与审计追踪。
Learning Path
LLM API 调用、结构化输出、错误处理、成本意识。
Tool/Function Calling、工具签名设计、协议边界。
RAG、会话状态、任务状态、缓存策略。
ReAct / Plan-Execute、幂等、回滚、日志。
角色协作、消息协议、仲裁与汇总。
SWE-bench / GAIA / WebArena + Trace + 回归测试。
Hands-on Projects
读取配置,自动调用工具链,生成可回放报告。
日志可追溯企业文档问答 + 可追溯引用 + 工具执行结果校验。
企业内训可用自动开 PR、跑测试、生成变更摘要,对齐 SWE-bench 思路。
研发提效在可复现实验环境中训练导航与表单任务执行能力。
可评测可复现Tooling & Protocols
官方能力入口,覆盖模型调用、工具接入与 agent 工作流。
统一连接外部工具与数据源,降低系统接入成本。
成熟的工具抽象与 agent loop 工程实现。
多智能体协作与编排,适合复杂任务拆解。
系统化入门课程,适合作为预习与补齐路径。
Evaluation & Safety
FAQ
可以。先从 Tool Calling + 单 Agent 开始,再补上下文工程与评测。
不需要。大多数工程场景先掌握工具、工作流、评测与安全即可。
RAG 是信息供给层,Agent 是行动闭环层,二者通常组合使用。
工具校验 + 可追溯引用 + 结构化输出 + 评测回归。
任务链长、需要角色分工、且存在审阅仲裁环节时最合适。
Trace、工具调用日志、Token/Cost、失败类型聚类与回归结果。
先做一个最小可用 Agent,再通过评测、安全和观测把它变成能上线的系统。