小白/程序员必看：收藏这份 Claude Agent Skills 入门指南，轻松掌握大模型进阶技能

📅 发布时间：2026/7/5 2:47:33 👁️ 浏览次数：

本文从底层原理角度探讨了 Agent Skills 的工作机制。首先介绍了 ReAct Agent 模式强调其结合大语言模型推理与行动执行的核心思想以及 LLM 能力演进带来的效果提升。接着以 Claude Code 为例展示了其基于 ReAct 模式并侧重文件系统和 Shell 命令的特点。文章重点分析了上下文管理的重要性特别是 Context Offloading 策略解释了如何通过文件系统存储信息以减轻 LLM 上下文负担。最后介绍了 Skills 的三层加载技术元数据、指令、资源及代码执行、虚拟机等关键技术帮助读者深入理解 Agent Skills 并为其未来演进方向提供展望。ReAct Agent现代 Agent 都是基于ReAct[2]模式构建的。ReAct 的核心思想是将大语言模型的推理能力Reasoning与行动执行Acting相结合使 Agent 能够反复思考问题、使用工具并根据观察结果采取行动从而实现用户目标。早期采用 ReAct 模式的 Agent效果并不理想。随着 LLM 能力的持续演进特别是函数调用Function Calling[3]的引入ReAct 模式的效果得到了显著改善使得 Agent 能够更可靠且高效地完成任务。以天气查询为例从上下文Context的角度来看ReAct Agent 的运行过程大致如下System: You are a helpful weather assistant. User: What is the weather like in Chengdu? Assistant: ToolCall(nameget_weather, args{location: Chengdu}) User: ToolOutput(result{weather: Sunny, temperature: 22°C}) Assistant: The weather in Chengdu is Sunny with a temperature of 22°C.Claude Code作为一个现代 Agent 系统Claude Code 也遵循了 ReAct 模式。我们在揭秘 Claude Code自主式编程[4]中介绍过它的核心架构Claude Code自主式编程架构可以看出Claude Code 与常规 Agent如天气查询助手最大的不同之处在于它工作在操作系统之上几乎所有的工具都是围绕文件系统和 Shell 命令展开的以“查看文件并创建一个 Hello World 函数”为例Claude Code 运行过程中的 Context 大致如下System: You are Claude Code, Anthropics official CLI for Claude. User: What files are there? Assistant: ToolCall(nameBash, args{command: ls}) User: ToolOutput(result[README.md]) Assistant: There is only one file named README.md. User: Create a hello world function in Python. Assistant: ToolCall(nameWrite, args{file_path: hello_world.py, content: def hello_world():\n print(Hello, World!)\n\nif __name__ __main__:\n hello_world()}) User: ToolOutput(resultCreated hello_world.py with a simple hello world function.) Assistant: Ive created a simple Python file with a Hello, World! function.上下文管理有了对 ReAct Agent 和 Claude Code 的基本认识我们再来讨论一个关键话题——上下文管理。了解大语言模型的读者可能知道LLM 的上下文有两个重要特征上下文窗口大小限制LLM 的上下文窗口大小是有限的早期 GPT 3 仅有 2048 个 token虽然这个大小在持续增长比如最新 Claude Sonnet 4.5 已支持百万 token但仍然是有上限的。上下文过载导致性能下降即使最先进的 LLM 支持长上下文如百万 token但如果上下文内容过多其性能也会显著下降。除了经典的Lost in the Middle[5]还会出现上下文污染Context Poisoning、上下文混淆Context Confusion等各种问题。感兴趣的读者可以进一步参考How Long Contexts Fail[6]。因此如何有效地管理上下文成为了 Agent 设计中的一个重要课题。常见的上下文管理策略包括检索增强RAG、上下文总结Context Summarization、上下文隔离Context Quarantine和上下文卸载Context Offloading等。本文的讨论重点关注 Context Offloading。关于 Context OffloadingHow to Fix Your Context[7]一文给出了以下定义上下文卸载Context Offloading是指将信息存到 LLM 的上下文之外通常借助能管理数据的工具来实现。而该文引用的 Anthropic 原文The think tool[8]中则这样指出这个“think”工具特别适合用在那些仅凭用户提问、Claude 信息不够没法直接回答的情况还有那些需要处理外部信息比如工具返回的结果的场景。比起深度思考那种全面推演Claude 用“think”工具做的推理会更聚焦主要围绕模型刚发现的新信息展开。在 Claude Code 中实现 Context Offloading上述关于 Context Offloading 的描述稍显抽象。为了便于理解我们来设想一个问题如果要让 Claude Code 支持 Context Offloading应该如何实现结合前文的讨论我们知道 Claude Code 的能力基本建立在文件系统和 Shell 命令之上。因此要实现 Context Offloading从第一性原理出发我们能够很自然地想到以下方案将信息存储在文件系统而不是一开始就全部放到 LLM 的上下文中为了让 LLM 知道这些信息的存在需要在 LLM 的上下文中通常在系统提示词中记录这些信息的位置用户提问信息不全时Agent 可以根据系统提示词的引导按需从文件系统寻找信息寻找信息的过程需要借助文件读写和 Shell 命令等工具将获取到的外部信息加载到 LLM 的上下文中以辅助完成用户的目标。以“生成博客前端页面”为例为了不把所有的设计指南都塞到 LLM 的上下文中可以将其保存到resources/frontend-design.md文件中# Frontend Aesthetics Guidelines Focus on: **Typography**: Choose fonts that are beautiful, unique, and interesting... **Color Theme**: Commit to a cohesive aesthetic... ...同时在 Agent 的系统提示词中添加对这个文件的引用You are Claude Code... You have access to the following resources: - resources/frontend-design.md: Guidelines for designing the frontend UI. ...如此一来Agent 只会在用户请求生成前端页面时才会去额外读取resources/frontend-design.md文件中的内容从而避免了不必要的上下文膨胀。具体来说运行过程中的 Context 可能会是这样的System: You are Claude Code...\n\nYou have access to the following resources:\n- resources/frontend-design.md: Guidelines for designing the frontend UI. User: Generate a blog frontend UI. Assistant: ToolCall(nameRead, args{file_path: resources/fontend-design.md}) User: ToolOutput(resultChoose fonts that are beautiful, unique, and interesting...) Assistant: ToolCall(nameWrite, args{file_path: app/index.html, content: htmlheadstyle.../style/headbody.../body/html}) User: ToolOutput(resultCreated file app/index.html.) Assistant: ToolCall(nameWrite, args{file_path: app/styles.css, content: ...}) User: ToolOutput(resultCreated file app/styles.css.) Assistant: Ive generated a simple blog frontend UI based on the guidelines.讨论到这里使用过 Skills 的读者可能发现了如果把上述例子中的resources/重命名为skills/那么frontend-design.md本质上就是一个 Skill参考anthropics/skills/frontend-design/SKILL.md[9]。Skills 的三层加载技术至此我们可以看出Skills 的核心思想其实也遵循了 Context Offloading 的上下文管理策略。当然上述例子只是最基础的实现。Agent Skills架构在 Anthropic 的设计中又巧妙地引入了 Skills 的三层加载技术以求最大化减少 LLM 上下文的负担元数据Metadata可用 Skills 的名称、描述及其文件路径。这些信息会被预先放到上下文系统提示词中以确保 Agent 知道有哪些 Skills 可以利用。指令Instructions每个 Skill 都有一个对应的SKILL.md文件其中包含了 Skill 的详细描述、使用方法和示例等信息。当 Agent 需要某个 Skill 的帮助时它会通过Read工具读取SKILL.mds 文件的内容进而将其动态加载到上下文中。资源Resources除了SKILL.md文件每个 Skill 还可以包含其他类型的资源文件如配置文件、文档等。当 Agent 需要更具体的信息时它会进一步读取这些资源文件的内容从而将其加载到上下文中。代码执行与虚拟机除了前文讨论的内容需要强调的是Skills 的完整能力还涉及代码执行和虚拟机代码执行Code Execution某些 Skills 可能包含代码片段甚至 Agent 为了处理任务还会动态生成代码这些代码都需要执行。虚拟机Virtual Machine为了确保安全性通常需要在一个隔离的沙盒环境虚拟机中管理文件系统、执行 Shell 命令和运行代码。Agent Skills架构由于篇幅所限这里不再展开详细讨论感兴趣的读者可以参考官方文档[10]或者其他相关资料。结语通过本文的探讨相信读者对 Agent Skills 有了更深入的理解。在 Claude Agent 产品中Skills 的实现基于 Context Offloading 这一上下文管理策略而该策略的落地则依托于 ReAct 模式的思想框架以及文件系统、Shell 命令等基础工具的支撑。此外代码执行和虚拟机也是非常重要的话题本文限于篇幅只做了简要提及。实际上它们不仅是 Skills 的关键技术也代表着 Agent 未来的主流演进方向。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

最新新闻

日新闻

周新闻

月新闻