Claude Code安装与Agent实战教程：文科生也能轻松上手

为什么每个人都需要学会使用AI Agent

很多人使用AI仍然停留在"聊天"的层面——打开对话框，输入问题，获取回答。但AI的能力远不止于此。Agent（智能代理）赋予了AI真正的"执行力"：它能把一个大问题自动拆解成多个小任务，逐步执行、监控结果、反复迭代修正，直到得出满意的答案。

AI Agent的技术原理：Agent的核心架构建立在「感知-规划-执行」循环之上。与单次问答的大模型不同，Agent引入了「工具调用」（Tool Use）和「思维链」（Chain of Thought）机制：模型不仅生成文本，还能调用外部函数、读写文件、执行系统命令。目前主流的Agent框架普遍采用ReAct（Reasoning + Acting）范式，让模型在每一步先推理再行动，并将执行结果反馈回上下文，形成闭环迭代。这种架构使得Agent能够处理需要多步骤、跨工具协作的复杂任务，这也是它远超简单聊天的根本原因。

这种工作方式比简单的聊天复杂得多，但也更加自动化、更节省时间。更重要的是，Agent不仅仅是程序员的工具。对于新媒体研究、设计、影视制作、音乐创作等领域的从业者和学生来说，Agent同样能带来巨大的效率提升：

学术研究：自动收集资料、阅读论文、撰写文献综述
内容创作：根据主题自动生成剧本，甚至完成短剧的视频制作
数据采集：从B站、抖音等平台批量抓取数据用于分析
环境配置：自动安装和配置ComfyUI等复杂的开源工具

为什么选择Claude Code搭配国产大模型

当前主流的Agent工具有多种选择，本教程推荐使用Claude Code作为Agent框架，主要基于以下考量：

与国产大模型结合良好：通过火山引擎平台，可以方便地接入GLM5.1等国产模型
支持丰富的技能（Skill）：文件操作、命令执行、代码编写等一应俱全
本地执行优势：可以调用本地环境的FFmpeg处理视频、OCR识别文档、视觉模型理解图片，节省Token费用
综合性能优秀：Claude Code在通用Agent中属于性能较好的工具

Claude Code与国产大模型结合

需要说明的是，我们使用的是Claude Code的Agent框架，但底层大模型替换为国产的GLM5.1，通过火山引擎的Coding Plan来实现。这样既避免了网络问题，又能享受到高质量的模型服务。

火山引擎与国产大模型生态：火山引擎是字节跳动旗下的云服务平台，其「方舟」（ARK）大模型服务聚合了包括GLM、Doubao等多个国产模型。GLM（General Language Model）系列由清华大学KEG实验室与智谱AI联合开发，GLM5.1在代码生成和指令跟随方面经过专项优化，适合Agent场景。通过API兼容层（OpenAI Compatible API），开发者可以将原本调用GPT-4的代码几乎零修改地切换至国产模型，这也是arkhelper工具的核心原理——它在本地启动一个代理服务，将Claude Code发出的Anthropic格式请求转译为火山方舟的API格式，实现无缝衔接。

Windows环境安装全流程

第一步：安装Alacritty终端和MiniForge

Windows自带的CMD和PowerShell在开发场景下体验较差，建议使用Alacritty作为替代终端。同时，我们需要MiniForge来管理Python虚拟环境——它是Anaconda的精简版，能自动安装Python相关的软件和环境。

安装MiniForge时有一个重要建议：不要使用默认安装路径。建议在C盘创建一个C:\\src\\miniforge目录，将所有开发相关内容集中管理，后续调试会方便很多。

安装Node.js和Git等依赖

安装完成后，需要配置Alacritty的启动设置。在用户目录下创建Alacritty文件夹，放入配置好的TOML文件，使其默认指向MiniForge环境。打开Alacritty后，如果看到括号中显示(base)，说明环境已正确加载。

第二步：创建虚拟环境并配置软件源

为什么需要虚拟环境：Python虚拟环境是现代软件开发的基础实践。不同项目往往依赖同一库的不同版本，若全部安装在系统级Python中，极易产生「依赖地狱」——即不同项目的依赖相互冲突导致程序无法运行。Conda（MiniForge是其社区精简版）相比pip的优势在于：它能同时管理Python版本本身及非Python依赖（如CUDA、FFmpeg等C语言库），对AI/ML工具链尤为重要。清华镜像源（TUNA）则是国内开发者解决网络访问限制的标准方案，由清华大学开源软件镜像站维护，覆盖Conda、pip、npm等主流包管理器，可将依赖下载速度提升数倍。

依次执行以下操作：

设置Conda清华源：加速国内下载
创建虚拟环境：conda create -n agent_course python=3.12 nodejs git，这会同时安装Python 3.12、Node.js和Git
激活环境：conda activate agent_course
验证安装：分别检查node --version、python --version、git --version、npm --version
配置pip和npm的国内源：提升后续安装速度

整个虚拟环境创建过程大约需要10分钟。

第三步：安装Claude Code并配置火山方舟

进入工作目录（如C:\\src\\agent_new），使用npm安装Claude Code：

npm install -g @anthropic-ai/claude-code

安装完成后，关键步骤是配置火山方舟。默认情况下Claude Code只能使用Anthropic的模型，我们需要通过arkhelper工具将其切换为国产模型：

下载并运行arkhelper
选择中文语言，选择火山方舟Coding Plan
通过SSO登录自动获取API Key（用手机扫码登录火山引擎官网）
在火山引擎后台创建新的API Key
选择对应的Coding Key，配置GLM5.1模型

配置火山方舟API Key

配置完成后，再次启动Claude Code，应该能看到已经切换到GLM5.1模型。

Mac环境安装指南

Mac用户的安装流程要简单得多，因为macOS自带优秀的终端，且安装了Xcode命令行工具后已内置Python环境。

核心步骤：

安装Homebrew：macOS的软件包管理器
安装MiniForge：brew install miniforge
修改终端设置：将默认Shell从zsh改为bash（在终端设置中输入/bin/bash）
创建虚拟环境并激活：与Windows相同
安装Claude Code和配置火山方舟：与Windows完全一致

实战案例一：用Agent自动采集B站数据

安装好Claude Code后，我们来看一个实际应用。使用MediaCrawler从B站抓取数据，整个过程只需要用自然语言描述需求：

"我现在需要安装MediaCrawler，把它克隆到当前目录下，并自动帮我安装好运行需要的所有环境和相关工具。"

Claude Code会自动分析需求、执行git clone、安装依赖，整个过程约6分钟。接着输入：

"请帮我使用MediaCrawler检索B站的'AI微短剧'，只搜索一个关键词，数据存在data目录下。"

Agent自动执行数据采集任务

MediaCrawler的技术原理：MediaCrawler是一个开源的社交媒体数据采集框架，支持小红书、抖音、B站、微博等主流平台。其核心技术是通过Playwright（一个浏览器自动化库）模拟真实用户的浏览器行为，绕过平台的反爬虫机制，同时利用平台的移动端API接口获取结构化数据。与传统爬虫相比，这种「浏览器自动化+API抓取」的混合方案稳定性更高，也更接近真实用户行为。数据以JSON格式输出，便于后续用pandas进行分析或导入数据库。使用时需注意遵守各平台的用户协议及相关法律法规，仅用于合法的学术研究目的。

Agent会自动弹出B站登录二维码，扫码后开始爬取。最终抓取到19条视频数据和159条评论，以JSON格式保存。全程不需要理解MediaCrawler的技术细节，完全由Agent代劳。

实战案例二：用Agent安装ComfyUI

ComfyUI是一个强大但安装复杂的AI图像生成工具，通常需要相当的技术基础。虽然有"整合包"方案，但整合包的问题在于无法灵活调整插件和解决具体技术问题。

ComfyUI的技术定位：ComfyUI是基于节点式工作流（Node-based Workflow）的AI图像生成界面，底层调用Stable Diffusion等扩散模型。与WebUI（AUTOMATIC1111）的线性操作界面不同，ComfyUI将每个处理步骤（VAE编码、CLIP文本编码、采样器、解码器等）暴露为可连接的节点，用户可以自由组合构建复杂的生成管线，支持ControlNet、LoRA、IP-Adapter等高级功能的精细控制。正因其高度灵活性，ComfyUI的安装涉及CUDA驱动、PyTorch版本匹配、自定义节点依赖等多个技术层面，对新手门槛较高——这正是Agent自动化安装价值最为突出的场景之一。

使用Claude Code安装ComfyUI，只需描述：

"我需要在本地安装ComfyUI，使用已有的conda环境，克隆到指定目录，做到可以运行为止。"

约4分钟后，Agent就完成了克隆、依赖安装和启动配置。如果没有预装conda环境，过程会更长（需要下载数GB的依赖），但同样是全自动完成。

总结与建议

本地Agent工具的价值在于将复杂的技术操作转化为自然语言交互。对于非技术背景的用户来说，Claude Code搭配GLM5.1的组合提供了一个低门槛、高效率的解决方案。

建议初学者从简单任务开始，逐步探索Agent在自己专业领域的应用场景。无论是学术研究中的数据采集，还是创意工作中的工具配置，AI Agent都能帮你省去大量重复性的技术操作，让你把精力集中在真正重要的事情上。

核心要点

AI Agent基于ReAct范式，赋予大模型工具调用与闭环迭代能力，远超简单聊天的效率
Claude Code搭配火山引擎GLM5.1，通过arkhelper实现API格式转译，是当前与国产大模型结合最好的通用Agent方案
Windows安装需要Alacritty终端+MiniForge虚拟环境+arkhelper配置火山方舟，Mac则更为简便
实战演示了Agent自动安装MediaCrawler并采集B站数据，以及自动配置ComfyUI等复杂环境
非技术背景用户（新媒体、设计、影视等）同样可以通过自然语言驱动Agent完成专业技术操作