Claude Code固件层运维实测：虚拟硬盘扩容与本地Agent部署方案

概述

在AI辅助运维的实践中，Claude Code展现出了令人惊喜的底层系统架构理解能力。一位资深运维玩家（B站UP主"雲姥工"）分享了他使用Claude Code进行硬件固件层维护的实际体验，涉及Ventoy Linux管理、虚拟硬盘扩容、文件系统转换等硬核操作，同时探索了本地Agent部署的可行性方案。

bilibili source

Claude Code在固件层运维中的实战表现

超越预期的底层架构理解能力

据UP主的实测反馈，Claude Code对于底层架构（即OS层/固件层）的把握能力非常突出。相比其他AI编程方案，它表现出以下特点：

方案可靠：提出的操作建议严谨规范，没有"乱七八糟的操作"
理解深入：能够理解Ventoy系统的工作原理和启动机制
适合硬核任务：特别适合处理系统能否正常启动这类关键性问题

Ventoy系统的技术背景

Ventoy是一款开源的USB启动盘制作工具，其核心创新在于用户无需反复格式化U盘，只需将ISO/WIM/IMG等镜像文件直接复制到U盘中即可启动。Ventoy通过自定义的启动引导程序（支持Legacy BIOS和UEFI两种模式）实现对多种镜像格式的直接引导。其工作原理涉及MBR/GPT分区表解析、GRUB引导链加载、以及通过UUID标识分区来定位启动文件。UUID（Universally Unique Identifier）在此场景中至关重要——Ventoy的引导程序依赖分区UUID来定位数据分区，一旦UUID因文件系统转换等操作发生变化而未同步更新配置，整个启动链条就会断裂。正是因为这种复杂的依赖关系，Claude Code能够主动识别并修正UUID问题才显得尤为难得。

实战任务：虚拟硬盘扩容与文件系统转换

UP主给Claude Code布置了一个多步骤的复杂任务，涉及RAW格式虚拟硬盘的完整改造流程：

底层硬盘扩容：将虚拟硬盘从60GB扩展到100GB
分区层扩容：在上层分区中同步扩展空间
文件系统转换：将ext4转换为btrfs
UUID修正：调整UUID以确保Ventoy能正常启动

RAW格式虚拟硬盘是一种未经封装的裸磁盘镜像格式，它以1:1的方式映射物理磁盘的每个扇区，不包含QCOW2或VMDK等格式的元数据头。这种格式的优势在于I/O性能最优且兼容性最强，但缺点是不支持快照和动态扩展。而ext4到btrfs的文件系统转换是一个高风险操作——btrfs提供了原生的ext4转换工具（btrfs-convert），它通过将ext4的元数据保存为一个子卷来实现就地转换，但这个过程需要分区有足够的空闲空间，且转换后的UUID会发生变化。btrfs相比ext4提供了写时复制（CoW）、内置快照、透明压缩和RAID支持等现代文件系统特性，特别适合需要频繁备份和回滚的运维场景。

这个任务链条环环相扣，任何一步出错都可能导致系统无法启动。Claude Code不仅完成了全部操作，还展现出对Ventoy启动机制的深度理解——它知道UUID不正确会导致Ventoy启动失败，这一点让UP主感到"非常恐怖"。

不同模型底座的对比测试结果

三档模型的实际表现差异

UP主在Claude Code的Agent框架下测试了不同模型底座的表现，得出了清晰的分层结论：

等级	模型	表现
第一档	DeepSeek Professional	最强表现
第二档	MiniMax	中等水平，稳定可用
第三档	DeepSeek Flash	垫底但仍优于本地小模型

Agent框架（Harness）比模型底座更重要

一个关键洞察是：Agent层的Harness设计比模型底座更重要。UP主指出：

"模型如果底座比较差的话还要看你架构好不好。你架构稳的话那就还能稳；你架构不稳的话，它会提出非常奇怪的建议并且执行了，你就会崩溃。"

在AI Agent架构中，Harness（约束框架）指的是围绕大语言模型构建的一整套工作流控制机制，包括系统提示词设计、工具调用权限管理、输出验证、错误恢复策略和安全边界设定。Claude Code的Agent框架之所以在运维场景中表现优异，关键在于其Harness设计了严格的操作确认机制和分步执行策略——它不会一次性执行所有命令，而是在每个关键步骤后验证结果再继续。这种设计哲学类似于运维领域的"变更管理"流程：每次变更都需要验证、回滚点和确认。相比之下，如果Harness设计松散，即使底层模型能力很强，也可能因为缺乏约束而执行危险操作。

换言之，一个设计严谨的Agent框架可以在一定程度上弥补模型能力的不足。这对于预算有限但需要可靠运维的场景具有重要参考价值。

本地Agent部署方案详解

硬件配置与散热优化

UP主正在搭建一套本地Agent运行环境，采用极限性价比方案：

当前配置：老服务器主板 + GTX 1070显卡（闲置利用）
散热方案：DIY水冷散热，硅脂重新涂抹后烤机测试
烤机结果：CPU满载时温度控制在55-70度以下，表现稳定
内存：DDR4 2666，性能表现超出预期

本地Agent架构设计思路

UP主规划了一套分布式的本地AI架构：

桌面机（笔记本3070）：运行CacheOS，负责本地模型推理，同时兼顾日常使用和游戏
Agent机（老服务器+1070）：专门运行Agent任务，通过端口外接连接到模型推理机
未来升级：计划利用双PCIe 3.0 x16接口上双GPU

这种将"模型推理"和"Agent执行"分离到不同物理机器上的分布式架构，是在资源受限环境下的工程最优解。模型推理（Inference）是计算密集型任务，需要GPU的并行计算能力来加速矩阵运算；而Agent执行主要涉及系统调用、文件操作和网络通信，对CPU和I/O性能要求更高。通过网络端口将两者连接（通常使用OpenAI兼容的API接口，如llama.cpp的server模式或Ollama提供的REST API），可以让每台机器专注于自己擅长的任务。CacheOS是一个面向NAS和服务器管理的操作系统，支持Docker容器化部署，非常适合作为本地AI推理服务的宿主系统。

本地模型应用场景规划

本地模型的应用目前以轻量级任务为主：

语音播报：将文字转语音，实时播报Telegram消息和任务完成通知
后台监控：Agent完成任务后自动语音通知
未来拓展：可能逐步扩展到本地视频制作（目前视频制作仍依赖云端MiniMax）

UP主认为本地模型跑2B-3B参数量就足够应对这些场景，CPU都能胜任，加上GPU后会更快更流畅。2B-3B参数量的模型（如Qwen2.5-3B、Phi-3-mini等）在INT4量化后仅需2-3GB显存，GTX 1070的8GB显存完全可以胜任，甚至可以同时加载多个小模型服务于不同任务。

运维人员做本地AI部署的独特优势

作为运维出身的技术玩家，UP主认为相比专门购买二手矿卡跑AI的玩家，运维人员有独特优势：

理解硬件极限：知道性价比的最优解在哪里
系统稳定性经验：能够处理散热、供电、长期运行等工程问题
渐进式部署：先在小机器上测试稳定，再迁移到正式环境

这种务实的工程思维，恰恰是AI落地到实际生产环境中最需要的能力。运维人员长期与硬件打交道，深谙"7×24小时稳定运行"的工程哲学——他们知道一块便宜的服务器主板在持续高负载下的真实表现，了解不同品牌电容的寿命差异，清楚机房环境温度对硬件寿命的影响。这些经验在本地AI部署中转化为巨大优势：他们不会盲目追求算力参数，而是在性能、稳定性、功耗和成本之间找到最佳平衡点。

总结

Claude Code在固件层运维中展现出的严谨性和可靠性，证明了AI辅助运维已经进入实用阶段。而Agent框架的设计质量比模型本身更关键这一发现，为资源有限的个人开发者和小团队指明了方向——与其追求最强模型，不如打磨好Agent的工作流程和约束机制。本地Agent部署方案则展示了一条低成本、高可用的AI运维落地路径。

核心要点

Claude Code在固件层/OS层运维任务中表现出色，能理解Ventoy启动机制并完成虚拟硬盘扩容、文件系统转换等复杂操作链
Agent框架（Harness）的设计质量比模型底座更重要，严谨的架构可以弥补模型能力的不足
不同模型底座在Agent框架下表现分三档：DeepSeek Professional最强，MiniMax中等，DeepSeek Flash垫底
本地Agent部署采用老服务器+闲置GPU的极限性价比方案，分布式架构将推理和Agent任务分离
运维经验在AI本地部署中具有独特优势，包括硬件极限理解、系统稳定性保障和渐进式部署策略