播客频道 | Gemini CLI + MCP Server云真机自动化测试：自然语言驱动移动应用测试实战

今天聊一个我最近特别兴奋的话题——用自然语言驱动移动应用测试。你想象一下，你在终端里敲一句话，比如"帮我借一台安卓真机，装上这个APK，跑一遍性能测试，完了把报告给我"，然后AI就真的帮你全干了。这事儿现在已经能跑通了。" }, { "speaker": "guest", "text": "对，这个方案的关键其实是两个东西的结合：一个是Google刚推出的Gemini CLI，另一个是MCP协议。MCP全称是Model Context Protocol，Anthropic在2024年底推出的一个开放协议标准。你可以把它理解成AI世界的USB接口——以前每个AI应用要对接外部服务，都得写一堆定制化的集成代码，非常痛苦。MCP做的事情就是把这个连接标准化了，服务端实现一次MCP Server，任何支持MCP的AI客户端都能即插即用。" }, { "speaker": "host", "text": "USB接口这个比喻很到位。那Gemini CLI这边呢？它本质上是什么？" }, { "speaker": "guest", "text": "Gemini CLI是Google做的一个命令行AI助手，基于Node.js构建，底层跑的是Gemini 2.5系列模型，支持100万token的上下文窗口。它的设计理念是"代码优先"，能直接读你当前目录的文件、理解项目结构，授权后还能执行Shell命令。而且Google给个人开发者提供了免费额度，每天1000次请求，门槛很低。" }, { "speaker": "host", "text": "嗯，所以Gemini CLI本身就已经很强了，再加上MCP协议，它的能力就从本地扩展到了远程服务调用。" }, { "speaker": "guest", "text": "没错，这就是这套方案的精髓。具体到我们今天聊的场景，就是把Unity云真机平台的MCP Server接进来。云真机你知道吧，就是把真实的物理手机托管在云端数据中心，通过网络远程访问。跟模拟器不一样，它用的是真设备，GPU渲染、传感器行为、网络切换这些都是真实的，对游戏测试特别重要。" }, { "speaker": "host", "text": "这点确实关键，模拟器跑游戏和真机跑游戏，帧率表现差别很大。那具体怎么把这套东西搭起来呢？" }, { "speaker": "guest", "text": "其实步骤不复杂。首先你得在UOS官网创建一个应用，启用云真机服务，然后申请OpenAPI密钥，审核通过后会拿到App ID和App Secret。然后本地装好Node.js 20以上版本，安装Gemini CLI，用Google账号登录，配置好Google Cloud项目。最后一步是在Gemini CLI的配置文件里加上MCP Server的连接信息，把App ID和App Secret填进去就行了。" }, { "speaker": "host", "text": "听起来配置过程还算友好。那到了实际测试环节呢？我特别好奇，用自然语言到底能做到什么程度？" }, { "speaker": "guest", "text": "这是最有意思的部分。你准备好APK安装包和自动化测试脚本，放在项目文件夹里，然后在Gemini CLI的对话窗口里用自然语言描述你的测试需求就行了。AI会自动拆解任务，按顺序执行——登录平台、上传资源、借用设备、安装APK、启动应用、开启性能监控、跑测试脚本、停止监控收集数据、最后归还设备。整个流程全自动。" }, { "speaker": "host", "text": "等等，这八个步骤全是AI自己编排的？不需要我告诉它先做什么后做什么？" }, { "speaker": "guest", "text": "对，这就是大模型加MCP的威力。大模型理解了你的意图之后，自己决定调用哪些工具、什么顺序执行、怎么处理异常。你看，传统自动化测试从录制回放到关键字驱动，再到BDD框架比如Cucumber，每一代都在降低门槛，但本质上还是要写代码。现在MCP加大模型实现了真正的零代码绑定，你只需要改自然语言描述，不用重构测试脚本。" }, { "speaker": "host", "text": "这确实是一个范式级别的变化。那测试完了之后呢？光跑测试还不够，数据分析才是重头戏吧。" }, { "speaker": "guest", "text": "你说到点上了。跑完多轮测试后，你可以继续问Gemini，让它做性能数据的对比分析。它会自动拉取所有测试会话、筛选最新的报告、生成对比分析文件，甚至在本地生成可视化图表。你可以直观地看到不同轮次之间CPU使用率、内存占用、帧率的变化趋势，快速发现性能回退。" }, { "speaker": "host", "text": "说到这几个指标，能展开讲讲为什么这三个维度最重要吗？" }, { "speaker": "guest", "text": "嗯，CPU使用率反映计算负载，持续高占用会导致发热和耗电快。内存要关注峰值和泄漏趋势，Android在内存压力大的时候会触发Low Memory Killer直接杀进程，用户体验就是闪退。帧率对游戏最直观，60FPS是基准线，低于30FPS用户就会明显感觉到卡顿。通过多轮对比建立性能基线，在持续集成里就能做性能门禁，代码一提交就知道有没有引入性能问题。" }, { "speaker": "host", "text": "还有一个场景我很感兴趣——崩溃日志分析。这个一直是移动开发的老大难问题。" }, { "speaker": "guest", "text": "太对了。特别是Unity开发的应用，崩溃可能发生在Java层、IL2CPP转译后的C++层、或者Mono运行时层，堆栈信息非常复杂。传统做法是开发者手动读日志、匹配已知问题模式、查文档，非常依赖经验。现在你只需要把包含崩溃日志的会话ID给Gemini，它会自动拉取日志、定位关键信息、识别崩溃模式——比如空指针、内存越界、线程死锁这些，然后给出针对性的修复建议。从专家经验驱动变成AI辅助驱动，效率提升太明显了。" }, { "speaker": "host", "text": "而且这里还有一个隐含的好处——MCP协议的标准化意味着你不一定非得用Gemini CLI，Cline、Claude Desktop这些工具也能接同一个MCP Server。" }, { "speaker": "guest", "text": "对，这正是MCP最大的价值。服务端实现一次，整个AI助手生态都能复用。开发者完全可以根据自己的习惯选工具，底层能力是一样的。" }, { "speaker": "host", "text": "总结一下今天聊的内容：MCP协议把AI和外部工具的连接标准化了，Gemini CLI提供了强大的命令行AI能力，云真机提供了真实设备的测试基础设施。三者结合，实现了自然语言驱动的移动应用全流程测试——从设备管理到性能监控到崩溃分析，门槛大幅降低，效率显著提升。这种模式我觉得值得每个移动开发者去试试，尤其是做游戏的团队。" }, { "speaker": "guest", "text": "嗯，而且随着MCP生态越来越完善、大模型能力继续提升，这种AI驱动测试的模式只会越来越成熟。现在入场正好是个好时机。" } ],

Gemini CLI + MCP Server云真机自动化测试：自然语言驱动移动应用测试实战

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报