播客频道 | Coze智能体搭建教程：从零开始创建AI Agent完整指南

最近身边越来越多非技术背景的朋友跑来问我，说想搞一个自己的AI智能体，但一听到要写代码就劝退了。其实现在有一类低代码平台，已经把这个门槛降得非常低了。今天我们就来聊聊字节跳动的Coze平台，也叫扣子，怎么从零开始搭一个功能完整的AI智能体。请到的嘉宾是在AI应用开发领域深耕多年的技术专家，来给我们做一个深度拆解。嗯，对，Coze这个平台我觉得一个很好的类比就是——它有点像AI领域的WordPress。你想想，以前做个网站得懂HTML、CSS、JavaScript，后来WordPress出来，拖拖拽拽就能搭一个还不错的网站。Coze做的事情类似，就是让你不用写代码，通过可视化的配置，就能把一个AI智能体搭起来。而且这里说的智能体，不是那种你问一句它答一句的简单聊天机器人，它是有目标导向的，能调用工具，能多步推理。好，那我们就从最基础的开始。注册完账号之后，创建一个智能体，第一步要做什么？第一步其实就两件事：选大脑，写灵魂。选大脑就是选大模型，默认是字节自家的豆包模型，你也可以换成DeepSeek之类的。本质上就是在能力、速度和成本之间做取舍——参数量越大的模型理解力越强，但响应会慢一些，token消耗也更多。写灵魂呢，就是编写提示词，这是整个智能体最核心的部分。提示词这个东西，很多人觉得就是随便写几句话告诉AI该干嘛，但其实没那么简单吧？对，一个好的提示词通常有三层结构。第一层是角色定义，就是告诉它'你是谁'，比如'你是一个情感呵护机器人'。第二层是技能描述，你能干什么，比如倾听用户、给予鼓励、引导积极话题。第三层是限制条件，就是你不能干什么，比如不能发送负面信息。这三层缺一不可。当然，如果你实在不知道怎么写，Coze有个'优化'按钮，它会根据你的简介自动生成一版，你再微调就行。说到模型配置，有两个参数我觉得很多人看到就懵了——Temperature和Top-P。能不能用大白话解释一下？哈哈，这两个参数其实可以用一个比喻来理解。你想象AI在回答问题的时候，面前有一堆候选词，每个词都有一个'被选中的概率'。Temperature就像是一个'冒险旋钮'——你把它调低，AI就特别保守，只挑最稳妥的词，适合写技术文档、法律文书这种严谨场景；你把它调高，AI就开始放飞自我，那些平时不太可能被选中的词也有机会蹦出来，适合写小说、广告文案。一般0.4到0.7是个比较平衡的区间。那Top-P呢？听起来和Temperature效果差不多？效果确实类似，但实现方式不同。Temperature是改变整个概率分布的形状，让它变得更尖或更平。而Top-P是做一个截断——它从概率最高的词开始往下累加，加到比如80%就停，剩下那些概率特别低的词直接不考虑了。实际使用中你只需要记住一句话：两个值越低越保守，越高越发散。大多数场景用默认值就够了。好，模型配好了，提示词也写了，但大模型有个天然短板——它不知道'现在'发生了什么。比如我问它今天知乎热榜是什么，它答不上来。没错，这就是插件系统要解决的问题。插件本质上是预先写好的代码模块，背后用的是一个叫Function Calling的机制。你可以这样理解：系统会把所有可用插件的'说明书'塞给大模型看，当用户问了一个需要实时数据的问题，模型就会说'哦，这个问题我自己答不了，但我知道有个知乎热榜的插件能帮忙'，然后它会发出一条调用指令，平台去执行对应的代码，把结果拿回来，模型再基于这个结果组织最终回答。所以用户完全不用管底层怎么调用的，只要把插件加上就行？对，操作上就是点个加号，搜索你需要的功能，比如知乎热榜、链接读取、必应图片搜索，添加进去就完事了。但这里有个坑要注意——如果你的提示词限制太严格，比如写了'只回答情感问题'，那模型在判断要不要调用插件的时候，可能会被这个约束挡住。所以你要么在提示词里加上对应的技能描述，要么适当放宽限制。嗯，这个坑确实容易踩。接下来聊聊知识库，这个我觉得对企业用户来说特别重要。知识库可以说是搭建企业专属AI助手的关键。它背后的核心技术叫RAG，检索增强生成。我来讲讲它的工作原理，其实挺精巧的。你上传一个文档，系统会先把它切成一段一段的片段，然后用一个Embedding模型把每段文字变成一个高维向量——你可以理解为把文字翻译成了一串数学坐标，存到向量数据库里。用户提问的时候，系统也把问题变成向量，然后去数据库里找'距离最近'的那些片段，把它们拼到提示词里，模型就能基于这些真实资料来回答了。所以它不是让大模型去'记住'你上传的文档，而是每次回答的时候现查现用？对，这个理解非常准确。而且Coze支持三种格式的知识库：文本、表格和图片。文本上传的时候有两种解析方式，纯文字选自动分段就行，如果文档里有表格、图片这些结构化内容，就选精准解析，它会做语义级的切分，确保相关信息不会被割裂到不同片段里。表格知识库适合结构化查询，比如学费对比。图片知识库比较特殊，上传后还需要做标注，加上文字描述，智能体才能检索到。最后一个大模块——记忆系统。这个我觉得是让智能体从'工具'变成'助手'的关键一步。你这个说法我特别认同。记忆系统其实模拟了人类记忆的分层结构，分三层。第一层是变量，类似人的工作记忆，存少量关键信息，比如用户的姓名、年龄，对话中提到了就自动提取保存，下次聊天还能用。第二层是数据库，类似程序性记忆，适合记录大量结构化数据。比如你做一个记账助手，用户说'今天给女神买花花了100块'，系统自动提取金额、消费明细存进表里，后面还能查询、筛选、汇总。第三层是长期记忆，开启后系统会自动总结聊天记录，提取关键信息持久保存，下次对话自动加载，这个类似人的情景记忆。三层记忆从轻到重，覆盖了从简单到复杂的场景，设计得确实挺巧妙的。嗯，而且每个用户的数据是隔离的，不用担心串数据的问题。好，我来做个总结。其实搭建一个Coze智能体，核心就是把四个模块搞明白：提示词决定它的性格，插件扩展它的能力边界，知识库给它灌注专业知识，记忆系统让它能记住用户。这四个模块灵活组合，基本上就能覆盖大部分业务场景了。对于零基础的朋友来说，我建议先从一个简单的场景入手，比如做个客服机器人，把流程跑通，再逐步加插件、加知识库，一步步迭代。对，千万别想着一步到位。先把提示词写好，在右侧预览区反复测试调优，这一步做扎实了，后面加功能就是锦上添花的事。而且Coze的发布渠道也很丰富，飞书、抖音、微信都能接入，做好了直接就能用起来。

Coze智能体搭建教程：从零开始创建AI Agent完整指南

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报