播客频道 | 语法约束解码：让小模型生成可靠Bash代码的实战指南

李博！上周我们组出了个事故，你猜怎么着——一个3B的小模型生成的Bash脚本直接把测试环境的日志全删了。哈哈哈，经典。让我猜猜，引号没闭合？还是重定向写反了？引号没闭合，导致后面的参数被当成文件名解析了。我当时就在想，这种低级语法错误到底有没有办法从根上杜绝。你这个问题问得太好了。正好最近NVIDIA发了一篇技术博客，讲的就是这个事儿——语法约束解码，英文叫Grammar-Constrained Decoding，简称GCD。约束解码？这个我在JSON结构化输出那块见过，就是限制模型只能输出合法的JSON对吧？对，思路完全一样。但用在Bash上，难度要大得多。你想啊，JSON的语法多规整——花括号、方括号、键值对，规则很清晰。但Bash这玩意儿，几十年历史演化下来，语法复杂度在脚本语言里绝对是天花板级别的。heredoc的定界符可以是任意字符串，双引号里的变量展开规则跟引号外还不一样，进程替换、花括号展开各有各的语法。等会儿，我先理解一下。你说的约束解码，具体是在哪个环节起作用的？是训练的时候还是推理的时候？这就是它最精妙的地方——完全不动模型权重，只在推理阶段介入。你想象一下，模型每一步生成token的时候，会算出一个概率分布对吧？覆盖整个词表，三万到十几万个token。语法约束模块做的事情就是：根据当前已经生成的内容，算出哪些token在语法上是合法的下一步，然后把不合法的token概率直接设成零。哦！就相当于给模型加了一张安全网，不让它跳到语法错误的分支上去。对，而且关键的数学性质是——合法token之间的相对概率排序完全不变。模型原来觉得哪个词更好，约束之后还是觉得那个词更好，只是把明显违法的选项踢掉了。这不就是……既不影响语义，又保证语法？天上掉馅饼啊这是。哈哈，没那么夸张，但确实是个很务实的工程方案。那具体怎么实现的？总不能每一步都跑一遍完整的Bash parser吧，那延迟不炸了？好问题。实际上是把Bash的语法规则预先编码成上下文无关文法，然后转换成一种高效的状态机表示，类似下推自动机。每一步解码只需要查当前状态下的合法转移，速度很快。但你刚才不是说Bash语法不完全是上下文无关的吗？那怎么用CFG来描述？诶，你这个追问很到位。实际工程中确实要做权衡——覆盖最常用的80%语法结构，对那些特别边界的情况采用宽松匹配策略。你不能为了100%精确把模型卡死，让它连合理但罕见的写法都生成不了。懂了懂了，就是实用主义优先。那效果到底怎么样？有数据吗？效果非常明显。引号不匹配、结构不完整这类低级错误基本被完全消除，生成的脚本能直接跑的比例大幅提升。而且语义质量不受损。等等，语法对了不代表语义对吧？对，这点必须说清楚。语法约束解码解决的是'能不能跑'的问题，不是'跑得对不对'的问题。但你想，如果连语法都过不了，后面的语义验证、安全检查根本无从谈起。这我太有感触了。我们做Agent的时候，模型生成一条Bash命令语法错了，整个工作流就断了，然后Agent疯狂重试，token费用蹭蹭涨。对对对，这就是Agent场景下最头疼的事。你用GPT-4当然没问题，但成本和延迟摆在那儿。所以这个方案本质上是让小模型也能胜任Agent的工具调用？我觉得这是它最大的实际价值。你想想，边缘设备、IoT、离线环境，这些地方只能跑1B到7B的小模型。以前这些模型写Bash就是不靠谱，现在加上语法约束，可靠性直接上了一个台阶。那框架支持怎么样？我们用vLLM比较多。 vLLM和TensorRT-LLM都已经支持了。它们的采样接口都有Logits Processor的扩展点，语法约束就是通过这个接口插进去的。这也太方便了吧，不用换框架直接能用？嗯，而且社区已经有现成的实现了。微软的Guidance库、Outlines项目、llama.cpp里的GBNF语法支持，都是可以直接拿来用的工具。你们产品经理就知道能不能直接用。哈哈，被你抢了我的台词，我本来想说'你们产品经理果然只关心落地'。得了吧。那我最后问一个问题——你觉得这个思路的上限在哪？嗯……我觉得它代表了一种很重要的工程哲学。与其砸资源训更大的模型，不如在推理阶段用聪明的约束来弥补小模型的不足。这个思路不只适用于Bash，SQL、YAML、正则表达式、任何有形式文法的语言都能用。所以本质上是把确定性的规则知识从模型里抽出来，放到推理管线里去保障。对，说得很精确。有时候聪明的工程约束比更大的模型更管用。这句话我觉得值得每个做AI系统的人记住。好，我回去就让团队调研一下怎么把这个集成到我们的Agent里。下次再出事故我找你算账啊。行行行，出了事故请我喝咖啡就行。

语法约束解码：让小模型生成可靠Bash代码的实战指南

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报