AI热点风向标·06月12日晚间版

最近AI圈有几个话题特别火，我刷B站的时候发现一个特别有意思的现象。

GPT-5.4的测评视频火了，互动量破万，标题特别绝——脑子诺奖级，动手幼儿园。

这个标题确实精准，一句话就把GPT-5.4的核心矛盾给概括了。

其实这代表了一个很重要的趋势，就是大模型的reasoning能力和execution能力之间的gap越来越明显。

你让它推理一个复杂的数学问题，它能给你写出堪比论文级别的思路。但你让它真正去执行一些具体任务，比如写个完整能跑的项目，它就开始拉胯。

对，这个我特别有感触。从产品角度看，用户其实不太在乎你推理多强。

用户要的是，我给你一个需求，你给我交付一个结果。中间过程再漂亮，最后跑不起来就是零分。

没错，这就是所谓的last mile problem。

B站评论区很多人说，GPT-5.4的思维链看着特别厉害，分析得头头是道，但一到代码执行层面就各种bug。

所以这就引出一个问题——OpenAI是不是在刻意往reasoning方向卷，但忽略了工程落地？

我觉得不是忽略，是这两个能力的提升路径本来就不一样。

推理能力可以通过scaling law硬堆上去，但执行能力需要的是跟真实环境的交互反馈，这个数据飞轮没那么容易转起来。

行，那你觉得这个gap短期内能补上吗？

短期很难。但这恰好解释了为什么Agent这个概念现在这么火。

哎你这个过渡太自然了，我正要聊这个。

B站上有个Agent教程视频最近也很火，标题说十二个小项目从原理到实战，学完即就业。

说实话看到这种标题我第一反应是——又来割韭菜的？

你这个直觉其实有道理，但我觉得要分两层看。

第一层，Agent开发确实是当下最热的工程方向，没有之一。不管是LangChain、CrewAI还是AutoGen，整个生态在快速成熟。

第二层，学完即就业这种话肯定是夸张了。Agent开发的门槛其实不低，光会调API是不够的。

那你觉得这类教程为什么此刻能火起来？

因为刚才说的那个gap。大模型自己搞不定的事，就需要Agent框架来补。

Agent本质上就是给大模型装上手和脚，让它不光能想，还能干活。所以市场对Agent开发者的需求是实打实的。

这么说的话，Agent其实是GPT-5.4那个动手幼儿园问题的工程解法？

可以这么理解。与其等模型自己进化出执行力，不如用工程手段把工具链给它搭好。

那从求职市场看，现在学Agent开发到底值不值？

值，但别指望速成。我的建议是先把基础的LLM调用和prompt engineering搞明白，再去碰Agent框架。

对，别还没学会走就想跑。

说到实战开发，B站上还有个特别火的方向——Claude Code加本地大模型做全栈开发。

这个视频也是保姆级教程，从零基础到精通，互动量也不低。

Claude Code这个东西确实值得关注。它跟Cursor、GitHub Copilot的思路不太一样。

Claude Code更偏向终端操作，直接在命令行里跟你的整个项目交互，不是简单的代码补全。

那加上本地大模型这个点是什么意思？是为了省钱还是为了隐私？

两个都有，但我觉得更核心的是可控性。

业内很多团队现在的做法是，简单任务用本地小模型跑，复杂推理再调云端大模型。这样成本和延迟都能控制住。

所以本质上是一个混合部署的方案。

对，这才是AI辅助开发真正落地的形态。不是所有场景都需要GPT-5级别的模型，杀鸡焉用牛刀。

这倒是，从产品角度看，能用最低成本解决问题的方案才是好方案。

不过我还注意到一个有意思的现象，B站上Java毕设项目的视频也特别火。

什么宠物领养系统、网约车出行项目，互动量都挺高的。你怎么看这个？

这个现象挺耐人寻味的。你想啊，一边是AI编程工具越来越强，一边是传统Java毕设项目依然有巨大需求。

说明什么？说明大部分计算机专业的学生，他们的刚需还是把毕业设计做出来、答辩过关。

这个确实，AI再厉害也替代不了你得交一个能跑的系统这个硬性要求。

但我觉得更值得讨论的是，这类项目跟AI的交叉点。

现在很多学生其实就是用Claude或者GPT来辅助写这些毕设项目的。网约车系统、宠物领养系统，这种CRUD项目AI写起来又快又好。

所以你的意思是，这些毕设教程的热度，反过来也证明了AI编程工具的渗透率在快速提升？

没错。而且我敢说，明年这个时候，这类视频的标题可能就变成——用AI三天搞定毕设，SpringBoot网约车项目。

得了吧，到时候答辩老师也进化了，专门问你AI写不出来的问题。

那倒是，这就是一场永恒的军备竞赛。

好，那我们来总结一下今天的几个话题。

GPT-5.4暴露了大模型推理强但执行弱的核心矛盾，Agent框架正在成为弥补这个gap的工程解法。

Claude Code加本地模型的混合方案代表了AI辅助开发的实际落地方向，不是一味追求最强模型。

而传统开发项目的持续火热，说明AI工具的渗透是润物细无声的，它不是替代，是融合。

说得好。今天就聊到这儿，我们明天见。

AI热点风向标·06月12日晚间版

相关推荐

GitHub Agent HQ发布：AI编程工具进入平台化竞争时代

Gemini 3.5 Flash在GDPval基准上实现巨大飞跃

Google Gemini Antigravity周配额三倍提升，AI编程不再受限