AI热点风向标·06月12日晚间版
AI热点风向标·06月12日晚间版
06月12日晚间版 AI热门话题深度讨论,5个热点
06月12日晚间版 AI热门话题深度讨论,5个热点
最近AI圈有几个话题特别火,我刷B站的时候发现一个特别有意思的现象。
GPT-5.4的测评视频火了,互动量破万,标题特别绝——脑子诺奖级,动手幼儿园。
这个标题确实精准,一句话就把GPT-5.4的核心矛盾给概括了。
其实这代表了一个很重要的趋势,就是大模型的reasoning能力和execution能力之间的gap越来越明显。
你让它推理一个复杂的数学问题,它能给你写出堪比论文级别的思路。但你让它真正去执行一些具体任务,比如写个完整能跑的项目,它就开始拉胯。
对,这个我特别有感触。从产品角度看,用户其实不太在乎你推理多强。
用户要的是,我给你一个需求,你给我交付一个结果。中间过程再漂亮,最后跑不起来就是零分。
没错,这就是所谓的last mile problem。
B站评论区很多人说,GPT-5.4的思维链看着特别厉害,分析得头头是道,但一到代码执行层面就各种bug。
所以这就引出一个问题——OpenAI是不是在刻意往reasoning方向卷,但忽略了工程落地?
我觉得不是忽略,是这两个能力的提升路径本来就不一样。
推理能力可以通过scaling law硬堆上去,但执行能力需要的是跟真实环境的交互反馈,这个数据飞轮没那么容易转起来。
行,那你觉得这个gap短期内能补上吗?
短期很难。但这恰好解释了为什么Agent这个概念现在这么火。
哎你这个过渡太自然了,我正要聊这个。
B站上有个Agent教程视频最近也很火,标题说十二个小项目从原理到实战,学完即就业。
说实话看到这种标题我第一反应是——又来割韭菜的?
你这个直觉其实有道理,但我觉得要分两层看。
第一层,Agent开发确实是当下最热的工程方向,没有之一。不管是LangChain、CrewAI还是AutoGen,整个生态在快速成熟。
第二层,学完即就业这种话肯定是夸张了。Agent开发的门槛其实不低,光会调API是不够的。
那你觉得这类教程为什么此刻能火起来?
因为刚才说的那个gap。大模型自己搞不定的事,就需要Agent框架来补。
Agent本质上就是给大模型装上手和脚,让它不光能想,还能干活。所以市场对Agent开发者的需求是实打实的。
这么说的话,Agent其实是GPT-5.4那个动手幼儿园问题的工程解法?
可以这么理解。与其等模型自己进化出执行力,不如用工程手段把工具链给它搭好。
那从求职市场看,现在学Agent开发到底值不值?
值,但别指望速成。我的建议是先把基础的LLM调用和prompt engineering搞明白,再去碰Agent框架。
对,别还没学会走就想跑。
说到实战开发,B站上还有个特别火的方向——Claude Code加本地大模型做全栈开发。
这个视频也是保姆级教程,从零基础到精通,互动量也不低。
Claude Code这个东西确实值得关注。它跟Cursor、GitHub Copilot的思路不太一样。
Claude Code更偏向终端操作,直接在命令行里跟你的整个项目交互,不是简单的代码补全。
那加上本地大模型这个点是什么意思?是为了省钱还是为了隐私?
两个都有,但我觉得更核心的是可控性。
业内很多团队现在的做法是,简单任务用本地小模型跑,复杂推理再调云端大模型。这样成本和延迟都能控制住。
所以本质上是一个混合部署的方案。
对,这才是AI辅助开发真正落地的形态。不是所有场景都需要GPT-5级别的模型,杀鸡焉用牛刀。
这倒是,从产品角度看,能用最低成本解决问题的方案才是好方案。
不过我还注意到一个有意思的现象,B站上Java毕设项目的视频也特别火。
什么宠物领养系统、网约车出行项目,互动量都挺高的。你怎么看这个?
这个现象挺耐人寻味的。你想啊,一边是AI编程工具越来越强,一边是传统Java毕设项目依然有巨大需求。
说明什么?说明大部分计算机专业的学生,他们的刚需还是把毕业设计做出来、答辩过关。
这个确实,AI再厉害也替代不了你得交一个能跑的系统这个硬性要求。
但我觉得更值得讨论的是,这类项目跟AI的交叉点。
现在很多学生其实就是用Claude或者GPT来辅助写这些毕设项目的。网约车系统、宠物领养系统,这种CRUD项目AI写起来又快又好。
所以你的意思是,这些毕设教程的热度,反过来也证明了AI编程工具的渗透率在快速提升?
没错。而且我敢说,明年这个时候,这类视频的标题可能就变成——用AI三天搞定毕设,SpringBoot网约车项目。
得了吧,到时候答辩老师也进化了,专门问你AI写不出来的问题。
那倒是,这就是一场永恒的军备竞赛。
好,那我们来总结一下今天的几个话题。
GPT-5.4暴露了大模型推理强但执行弱的核心矛盾,Agent框架正在成为弥补这个gap的工程解法。
Claude Code加本地模型的混合方案代表了AI辅助开发的实际落地方向,不是一味追求最强模型。
而传统开发项目的持续火热,说明AI工具的渗透是润物细无声的,它不是替代,是融合。
说得好。今天就聊到这儿,我们明天见。
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。