李博!你今天看新闻了没?我早上通勤的时候刷到好几条AI编程的消息,直接给我刷懵了。
哈哈看了看了,5月15号这一天,信息密度简直离谱。你先说哪条把你刷懵的?
Codex上手机端这事儿啊!我当时就在地铁上,想着以后是不是真能在手机上debug了?
对,OpenAI直接把Codex塞进ChatGPT的移动端APP了。你想啊,以前开发者要改个代码,必须得打开电脑,现在通勤路上就能搞。
但说实话,手机屏幕那么小,真有人会在上面写代码吗?我感觉更多是review和快速修bug的场景。
你这个产品直觉挺准的。它核心价值不是让你在手机上从零写项目,而是随时随地能跟AI对话式地处理代码问题。线上出了bug,你不用等回到工位才能响应。
但我跟你说,Codex上手机端其实不是今天最炸裂的点。
啊?那什么才是?
Windows沙盒技术文档。OpenAI同步发了这个,意图太明显了——它在给全自动PC Agent铺路。
等会儿让我想想……沙盒就是那个隔离环境对吧?程序在里面跑,不会影响外面的系统。
对!但关键是它做了提权设计。沙盒内部,AI有足够的权限——装依赖、读写文件、启动服务,啥都能干。但这些操作全被关在笼子里,逃不出去。
你想想这意味着什么?AI不仅能写代码,还能在安全环境里自己执行代码、自己测试、自己迭代。
那不就是……全自动编程助手的最后一块拼图?!
Bingo。写代码加执行代码加验证结果,闭环了。
好家伙。那微软那边呢?我看到说收紧Claude Code许可,这是什么操作?
经典的生态围墙策略。微软把Anthropic的Claude Code在自家系统组件里的许可给卡了,同时推自己的GitHub Copilot App。
这不就是当年浏览器大战那套吗?用平台控制权锁开发者。
你们产品经理历史课学得不错啊。
得了吧,这谁看不出来。但对开发者来说确实头疼,今天用得好好的工具,明天可能就被掐了。
所以多平台备份工作流现在是刚需。不过我今天最想聊的其实是腾讯那个开源方案。
TB Agent Memory?Token消耗降低61%那个?
对!你知道现在Agent落地最大的痛点是什么吗?就是Token太贵了。复杂任务跑一次,API费用可能好几美元。
这个我有体感,我们组之前试过用Agent跑多步骤任务,上下文越来越长,成本蹭蹭往上涨。
腾讯这套方案的核心思路是——别把所有历史对话一股脑塞给模型。它用Mermaid任务画布把复杂任务结构化成流程图节点,然后用上下文协载技术,只加载当前步骤真正需要的信息。
就像你考试的时候不用把整本教材背下来,只翻到相关章节看就行?
哈哈这比喻可以。而且结果不光是省钱,任务成功率还提升了51%。因为噪音少了,模型反而更专注。
又省钱又提效,这开源出来对中小团队太友好了。
诶对了,你听说RSI那个公司没?
田渊栋从Meta出来创业那个?46亿美元估值?
真的假的你知道投资人是谁吗?黄仁勋和苏姿丰,NVIDIA和AMD的CEO,同时投了同一家公司。
等等,这俩不是竞争对手吗?!
对啊!两大芯片巨头掌门人罕见联手,说明他们对这个方向的判断高度一致。RSI要做的事情是——让AI递归地研究AI自身。
递归研究……就是AI改进自己的算法,改进完了又变得更强,然后继续改进自己?
没错。这个概念最早1965年就有人提出来了,叫智能爆炸假说。RSI具体要做的是搭一个平台,让AI自主读论文、设计实验、验证假设、迭代改进。
5万个博士级别的AI在那自己搞研究……这听起来既兴奋又有点吓人。
安全性确实是大问题。怎么确保递归改进不偏离人类意图?这是个开放问题。但资本已经用脚投票了。
你看今天这一圈聊下来,从手机端写代码到生态围墙到降本增效再到AI研究AI自己,整个赛道已经不是单纯比谁的模型好了。
完全是全方位的生态战争。移动端体验、平台绑定、成本优化、算力基建、研究范式,每一层都在打。
那对咱们普通开发者来说,你觉得最务实的建议是什么?
三句话:别押注单一平台,多关注开源方案保持灵活性,然后认真想想Agent自动化会怎么改变你的工作流。全自动Agent的时代,真的比我们想象的近。
行,那我先回去把我们组的工作流备份方案重新评估一下。下次再聊!