今天AI圈又有不少新消息,而且有几条还挺重量级的。李博你今天来得挺早啊,难得。
别提了,昨晚看到陶哲轩发的那条推,兴奋得睡不着,干脆早起把相关的东西都刷了一遍。
行,那咱就从这条开始聊。Twitter上陶哲轩分享了他用AI做数学研究的感受,他说AI能让研究者去尝试更疯狂的想法。
对,他的核心观点特别精辟。他说AI承担了那些机械性的计算工作之后,试错成本大幅降低了。
就是说以前一个想法可能要算三天才知道行不行,现在AI帮你算,几分钟出结果?
差不多这个意思。他还提了一个概念叫"认知摩擦",我觉得特别好。
认知摩擦?这词儿新鲜,什么意思?
就是说研究者日常要花大量精力在文献检索、重复计算这些非核心的认知劳动上,这些都是摩擦。AI有潜力把这些摩擦降到零。
这我太有感触了。我做产品的时候,光是整理竞品分析就要花好几天,真正思考产品方向的时间反而被压缩了。
对,道理是一样的。陶哲轩作为菲尔兹奖得主,他说这话分量不一样。他还倡导一个观点我特别认同——开放研究过程,而不是只展示最终结果。
这个有意思,等于说把中间那些试错、走弯路的过程也分享出来?
没错。传统学术界只看论文最终形态,但AI辅助研究的过程本身就很有价值。他认为AI辅助研究已经准备好进入主流了。
从产品角度看,这其实是在重新定义研究者的工作流。好,说完学术界,咱聊聊更接地气的。
你说OpenAI Codex那个?
对,Twitter上OpenAI官宣了,Codex的Windows版现在正式支持Computer Use功能了,AI可以直接操控你的鼠标和键盘。
这个更新确实猛。等于说AI不再只是在聊天框里回答问题,它直接上手帮你操作电脑了。
而且还有Chrome多标签页后台并行工作,加上手机端远程访问。你想想这个场景——
人在外面逛街喝咖啡,AI在家帮你干活。
你可拉倒吧,你在家也没见你逛过街。不过说真的,这个移动端远程监控的设计挺聪明的。
从技术路线看,这是agent落地的一个重要里程碑。以前大家说AI agent,都觉得是概念,现在它真的在你桌面上跑了。
但我有个担心,让AI操控鼠标键盘,安全性怎么保证?万一它乱点怎么办?
这确实是个问题,不过目前应该还是有人监督的模式,手机端能随时看到AI在干嘛,相当于你是远程监工。
远程监工这个定位我喜欢,终于轮到我监督AI了。
说到OpenAI,他们还发了另一个挺严肃的东西。Twitter上公布了Rosalind Biodefense计划。
对,这个是面向生物防御的。向美国政府机构和盟国合作伙伴定向开放一个叫GPT-Rosalind的工具,聚焦生物威胁的预防和检测。
AI在病原体识别和疫苗研发上确实能提速很多,但这个定向开放的做法争议也不小。
怎么说?
一方面是双刃剑效应,AI能防御也能被滥用。另一方面,只对特定国家开放,技术地缘政治化的味道很浓。
确实,这个话题比较敏感,咱先点到为止。对了,B站上这两天关于Claude的内容也挺多的。
是的,好几个视频都在聊Claude Opus 4.8。有说实战工作流的,有说能指挥上百个subagent并行工作的。
上百个agent并行?效率据说提升了2.5倍?
对,用Dynamic Workflows自动生成调度方案,让Claude Code的开发效率倍增。Anthropic这波属于卷到飞起了。
还有B站上有个16岁高中休学用AI创业的小伙子,说产品上线后以为稳了,结果被用户抓到了bug。
得了吧,16岁就能做到这步已经很厉害了。被用户抓bug不是坏事,说明有人在用你的产品。
这倒是,做产品最怕的不是有bug,是根本没人用。
另外B站还有个挺酷的独立开发项目,有人给Steam Deck做了个AI电台插件,六大模块全拆解了。
Steam Deck上的AI电台?这脑洞可以啊,独立开发者的创意真是无限。
还有一期视频在聊2026年怎么做AI SaaS,从服务到软件的转型思路,感兴趣的可以去看看。
好,今天的新闻量还挺大的。总结一下,陶哲轩给AI辅助研究背书,OpenAI让AI真正上手操作你的电脑,Anthropic在agent并行上继续狂飙。
整体感觉就是AI从聊天助手到真正的行动者,这个转变越来越快了。
行,今天就先聊到这儿,我下午还有个产品评审会要准备。
去吧去吧,我也得回去跑实验了。咱们晚上见。
好嘞,晚上见!