AI热点风向标·06月08日午间版

最近AI圈有几个话题特别火，我刷B站刷到停不下来，尤其是MiniMax M3全量发布这事儿，弹幕直接炸了。

对，M3这次挺高调的，号称测试吊打Gemini、Claude、GPT，十几万互动量，说明大家真的很关注国产大模型能不能打。

我看了一个很详细的测评视频，七个任务跑下来，结论其实挺微妙的。先说它的核心卖点，原生多模态。

对，测试者给了一张景色照片让M3用Three.js复刻3D场景，大关系是对的，三层构图、城堡、河谷、建筑配色方向都接近。

但是细节拉胯得厉害啊，原图最明显的那条河直接没了，水面反射、空气透视全丢，国旗汽车也没有。

所以我的判断是，M3的原生多模态不是噱头，但也没到惊艳的程度。它能看大关系，看不了小细节。

那旋转六边形弹球那个测试呢？我觉得那个反而更能说明问题。

那个确实进步明显。M2.7把旋转的边当成静止砖头，M3听懂了边在转，用了刚体模拟，弹球的物理行为合理多了。

所以从产品角度看，M3的提升是实打实的，但号称吊打三巨头这个说法，你觉得站得住吗？

站不住。坦白说，benchmark上可能某些项领先，但综合体验还有差距。不过国产模型敢这么喊，说明信心在涨。

我倒觉得这种高调宣传也不全是坏事，至少逼着大家去做独立测评，用户的判断力也在提升。

没错，B站上十八万互动量，说明用户不是无脑信，而是真的在验证。这种生态其实挺健康的。

行，M3先聊到这儿。接下来聊个让我有点五味杂陈的话题。

什么话题？

B站上有个视频特别火，标题就是保姆级破解教程，内容是教人免费用Grok，而且不限次数。

得了吧，这种视频我太熟悉了。本质上就是薅羊毛教程加流量密码，三连关注求一波，标准套路。

但你不觉得这反映了一个真实需求吗？很多用户确实付不起或者不想付大模型的订阅费。

需求是真的，但方式有问题。而且那个视频后半段直接变成AI女友角色扮演展示，你不觉得这才是真正的卖点吗？

确实，什么专属AI女友、酣畅淋漓的恋爱，这些才是真正驱动传播的东西。

所以这个现象本质上不是技术话题，是需求话题。大量用户对AI的第一诉求不是生产力，是陪伴和情感。

作为产品经理我必须承认，情感陪伴类应用的用户粘性确实碾压工具类产品，DAU数据差好几倍。

但这条路走下去，AI行业的叙事会变得很尴尬。投资人讲的是AGI改变世界，用户要的是虚拟对象。

你可拉倒吧，用户需求就是需求，没有高低贵贱之分。不过破解这个事本身确实不太光彩。

行吧行吧，需求合理，手段存疑，咱们就这么总结。

好，聊下一个。最近有个话题我在几个平台都看到了，就是Agent原生工作法怎么落地。

对，B站上有个系统性的入坑指南挺火的，从怎么选Agent到实践案例到快速上手，一条龙。

我自己团队其实也在探索这个方向，说实话现在Agent的选择太多了，Coze、Dify、扣子，眼花缭乱。

我觉得这个话题火起来的原因很简单，就是大家从尝鲜阶段进入了实用阶段。光会聊天不够了，要能干活。

对，从我的产品视角看，用户的心态变了。去年是觉得AI好酷，今年是觉得AI你得帮我省时间。

但说实话，现在Agent的可靠性还是个大问题。多步骤任务的成功率，业界普遍在百分之六七十左右。

这我太有体会了，我们内部测试一个客服Agent，简单问题没问题，稍微复杂点就开始幻觉。

所以现在的最佳实践其实是人机协作，Agent干百分之八十的活，人来兜底那百分之二十。

这个我同意。但问题是很多小白用户期望太高，以为Agent能完全替代人，落差感会很强。

这就是为什么这类入门指南视频有价值，它帮用户建立合理预期，比盲目吹捧强太多。

好，最后快速聊一个。SpaceX、OpenAI、Anthropic三巨头IPO的话题，你怎么看？

这三家如果真的集中IPO，那就是科技史上最大的一波造富运动，没有之一。

但问题是谁来买单？现在这些公司的估值已经高得离谱了，OpenAI据说三千亿美金。

对，Anthropic也是六百亿级别。核心问题是，这些估值是基于未来营收预期，但AI的商业化路径其实还没完全跑通。

从产品角度我挺担心的，一旦上市就要面对季报压力，可能会影响长期研发投入。

这是个经典矛盾。AGI需要长期主义，资本市场要短期回报。但不上市又融不到足够的钱烧算力。

所以本质上是个两难，烧钱速度太快了，不得不上市。

没错，OpenAI一年烧几十亿美金，光靠私募已经撑不住了。IPO是必然选择，问题只是时机。

好，今天这几个话题聊得挺过瘾的。M3有进步但别吹太猛，Agent要降低预期务实落地，IPO大潮要来但泡沫风险也在。

总结到位。其实这几个话题串起来就是AI行业现在的状态，技术在进步，商业在焦虑，用户在觉醒。

说得好，那咱们今天就到这儿，晚上见。

晚上见。

AI热点风向标·06月08日午间版

相关推荐

GitHub Agent HQ发布：AI编程工具进入平台化竞争时代

Gemini 3.5 Flash在GDPval基准上实现巨大飞跃

Google Gemini Antigravity周配额三倍提升，AI编程不再受限