AI热点风向标·06月08日午间版
AI热点风向标·06月08日午间版
06月08日午间版 AI热门话题深度讨论,5个热点
06月08日午间版 AI热门话题深度讨论,5个热点
最近AI圈有几个话题特别火,我刷B站刷到停不下来,尤其是MiniMax M3全量发布这事儿,弹幕直接炸了。
对,M3这次挺高调的,号称测试吊打Gemini、Claude、GPT,十几万互动量,说明大家真的很关注国产大模型能不能打。
我看了一个很详细的测评视频,七个任务跑下来,结论其实挺微妙的。先说它的核心卖点,原生多模态。
对,测试者给了一张景色照片让M3用Three.js复刻3D场景,大关系是对的,三层构图、城堡、河谷、建筑配色方向都接近。
但是细节拉胯得厉害啊,原图最明显的那条河直接没了,水面反射、空气透视全丢,国旗汽车也没有。
所以我的判断是,M3的原生多模态不是噱头,但也没到惊艳的程度。它能看大关系,看不了小细节。
那旋转六边形弹球那个测试呢?我觉得那个反而更能说明问题。
那个确实进步明显。M2.7把旋转的边当成静止砖头,M3听懂了边在转,用了刚体模拟,弹球的物理行为合理多了。
所以从产品角度看,M3的提升是实打实的,但号称吊打三巨头这个说法,你觉得站得住吗?
站不住。坦白说,benchmark上可能某些项领先,但综合体验还有差距。不过国产模型敢这么喊,说明信心在涨。
我倒觉得这种高调宣传也不全是坏事,至少逼着大家去做独立测评,用户的判断力也在提升。
没错,B站上十八万互动量,说明用户不是无脑信,而是真的在验证。这种生态其实挺健康的。
行,M3先聊到这儿。接下来聊个让我有点五味杂陈的话题。
什么话题?
B站上有个视频特别火,标题就是保姆级破解教程,内容是教人免费用Grok,而且不限次数。
得了吧,这种视频我太熟悉了。本质上就是薅羊毛教程加流量密码,三连关注求一波,标准套路。
但你不觉得这反映了一个真实需求吗?很多用户确实付不起或者不想付大模型的订阅费。
需求是真的,但方式有问题。而且那个视频后半段直接变成AI女友角色扮演展示,你不觉得这才是真正的卖点吗?
确实,什么专属AI女友、酣畅淋漓的恋爱,这些才是真正驱动传播的东西。
所以这个现象本质上不是技术话题,是需求话题。大量用户对AI的第一诉求不是生产力,是陪伴和情感。
作为产品经理我必须承认,情感陪伴类应用的用户粘性确实碾压工具类产品,DAU数据差好几倍。
但这条路走下去,AI行业的叙事会变得很尴尬。投资人讲的是AGI改变世界,用户要的是虚拟对象。
你可拉倒吧,用户需求就是需求,没有高低贵贱之分。不过破解这个事本身确实不太光彩。
行吧行吧,需求合理,手段存疑,咱们就这么总结。
好,聊下一个。最近有个话题我在几个平台都看到了,就是Agent原生工作法怎么落地。
对,B站上有个系统性的入坑指南挺火的,从怎么选Agent到实践案例到快速上手,一条龙。
我自己团队其实也在探索这个方向,说实话现在Agent的选择太多了,Coze、Dify、扣子,眼花缭乱。
我觉得这个话题火起来的原因很简单,就是大家从尝鲜阶段进入了实用阶段。光会聊天不够了,要能干活。
对,从我的产品视角看,用户的心态变了。去年是觉得AI好酷,今年是觉得AI你得帮我省时间。
但说实话,现在Agent的可靠性还是个大问题。多步骤任务的成功率,业界普遍在百分之六七十左右。
这我太有体会了,我们内部测试一个客服Agent,简单问题没问题,稍微复杂点就开始幻觉。
所以现在的最佳实践其实是人机协作,Agent干百分之八十的活,人来兜底那百分之二十。
这个我同意。但问题是很多小白用户期望太高,以为Agent能完全替代人,落差感会很强。
这就是为什么这类入门指南视频有价值,它帮用户建立合理预期,比盲目吹捧强太多。
好,最后快速聊一个。SpaceX、OpenAI、Anthropic三巨头IPO的话题,你怎么看?
这三家如果真的集中IPO,那就是科技史上最大的一波造富运动,没有之一。
但问题是谁来买单?现在这些公司的估值已经高得离谱了,OpenAI据说三千亿美金。
对,Anthropic也是六百亿级别。核心问题是,这些估值是基于未来营收预期,但AI的商业化路径其实还没完全跑通。
从产品角度我挺担心的,一旦上市就要面对季报压力,可能会影响长期研发投入。
这是个经典矛盾。AGI需要长期主义,资本市场要短期回报。但不上市又融不到足够的钱烧算力。
所以本质上是个两难,烧钱速度太快了,不得不上市。
没错,OpenAI一年烧几十亿美金,光靠私募已经撑不住了。IPO是必然选择,问题只是时机。
好,今天这几个话题聊得挺过瘾的。M3有进步但别吹太猛,Agent要降低预期务实落地,IPO大潮要来但泡沫风险也在。
总结到位。其实这几个话题串起来就是AI行业现在的状态,技术在进步,商业在焦虑,用户在觉醒。
说得好,那咱们今天就到这儿,晚上见。
晚上见。
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。