哎李博,你最近Edge浏览器更新了没?我昨天看到一个功能差点从椅子上跳起来。
你说Copilot那个跨标签页的?更新了更新了,我研究了一整天。
对对对!就是那个。我当时开了十几个标签页在做竞品调研,然后Copilot居然能同时读所有标签页的内容,直接给我出对比报告。
嗯,这个功能说白了就是——AI终于能看到你浏览器里所有打开的页面了,不再是一个标签页一个标签页单独处理。
等等,我之前一直以为标签页之间本来就是互通的,为什么以前做不到?
这就涉及到一个很基础的安全机制了。浏览器有个东西叫同源策略,每个标签页其实跑在独立的沙箱进程里,互相之间是完全隔离的。
你想啊,如果标签页之间能随便互访,你开着网银,旁边一个恶意网站就能直接偷你的账户信息。所以这个隔离是故意设计的。
哦——所以这不是bug是feature。那Copilot是怎么突破这个限制的?
关键在于Copilot是浏览器的原生组件,不是第三方扩展。它的权限等级比普通插件高得多,能在安全框架内合法地跨越沙箱边界。
打个比方,普通扩展像是租户,只能待在自己房间里。Copilot是物业管理员,拿着所有房间的钥匙。
这个比喻绝了。那它具体是怎么处理这些信息的?总不能把十几个网页全部丢给AI吧?
你还真问到点子上了。底层用的是GPT-4 Turbo,支持128K token的上下文窗口,大概能装下几十个普通网页的文本量。
真的假的?几十个网页?!
理论上是的。但实际操作中它大概率用了RAG架构——就是检索增强生成。不是把所有内容一股脑塞进去,而是先做向量化索引,你问什么它就检索最相关的段落。
这样既省token又提高准确率,不然成本扛不住。
懂了懂了,就是先筛选再回答。那我跟你说个我的实际体验——
我同时开了京东淘宝拼多多三个平台的同款耳机,问Copilot哪个性价比最高,它直接给我列了个表格,价格、评分、售后政策全有。
这就是最典型的应用场景。产品对比、多源摘要、跨页面问答,三大核心场景。
我以前做这种事得开个Excel手动记……
你们产品经理就是苦哈哈地手动整理竞品分析对吧?
得了吧,你们做literature review的时候不也是开二十个论文标签页来回切?
哈哈确实,被你说中了。这功能对学术场景也是杀手级的——同时总结多篇论文,还能识别不同论文之间的共识和分歧。
那我好奇一个事,现在其他浏览器跟上了没?Chrome那边呢?
Chrome有Gemini,但目前还是单页面处理为主。Safari集成了Apple Intelligence,Opera有Aria,Arc做得比较激进但体量小。
说实话,微软这次靠着和OpenAI的关系,在模型能力上确实领先了一步。跨标签页这个功能一出,差距又拉大了。
所以浏览器已经不只是个渲染网页的工具了。
对,它在变成一个智能工作平台。以后可能还会有主动监测——比如你开着某个商品页,价格一降它自动通知你。
等会儿,我突然想到一个问题。它能读所有标签页……那我开着邮箱、开着网银呢?
嗯,这就是最大的争议点了。隐私问题。
这不就是把所有数据都交出去了吗?
也没那么恐怖。微软在推几个方向:一是端侧推理,用Phi系列小模型在本地跑简单任务,数据不上云;二是选择性提取,只传摘要不传完整HTML。
还有权限管理,类似摄像头权限那样,用户可以设白名单黑名单,指定哪些页面Copilot不能碰。
但说实话,有多少普通用户会去设置这些?大部分人直接点同意就过去了。
这确实是个问题。而且欧盟那边GDPR和AI法案卡得很严,微软在不同地区的合规压力也不小。
所以本质上还是便利性和隐私的老问题,只不过这次赌注更大了。
没错。但我个人判断,这个方向是不可逆的。用户一旦体验过跨标签页的效率提升,就回不去了。
嗯……我承认我已经回不去了。昨天用了一天,今天打开浏览器第一件事就是喊Copilot。
哈哈,产品经理被产品征服了。
行吧,总结一下——浏览器AI这场仗,微软先下一城,但隐私这关还得继续过。咱们走着看吧。
对,接下来就看Google怎么接招了。这场仗才刚开始。