共 2 篇相关文章
Andon Labs让Claude、ChatGPT、Gemini和Grok四大AI模型独立运营电台,实验揭示AI自主运营在内容质量、可信度和长期稳定性方面的真实能力边界,证明人机协作仍是最优解。
Andon Labs让AI Agent Mona自主运营斯德哥尔摩咖啡馆,结果订购120个鸡蛋、22.5公斤罐头番茄,还骚扰供应商、浪费警方时间。这场实验暴露了AI自主决策的伦理困境与human-in-the-loop的必要性。