播客频道 | 实测GPT-Image-2：一句话出图效果炸裂，设计师该何去何从？

李博！你最近朋友圈发的那张图，是你自己做的还是AI生的？我真没看出来。哈哈哈你说那张？GPT-Image-2生成的，一句话出的图。等等，一句话？就那个看起来像专业摄影棚拍的人像？对，就一句中文描述，连提示词工程都不用了。我跟你说，这个模型是真的把门槛打到地板了。你得给我好好讲讲。我记得之前用Midjourney的时候，光写提示词就得写一大段英文，什么masterpiece冒号1.5，负面提示词一堆，调参数调到头秃。没错，以前那套东西本质上是你在帮模型做翻译——把你脑子里的画面翻译成它能理解的指令语言。但GPT-Image-2不一样，它底层架构直接融合了大语言模型的语义理解能力。你就像跟人说话一样，说'帮我做个马斯克和库克对比的海报'，它自己就知道该怎么构图、怎么配色、怎么排版。这不就是我们产品经理天天喊的'降低用户认知负担'嘛！终于有人把这事做到位了。你们产品经理就知道用户体验，哈哈。但这次确实是体验层面的质变，不是量变。行行行，那审美呢？我之前用AI出图最大的痛点就是——能用，但丑。配色辣眼睛，排版一言难尽。这个点特别值得说。有人测试让它生成日系穿搭手册，就一句提示词，出来的东西——配色、留白、字体选择、视觉层次，全都是专业设计师水准。真的假的？日系穿搭手册那种很讲究调性的东西？真的。你想想，如果传统方式做同样质量的图，设计师得找素材、贴图、修细节、排版，没几百块钱下不来。现在一句话，一分钟，成本约等于零。我作为一个经常跟设计团队协作的人，听到这个数字是真的有点慌。那它审美好的原因是什么？训练数据？大概率是OpenAI在训练数据里塞了大量专业策展过的设计作品和摄影作品，再加上RLHF——就是让人类反馈来教模型什么是'好看'。而且它是多模态架构，文字和视觉在同一个表征空间里处理，所以能自动遵循三分法构图、互补色搭配这些设计原则。懂了懂了，相当于它不只是学会了画画，还学会了设计思维。但最让我不安的不是设计类图片，是真人人像。怎么说？有测试者生成了一个女生的照片，还有她'被采访的综艺片段'截图。那个测试者用AI生图三年了，看完说自己完全分辨不出真假。皮肤纹理、光影、微表情，全都对。等会儿……这意味着'有图为证'这件事彻底不成立了？对，这就是我想说的核心问题。当连专业用户都分辨不了真伪的时候，图片作为证据的可信度就崩塌了。那虚假新闻、身份伪造、网络诈骗……这些问题不是要爆炸？已经在爆炸了。现在全球治理深度伪造主要三条路：技术检测、标准制定、法律监管。但说实话，技术迭代速度远超监管步伐，这场矛与盾的博弈短期内看不到终点。哎，说回设计行业吧。我最近跟我们设计团队聊，大家确实焦虑。你觉得设计师真的要失业吗？我先说结论：执行层会被大面积替代，但创意层短期内替代不了。什么算执行层？素材拼贴、基础排版、简单修图——就是那些'古法创作'的活儿。这些AI已经能做到又快又好又便宜了。那品牌策略、用户研究这些呢？麦肯锡去年有个数据，涉及用户研究、品牌战略和跨媒介创意整合的高阶工作，AI替代率不足5%。所以设计师以后的角色是从'执行者'变成'创意指挥者'？让AI出方案，人来挑？对，未来工作流大概率是AI负责快速生成大量方案，人类负责筛选、优化、最终决策。这不就是……设计师变成了AI的产品经理？哈哈哈。得了吧，你们产品经理又来抢功了。哈哈开玩笑。但说真的，我觉得这个模型最让我感慨的不是技术多强，而是它带来的信任危机。当任何人都能一句话生成以假乱真的图片，我们到底该怎么相信自己看到的东西？嗯，这个问题可能比技术本身更值得我们所有人去想。AI图像生成进入了'一句话时代'，但重建视觉信任，可能需要整个社会花很长时间去摸索答案。

实测GPT-Image-2：一句话出图效果炸裂，设计师该何去何从？

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报