李博!你最近朋友圈发的那张图,是你自己做的还是AI生的?我真没看出来。
哈哈哈你说那张?GPT-Image-2生成的,一句话出的图。
等等,一句话?就那个看起来像专业摄影棚拍的人像?
对,就一句中文描述,连提示词工程都不用了。我跟你说,这个模型是真的把门槛打到地板了。
你得给我好好讲讲。我记得之前用Midjourney的时候,光写提示词就得写一大段英文,什么masterpiece冒号1.5,负面提示词一堆,调参数调到头秃。
没错,以前那套东西本质上是你在帮模型做翻译——把你脑子里的画面翻译成它能理解的指令语言。但GPT-Image-2不一样,它底层架构直接融合了大语言模型的语义理解能力。
你就像跟人说话一样,说'帮我做个马斯克和库克对比的海报',它自己就知道该怎么构图、怎么配色、怎么排版。
这不就是我们产品经理天天喊的'降低用户认知负担'嘛!终于有人把这事做到位了。
你们产品经理就知道用户体验,哈哈。但这次确实是体验层面的质变,不是量变。
行行行,那审美呢?我之前用AI出图最大的痛点就是——能用,但丑。配色辣眼睛,排版一言难尽。
这个点特别值得说。有人测试让它生成日系穿搭手册,就一句提示词,出来的东西——配色、留白、字体选择、视觉层次,全都是专业设计师水准。
真的假的?日系穿搭手册那种很讲究调性的东西?
真的。你想想,如果传统方式做同样质量的图,设计师得找素材、贴图、修细节、排版,没几百块钱下不来。现在一句话,一分钟,成本约等于零。
我作为一个经常跟设计团队协作的人,听到这个数字是真的有点慌。那它审美好的原因是什么?训练数据?
大概率是OpenAI在训练数据里塞了大量专业策展过的设计作品和摄影作品,再加上RLHF——就是让人类反馈来教模型什么是'好看'。
而且它是多模态架构,文字和视觉在同一个表征空间里处理,所以能自动遵循三分法构图、互补色搭配这些设计原则。
懂了懂了,相当于它不只是学会了画画,还学会了设计思维。
但最让我不安的不是设计类图片,是真人人像。
怎么说?
有测试者生成了一个女生的照片,还有她'被采访的综艺片段'截图。那个测试者用AI生图三年了,看完说自己完全分辨不出真假。皮肤纹理、光影、微表情,全都对。
等会儿……这意味着'有图为证'这件事彻底不成立了?
对,这就是我想说的核心问题。当连专业用户都分辨不了真伪的时候,图片作为证据的可信度就崩塌了。
那虚假新闻、身份伪造、网络诈骗……这些问题不是要爆炸?
已经在爆炸了。现在全球治理深度伪造主要三条路:技术检测、标准制定、法律监管。但说实话,技术迭代速度远超监管步伐,这场矛与盾的博弈短期内看不到终点。
哎,说回设计行业吧。我最近跟我们设计团队聊,大家确实焦虑。你觉得设计师真的要失业吗?
我先说结论:执行层会被大面积替代,但创意层短期内替代不了。
什么算执行层?
素材拼贴、基础排版、简单修图——就是那些'古法创作'的活儿。这些AI已经能做到又快又好又便宜了。
那品牌策略、用户研究这些呢?
麦肯锡去年有个数据,涉及用户研究、品牌战略和跨媒介创意整合的高阶工作,AI替代率不足5%。
所以设计师以后的角色是从'执行者'变成'创意指挥者'?让AI出方案,人来挑?
对,未来工作流大概率是AI负责快速生成大量方案,人类负责筛选、优化、最终决策。
这不就是……设计师变成了AI的产品经理?哈哈哈。
得了吧,你们产品经理又来抢功了。
哈哈开玩笑。但说真的,我觉得这个模型最让我感慨的不是技术多强,而是它带来的信任危机。当任何人都能一句话生成以假乱真的图片,我们到底该怎么相信自己看到的东西?
嗯,这个问题可能比技术本身更值得我们所有人去想。AI图像生成进入了'一句话时代',但重建视觉信任,可能需要整个社会花很长时间去摸索答案。