OpenAI的CEO奥特曼上周末发了条推特:“changed my pfp(刚改了我的头像照片)……”,当时寻思多大点事儿啊?但还是手贱点了一下OpenAI官方发布:Introducing 4o Image Generation——ChatGPT4o原生多模态生图。

仔细研究了下,好家伙,挺厉害啊!

PART 01

多模态生图到底牛在哪

简单来说,GPT-4o这次生图功能的更新,简直是把‘君子动口不动手’的理想之曙光照进了现实。这么说吧, 以前P图靠手艺,现在P图靠心意!

你只需要优雅地表达你的需求,剩下的,交给AI为你挥毫泼墨,自会给你安排得明明白白,而且往往超出你的预期!

狠狠降低了使用门槛,而产出图片的下限却大大提高了:

♦ 对于你连说带比划(多轮次图文混合)的要求,理解能力提升巨大;

♦ 图片的AI感明显淡了,实物图片的质感和逼真度好了很多;

♦ 多轮次的修改优化,主图内容非常稳定,秒杀Midjourney,也不用像SD那样学习调参或者设计工作流。

PART 02

举例说明,来看一看

OpenAI官方说,GPT-4o“利用原生多模态模型,生成实用、高质量的图像,效果精确、准确、逼真”。接下来,我们举三个例子,看看是不是真的跨境实用

案例一

 机械产品的“抠图”与“反抠图”

抠图不难,但怎么把一个机械产品或零件从TA所在的工厂环境里体面又美观地抠出来,也没有那么容易啊!小编找了一张纺织机械图试了一下:

十几秒出图等待中。。。。。。

说实话,效果有点出乎我的意料,除了保留线缆细节,AI还给补了顶部没能拍进照片的细节!

那么,把已经抠出来的产品图放到合适的实景中呢?

十几秒出图等待中。。。。。。

在抠完产品图后和实景工厂生产场景完美融合!

案例二

 找不到 Banner 图的聚酯树脂

我们上一期的 B2B 独立站课程里,有学员来自聚酯树脂原材料的出海企业,产品是那种“类似玻璃碴的白色透明物体”“你说这玩意儿,怎么拍成 Banner 图才合适呢?”课堂上我们没有找到满意的图片,我用 40试了试:

方案1:极简美学+应用场景结合——左侧实物颗粒的高质感图,右侧使用浅浅透明蒙版,叠加终端应用图。

方案2:科技质感合成图——实物颗粒蓝色光影,加上全球地图线条、分子结构图谱等点缀。

而且,两版Banner图,AI都有贴心留出添加Slogan文字的位置哦!

案例三

 三图合成

我让GTP把第一张不太清晰的产品原图,放到第二张工作时的效果demo里,再整体搬到第三张场景图。

十几秒出图等待中。。。。。。

三图合成的效果比消费品领域测试差距明显。这表明GPT-4o对工业B2B场景的复杂理解还不够精准,还需要更多轮调试优化才能商用。但即便如此,GPT-4o已将“生图下限”大幅拉高,跨境人绝不能连这个门槛也够不着。

总结:

最后简单再叨叨两句:

01

AI带来的降本增效,就两件事:一是替你干掉80%的重复劳动,二是让原本很专业的活,小白按个手册也能做。

02

GPT-4o生图能力上限在哪,还不好说;但下限确实提高了很多,咱们做跨境的,不能连这下限都够不着。

03

至于那些原本非专业的朋友,小编建议就别花力气折腾SD、ComfyUI这些复杂工具了,先把GPT-4o玩熟,立刻就能用上才最重要。

Tell me what you need