就在前段时间,各大厂商还在疯狂内卷大模型的文字能力。没想到,这股风很快就吹到了图像领域。
Grok 3 刚上线图片编辑功能,谷歌的 Imagen 蠢蠢欲动,OpenAI 则直接放出了深度图片编辑功能,效果炸裂。
就连山姆·奥特曼都忍不住发文:“很开心大家喜欢我们新的图像功能,现在GPU都快烧起来了,所以我们得限流了。”
看来大家对这个功能非常满意。
显然,这项新功能,已经彻底点燃了用户的想象力。那么问题来了:我们普通人、打工人,能怎么用好这个强大的工具?
一、商业场景
试用下来,我最大的感受是:GPT-4o 对商业领域的冲击绝对不小。每月20美元,你就能请到一个全天在线的“万能设计师”。他可以完成海报设计,Logo设计,室内设计等等。你想的到的你想不到的他都能做。
只要你能说清楚你要什么,它就能给你图。像我这样直接让它“重新设计一个抖音 logo”,也完全可以:
或者为一个品牌设计广告图,比如麦当劳,几秒钟搞定:
连室内设计都能整出来,随便一个 prompt,它就能搭出你梦想中的房间:
我认为这个使用在电商环境下也挺不错的,在做网页设计的时候,你完全不用再请一个昂贵的设计师或者外包。因为GPT-4o可以根据你想要的,完美生成。
二、教育场景
当老师、写博客、做课件,最大的问题之一是什么?没图可用。想做个精致点的图文说明,要么动手画、要么花钱找人。现在,GPT-4o能帮你全包了。
比如做一份图文并茂的菜谱:
又或者帮你做给小朋友看的洗手儿歌海报
这边还是稍微要吐槽一下,GPT-4o对于复杂的中文文字还不是处理的很完美。
再比如你还可以用它,帮你创作简单的教学示意图,为你的课堂添加一些趣味。
三、动漫设计
大家都说,艺术行业是最后一个被AI淘汰的,但是我没想到,这场冲击波已经波及到了艺术行业。
并且昨天他们还放出来,还能对图中指定区域进行修改
因为,像GPT这种自回归的模型带有记忆,它还可以帮您连续创作。
你以为,他就这一种创作画风吗?那当然是不可能的,它有Ghibi,还有卡通,像素,水墨,日式,涂鸦,复古等等
四、个人使用场景
除了严肃的商业和教育用途,GPT-4o 也适合用来玩梗、DIY、修图等个人用途。
它还可以为你制作一些梗图,还是蛮有意思蛮有想法的
还可以把你自己手绘草图的灵感变成“真图”。
甚至它还可以帮你P图,这是多么的恐怖。
我认为,GPT-4o的能力不仅限于以上场景。它还可以为你做更多的事情。你可以尝试开发出来适合你自己的使用场景。
如果不想每天,都被那三张的限制你无限的遐想。可以充值他们的Plus会员,个人认为还是蛮值得的。
GPT-5真的要来了?
在我们还沉浸在 GPT-4o 的图像生成能力时,一个更值得关注的细节被一些用户发现了:GPT-4o 现在能显示推理时间和思维链过程了。
早在上个月,Sam Altman 就提到 OpenAI 正在计划统一 GPT 系列与 o 系列模型,目标是构建一个可以自动判断任务类型的智能系统,不需要用户手动切换。
有用户晒出自己在 2024 年底使用 GPT-4o 的截图,当时就已经有了推理过程展示。这可能说明——
GPT-4o 的推理能力,其实已经默默测试了 6 个月以上。
在社交平台上,不少用户开始分享类似的发现:
有人表示:现在 GPT-4o 的推理看起来比去年更长更复杂。