会画画、会识图的ChatGPT终于要来了

2024-06-28 27

可以绘制和识别图像的ChatGPT终于来了

半夜,OpenAI又宣布了一个重磅消息:

达尔·E3来了!它不仅来了,而且还将集成到ChatGPT中。

也就是说,除了平时的对话、写代码、解数学题之外,集成了最新DALL·E3的ChatGPT这次终于有了图像功能。

聊GPTDALL·E,一个是大舌头模型中的无冕之王,一个也是文森特图模型中的佼佼者。真正的效果必然是11>2。

这一突然的官方声明应该会填补今年早些时候GPT-4发布后备受关注的多模式ChatGPT的一个大漏洞。

不过,OpenAI现在才公布这一消息,具体上线时间是10月份。今年秋季还将为Plus版和企业版用户推出单独的DALL·E3。

这东西威力有多大?虽然我们还不能开始,但从OpenAI发布的例子来看,它仍然具有相当的爆炸性。

其中,有热心网友直接给中途打电话,喂他DALL·E3的模范快话,让他们直接比赛。

结果只能是:中途有危险。

第一个是一个非常经典的医疗提示:一个牛油果坐在治疗师的椅子上说:“牛油果中间有一个小骨头大小的洞。”治疗师,勺子,涂鸦笔记。

虽然乍一看似乎是两种不同的风格。但如果你仔细比较提示,很明显,中途忽略了治疗师、勺子和涂鸦笔记。而且对话框中的文字是随意书写的,不符合要求。

然后,他们被要求创作一幅透明的心形图片,并要求在心形下方刻上某句话。

提示:这是一幅透明玻璃人心站在波涛汹涌的海洋中的基座上的插图。阳光穿透云层,照亮心灵,揭示出内心的微小宇宙。底部用粗体字写着“发现自己内心的宇宙”。

毫无疑问,这一次DALL·E3再次击败了中途。《中途》除了没有按要求雕刻文字外,也没有展示波涛汹涌的海洋、内部微观世界等细节。

这是另一张以荔枝为灵感的球形椅子的照片,其细节要求白色凹凸不平的外观和柔软的内部与后面的热带壁纸形成鲜明对比。

这让他们创作的图像中的所有元素都变得栩栩如生,但中途似乎并不理解热带壁纸和热带雨林之间的区别。

当然,误解快语、断章取义,就相当于之前文森佐图模型的痼疾。

只需创建一只像寄居蟹一样的螃蟹即可。。。

如果我们要求它创建一个2D拟人化森林带,我们会得到3D。。。

至于这些老问题,根据OpenAI自己的说法和给出的例子,这种情况在新的DALL·E3中基本不存在。

除了解决老问题外,DALL·E3还对原二代版本的纹理进行了升级。

比如让他们画一个篮球运动员运球的场景,让元素是星空中的爆炸。

本来,DALL·E2创建的镜像已经满足要求了。没想到升级后的DALL·E3更加真实,肌肉线条、空间色彩等细节相继展现。这确实是一次裁员打击。

左:DALL·E2,右:DALL·E3

一般来说,有了ChatGPT的支持,直接达到理解DALL·E3语言的能力,几乎不可能获胜。

升级版的ChatGPT不仅不会丢失关键信息,而且即使你只是到处输入几个关键词,它也能帮你自动完成描述,然后让DALL·E3创建镜像。

OpenAI抓住了现代互联网用户“文化沙漠”的本质(狗头)。

当然,DALL·E3和ChatGPT的集成不仅仅是能够更好地理解人类语音那么简单,它们也会擦出一些美丽的火花。

例如,ChatGPT的升级版还具有绘图的上下文感知功能,甚至可以直接用作生产力工具。

为了看看它有多强大,OpenAI官方网站提供了一个演示视频。说实话,世超看完之后,对自己当插画师的想法有些担心。

首先,让ChatGPT创建一个超级向日葵刺猬。选择您最喜欢的一个后,您可以继续进行下一步的对话。

然后将刺猬命名为Larry,并让ChatGPT为他再创建几张照片。

接下来,让我们增加难度并创建一个显示拉里家的场景。

这个可以直接展现DALL·E3ChatGPT的强大,不仅仅是Larry的外表,还有它保持不变(这可能与其他人工智能有所不同),门边的信箱上仍然写着“LARRY”的名字。

另外,ChatGPT可以轻松描述Larry的特征,用图片表达他的爱,甚至制作Larry的外围设备并设计一些贴纸。

最后,让他整理你的睡前故事,ChatGPT的最终姿势也触手可及。这丝丝柔滑的对话着实让我震惊。。。

看到这一幕,世超突然有了新的灵感。然后他能够将我们写的文章直接发送到ChatGPT并让它提取封面的关键字。

如果您有任何特殊要求,可以直接告诉ChatGPT。。。

言归正传,上述效果只是OpenAI片面展示的,到时候上线才知道。

此外,说到AI绘画,还有一个绕不开的共同话题:版权问题。

OpenAI仍然保持之前的立场。与第二个版本一样,用DALL·E3创建的图像可以在未经许可的情况下使用,并且可以商业化。

但吸取了过去的教训,OpenAI这次聪明了一点,表示艺术家可以通过填写表格选择不向DALL·E提交作品。

虽然这多少有些“不拒绝就是同意”的意思,但至少艺术家不再像以前那么被动了。。。

DALL·E对于过去网络上出现的AI画作侵犯公众人物隐私等带有偏见的问题也有对策:在实际使用中,ChatGPT会直接拒绝提示中带有公众人物姓名的请求。。

换句话说,我们很可能不会在ChatGPT中看到这样有趣的图片。。。

他们还组建了一个“红队”来评估和减轻模型在各个阶段可能出现的风险。

最后,OpenAI还在其官网上表示,他们正在开发一款AI绘图识别工具,可以找出DALL·E3创作的图片。

(只是希望不要像之前的AI文字识别工具一样因为没用而半途而废……

总体而言,拥有Vincenzo图功能的ChatGPT足以在AI圈引起一波热潮,而这一波又是DALL·E3的集成升级版,很难不让人兴奋。不要等到考虑它。

但有人高兴,有人担心。10月更新之后,估计很多AI公司都会被碾压在ChatGPT的车轮下。。。

本站文章均由用户上传或转载而来,该文章内容本站无法检测是否存在侵权,如果本文存在侵权,请联系邮箱:2287318951@qq.com告知,本站在7天内对其进行处理。

相关推荐