ChatGPT終于有圖片功能了：會(huì)畫畫、會(huì)識(shí)圖

來(lái)源：差評(píng) 編輯：非小米時(shí)間：2023-09-25 07:21人閱讀

大半夜的， OpenAI 又整出了個(gè)勁爆消息：

DALL·E 3 來(lái)了！不僅來(lái)了，還會(huì)被整合到 ChatGPT 里。

也就是說(shuō)，除了老生常談的對(duì)話、寫代碼、解數(shù)學(xué)題外，整合了最新 DALL·E 3 的 ChatGPT 這次終于有圖片功能了。

ChatGPT+DALL·E ，這波算是強(qiáng)強(qiáng)聯(lián)合，一個(gè)是語(yǔ)言大模型里的無(wú)冕之王，另外一個(gè)也算是文生圖模型里的佼佼者，真正的效果也必然會(huì) 1+1>2 。

這次突然官宣算是填了今年年初 GPT-4 剛出來(lái)后，被傳的紛紛揚(yáng)揚(yáng)的多模態(tài) ChatGPT 的大坑。

不過(guò)，現(xiàn)在 OpenAI 還只是公布了這個(gè)消息，具體的上線時(shí)間是 10 月。面向 Plus 和企業(yè)版用戶，單獨(dú)的 DALL·E 3 今年秋天也會(huì)上線。

這玩意具體有多厲害，雖然現(xiàn)在我們還不能上手，但從 OpenAI 公開的示例來(lái)看，還是相當(dāng)炸裂的。

其中，就有熱心網(wǎng)友直接打來(lái)了 Midjourney ，把 DALL·E 3 的示例提示詞喂給了它，好直接斗圖一比高下。

而結(jié)果只能說(shuō)：Midjourney 危了。

首先是很經(jīng)典的牛油果看病梗圖，提示詞：一個(gè)牛油果坐在治療師的椅子上，說(shuō)著 “ 我感到內(nèi)心如此空虛 ” ，牛油果中間有一個(gè)小坑大小的洞。治療師，勺子，涂鴉筆記。

雖然乍一看是各有千秋，兩種不同的風(fēng)格。但若再仔細(xì)對(duì)照下提示詞，很顯然 Midjourney 忽視了治療師，勺子，涂鴉筆記這幾個(gè)元素，對(duì)話框里的文字也是亂寫一通，不按照要求來(lái)。

然后讓他們生成一張關(guān)于半透明心臟的圖片，并且要求在心臟下面刻上一行特定的名言。

提示詞：這是一幅用半透明的玻璃制成的人類心臟的插圖，它矗立在狂風(fēng)暴雨的海洋中的一個(gè)基座上。陽(yáng)光穿透云層照亮了心靈，揭示了內(nèi)在的微小宇宙。 “ 發(fā)現(xiàn)你內(nèi)心的宇宙 ” 這句名言被用粗體字刻在基座上。

毫無(wú)疑問(wèn)，這次 DALL·E 3 再次吊打了 Midjourney ， Midjourney 除了沒(méi)按照要求刻字外，像狂風(fēng)暴雨的海洋、內(nèi)在的微小宇宙等細(xì)節(jié)是一點(diǎn)也沒(méi)展現(xiàn)。

再來(lái)一張以荔枝為靈感的球形椅子的照片，細(xì)節(jié)上，要求有白色凹凸不平的外觀，柔軟的內(nèi)飾，與背后的熱帶壁紙形成對(duì)比。

這把它們倆生成的圖片里各個(gè)元素都齊活了，但 Midjourney 似乎還是誤解了熱帶壁紙和熱帶雨林的區(qū)別。

當(dāng)然，誤解提示詞、斷章取義這些都相當(dāng)于是之前文生圖模型的頑疾了。

像什么寄居蟹就給生成一個(gè)螃蟹。。。

讓它生成 2D 的擬人化森林樂(lè)隊(duì)結(jié)果生成 3D 的。。。

而這些老毛病，照 OpenAI 自己的說(shuō)法以及給出的示例來(lái)看，新的 DALL·E 3 基本上不存在這種情況。

除了解決掉老毛病之外， DALL·E 3 還在原來(lái)二代版本上也進(jìn)行了質(zhì)感上的升級(jí)。

就比如讓它們畫籃球運(yùn)動(dòng)員扣籃的場(chǎng)景，元素是星空爆炸。

本來(lái) DALL·E 2 生成的圖已經(jīng)很符合要求了，沒(méi)想到升級(jí)后的 DALL·E 3 更加逼真，肌肉線條、宇宙的色彩這些細(xì)節(jié)都一一展示出來(lái)，屬實(shí)是降維打擊。

左：DALL·E 2 ，右：DALL·E 3

總體看下來(lái)， DALL·E 3 在 ChatGPT 的加持下，語(yǔ)言理解能力直接拉滿，簡(jiǎn)直是要贏麻了的節(jié)奏。

升級(jí)版的 ChatGPT 不僅不會(huì)丟失關(guān)鍵信息點(diǎn)，就算只是零零星星打了幾個(gè)關(guān)鍵詞，它也能幫你自動(dòng)補(bǔ)全描述，然后再讓 DALL·E 3 生成圖片。

OpenAI 這是拿捏住了當(dāng)代網(wǎng)友 “ 文化沙漠 ” 的本質(zhì)了（狗頭）。

當(dāng)然 DALL·E 3 和 ChatGPT 的整合，不止是更能聽懂人話那么簡(jiǎn)單，它們還會(huì)產(chǎn)生一些奇妙的火花。

就比如升級(jí)版的 ChatGPT 在畫畫上也有了上下文理解能力，甚至可以直接當(dāng)做生產(chǎn)力工具。

具體有多厲害， OpenAI 官網(wǎng)給出了一段演示視頻，說(shuō)實(shí)話，世超在看了后，也是為插畫師的飯碗狠狠地捏了一把汗。

首先是讓 ChatGPT 生成一個(gè)超級(jí)向日葵刺猬，它會(huì)給出四張圖，從里面選一張最喜歡的之后，可以進(jìn)行下一步的對(duì)話。