ChatGPT終于有圖片功能了:會(huì)畫畫、會(huì)識(shí)圖
大半夜的, OpenAI 又整出了個(gè)勁爆消息:
DALL·E 3 來(lái)了!不僅來(lái)了,還會(huì)被整合到 ChatGPT 里。
也就是說(shuō),除了老生常談的對(duì)話、寫代碼、解數(shù)學(xué)題外,整合了最新 DALL·E 3 的 ChatGPT 這次終于有圖片功能了。
ChatGPT+DALL·E ,這波算是強(qiáng)強(qiáng)聯(lián)合,一個(gè)是語(yǔ)言大模型里的無(wú)冕之王,另外一個(gè)也算是文生圖模型里的佼佼者,真正的效果也必然會(huì) 1+1>2 。
這次突然官宣算是填了今年年初 GPT-4 剛出來(lái)后,被傳的紛紛揚(yáng)揚(yáng)的多模態(tài) ChatGPT 的大坑。
不過(guò),現(xiàn)在 OpenAI 還只是公布了這個(gè)消息,具體的上線時(shí)間是 10 月。面向 Plus 和企業(yè)版用戶,單獨(dú)的 DALL·E 3 今年秋天也會(huì)上線。
這玩意具體有多厲害,雖然現(xiàn)在我們還不能上手,但從 OpenAI 公開的示例來(lái)看,還是相當(dāng)炸裂的。
其中,就有熱心網(wǎng)友直接打來(lái)了 Midjourney ,把 DALL·E 3 的示例提示詞喂給了它,好直接斗圖一比高下。
而結(jié)果只能說(shuō):Midjourney 危了。
首先是很經(jīng)典的牛油果看病梗圖,提示詞:一個(gè)牛油果坐在治療師的椅子上,說(shuō)著 “ 我感到內(nèi)心如此空虛 ” ,牛油果中間有一個(gè)小坑大小的洞。治療師,勺子,涂鴉筆記。
雖然乍一看是各有千秋,兩種不同的風(fēng)格。但若再仔細(xì)對(duì)照下提示詞,很顯然 Midjourney 忽視了治療師,勺子,涂鴉筆記這幾個(gè)元素,對(duì)話框里的文字也是亂寫一通,不按照要求來(lái)。
然后讓他們生成一張關(guān)于半透明心臟的圖片,并且要求在心臟下面刻上一行特定的名言。
提示詞:這是一幅用半透明的玻璃制成的人類心臟的插圖,它矗立在狂風(fēng)暴雨的海洋中的一個(gè)基座上。陽(yáng)光穿透云層照亮了心靈,揭示了內(nèi)在的微小宇宙。 “ 發(fā)現(xiàn)你內(nèi)心的宇宙 ” 這句名言被用粗體字刻在基座上。
毫無(wú)疑問(wèn),這次 DALL·E 3 再次吊打了 Midjourney , Midjourney 除了沒(méi)按照要求刻字外,像狂風(fēng)暴雨的海洋、內(nèi)在的微小宇宙等細(xì)節(jié)是一點(diǎn)也沒(méi)展現(xiàn)。
再來(lái)一張以荔枝為靈感的球形椅子的照片,細(xì)節(jié)上,要求有白色凹凸不平的外觀,柔軟的內(nèi)飾,與背后的熱帶壁紙形成對(duì)比。
這把它們倆生成的圖片里各個(gè)元素都齊活了,但 Midjourney 似乎還是誤解了熱帶壁紙和熱帶雨林的區(qū)別。
當(dāng)然,誤解提示詞、斷章取義這些都相當(dāng)于是之前文生圖模型的頑疾了。
像什么寄居蟹就給生成一個(gè)螃蟹。。。
讓它生成 2D 的擬人化森林樂(lè)隊(duì)結(jié)果生成 3D 的。。。
而這些老毛病,照 OpenAI 自己的說(shuō)法以及給出的示例來(lái)看,新的 DALL·E 3 基本上不存在這種情況。
除了解決掉老毛病之外, DALL·E 3 還在原來(lái)二代版本上也進(jìn)行了質(zhì)感上的升級(jí)。
就比如讓它們畫籃球運(yùn)動(dòng)員扣籃的場(chǎng)景,元素是星空爆炸。
本來(lái) DALL·E 2 生成的圖已經(jīng)很符合要求了,沒(méi)想到升級(jí)后的 DALL·E 3 更加逼真,肌肉線條、宇宙的色彩這些細(xì)節(jié)都一一展示出來(lái),屬實(shí)是降維打擊。
左:DALL·E 2 ,右:DALL·E 3
總體看下來(lái), DALL·E 3 在 ChatGPT 的加持下,語(yǔ)言理解能力直接拉滿,簡(jiǎn)直是要贏麻了的節(jié)奏。
升級(jí)版的 ChatGPT 不僅不會(huì)丟失關(guān)鍵信息點(diǎn),就算只是零零星星打了幾個(gè)關(guān)鍵詞,它也能幫你自動(dòng)補(bǔ)全描述,然后再讓 DALL·E 3 生成圖片。
OpenAI 這是拿捏住了當(dāng)代網(wǎng)友 “ 文化沙漠 ” 的本質(zhì)了( 狗頭 )。
當(dāng)然 DALL·E 3 和 ChatGPT 的整合,不止是更能聽懂人話那么簡(jiǎn)單,它們還會(huì)產(chǎn)生一些奇妙的火花。
就比如升級(jí)版的 ChatGPT 在畫畫上也有了上下文理解能力,甚至可以直接當(dāng)做生產(chǎn)力工具。
具體有多厲害, OpenAI 官網(wǎng)給出了一段演示視頻,說(shuō)實(shí)話,世超在看了后,也是為插畫師的飯碗狠狠地捏了一把汗。
首先是讓 ChatGPT 生成一個(gè)超級(jí)向日葵刺猬,它會(huì)給出四張圖,從里面選一張最喜歡的之后,可以進(jìn)行下一步的對(duì)話。

然后把這個(gè)刺猬命名成 Larry ,可以再讓 ChatGPT 多生成幾張它的照片。

接下來(lái)上點(diǎn)難度,直接搞個(gè)場(chǎng)景,讓它展示一下 Larry 的家。
這把可以直接看出 DALL·E 3+ChatGPT 的實(shí)力了,不僅 Larry 的樣貌還保持原樣( 這換其他 AI 可能早變樣了 ),而且門口的郵箱還寫著 “LARRY” 的名字。

此外,描述 Larry 的特點(diǎn)、用圖片展示它的愛(ài)心、甚至做做 Larry 的周邊,設(shè)計(jì)出幾個(gè)貼紙,對(duì)于 ChatGPT 來(lái)說(shuō)都是灑灑水的事。

最后讓它整理個(gè)睡前故事,來(lái)個(gè) ending pose , ChatGPT 也是信手拈來(lái), u1s1 我真的有點(diǎn)被這絲滑的對(duì)話震撼到。。。

看到這里,世超還突然得了新的靈感,之后我們寫好的文章豈不是就可以直接丟給 ChatGPT ,讓它提取關(guān)鍵詞做封面。
有啥特殊要求也可以直接告訴 ChatGPT ,參考圖啥的也可以扔給它,摸魚技巧 +1+1 。。。
言歸正傳,上面提到的那些還只是 OpenAI 單方面展示出來(lái)的效果,實(shí)際用起來(lái)怎么樣,還是得等到 10 月份上線之后才能知道,估計(jì)到時(shí)候有會(huì)有一波隱藏技巧被網(wǎng)友們開發(fā)出來(lái),坐等。
另外,談到 AI 繪畫,就還是躲不過(guò)那個(gè)老生常談的話題:版權(quán)問(wèn)題。
OpenAI 這邊依舊還是之前的立場(chǎng),和第二版一樣,用 DALL·E 3 生成的圖片不需要經(jīng)過(guò)許可就能用,想商業(yè)化都行。
不過(guò),有了太多的前車之鑒, OpenAI 這次耍了點(diǎn)小聰明,說(shuō)是藝術(shù)家可以選擇拒絕自己的作品被投喂給 DALL·E ,前提是只要填一個(gè)表格就 OK 了。
雖然這多少有點(diǎn) “ 不拒絕就是默許 ” 的意味,但相較于之前,起碼藝術(shù)家們不再那么被動(dòng)了。。。
對(duì)于之前網(wǎng)絡(luò)出現(xiàn)的 AI 繪畫侵犯公眾人物隱私,以及一些其他偏見的問(wèn)題, DALL·E 也有對(duì)策了:在實(shí)際使用的過(guò)程中, ChatGPT 會(huì)直接拒絕提示中帶有公眾人物名字的請(qǐng)求。
也就是,像這種樂(lè)子圖我們估計(jì)也不會(huì)在 ChatGPT 中看到了。。。
并且他們還組建了一個(gè) “ 紅色團(tuán)隊(duì) ” ,用來(lái)評(píng)估和降低模型在各個(gè)階段可能會(huì)產(chǎn)生的風(fēng)險(xiǎn)。
最后, OpenAI 還在官網(wǎng)上表示說(shuō),它們?cè)谘芯恳粋€(gè)識(shí)別 AI 畫圖的工具,能夠判斷哪些圖片是 DALL·E 3 生成的。
( 只希望不要像之前那個(gè)識(shí)別 AI 文本的工具,因?yàn)殡u肋半路夭折。。。
總的來(lái)說(shuō),有文生圖功能的 ChatGPT 就已經(jīng)足夠在 AI 圈子里掀起一陣熱度,而這波又是整合的升級(jí)版 DALL·E 3 ,很難不讓人振奮,反正世超已經(jīng)是等不及想上手試試了。
但有人歡喜有人憂, OpenAI 這波是再次甩了同行一大截,等到 10 月更新之后,估計(jì)又有不少 AI 初創(chuàng)公司被碾壓在 ChatGPT 前進(jìn)的車輪下。。。
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com













