Midjourney 創始人 David Holz 談人工智能對藝術、想像力和創意經濟的影響

中途 是使用人工智能 (AI) 從文本提示創建視覺圖像的新興技術的主要驅動力之一。 這家總部位於舊金山的初創公司最近成為了在科羅拉多州公平競賽中獲獎的藝術品背後的引擎,這不太可能是未來幾年人工智能藝術將面臨的最後一個複雜問題。

Midjourney 通過強調其產生的圖像中的繪畫美學來與空間中的其他人區分開來。 該平台並沒有嘗試創建可能被誤認為照片的逼真圖像,首席執行官大衛霍爾茲表示,他個人對深度偽造和其他過於接近模擬現實的工作的不可思議的質量感到非常不安。 相反,Holz 說 Midjourney 旨在通過描述普通人來製作精美圖片的工具來釋放他們的創造力。

但是,儘管公司以人文主義、以消費者為導向的關注點,對商業藝術和專業藝術家的影響不可避免地存在問題。 我採訪了霍爾茲 關於人工智能藝術可能在圖像製作中造成的潛在破壞的更廣泛的文章 用於娛樂、視頻遊戲和出版。 這是我們談話的較長節選,Holz 在解決這些問題時提供了更多的深度和背景,並闡述了他對公司、行業和技術的願景。 為了長度和清晰度,對採訪進行了編輯。

Rob Salkowitz,福布斯撰稿人:你的角色和頭銜是什麼?

大衛·霍爾茨,《中途》。 我是創始人兼CEO。 不過,我通常更喜歡被稱為創始人,因為 CEO 聽起來很商務,而我們不是很商務。 我們是一家生產產品的應用研究實驗室。

Midjourney的使命是什麼?

我們喜歡說我們正在努力擴展人類的想像力。 目標是讓人類更有想像力,而不是製造有想像力的機器,我認為這是一個重要的區別。

您能簡要介紹一下公司迄今為止的歷史嗎?

大約一年半前,我們開始研究公司的想像力部分。 在擴散模型、人們理解clip、openAI之類的東西上有一些突破。 幾乎所有參與其中的人都是舊金山,我們都意識到這會變得很嚴重,這與許多其他事情不同。

Midjourney 認為這種文本到圖像技術對企業和社會的好處是什麼?

我肯定比商業更關心社會。 我們是消費產品,但目前我們的用戶中可能有 30%-50% 是專業人士。 大多數不是。 平台上的藝術家告訴我們,它讓他們在開始時更具創造性和探索性,在很短的時間內提出很多想法。

目前,我們的專業用戶正在使用該平台進行構思。 [商業藝術項目] 最困難的部分通常是在開始時,當利益相關者不知道他們想要什麼並且必須看到一些想法才能做出反應時。 Midjourney 可以幫助人們更快地集中在他們想要的想法上,因為迭代這些概念非常費力。

藝術家的另一個優勢是它讓人們對他們不自信的領域充滿信心。大多數(如果不是所有)藝術家都覺得藝術的某些部分他們做得不好。 它可能是顏色、構圖、背景。 我們有一位著名的角色設計師在使用我們的產品,人們問他為什麼要使用人工智能,因為你已經很厲害了。 他說,“好吧,我只擅長角色部分。 這有助於我處理其他方面、世界、背景和配色方案。”

大約有多少人在使用該產品?

數百萬人正在使用它。 我們的 Discord 超過 XNUMX 萬。 它是迄今為止最大的活躍 Discord 服務器。

Midjourney 的許可是否允許將平台生成的圖像用於商業用途?

是的。 但是,如果您為年收入超過 XNUMX 萬美元的公司工作,我們要求您購買公司許可證。

數據集是如何構建的?

這只是互聯網的一大塊。 我們使用在這些數據集上發布和訓練的開放數據集。 我會說這是 100% 的人都會做的事情。 我們並不挑剔。 就您真正需要多少數據以及模型的質量而言,科學正在迅速發展。 真正解決問題需要幾年的時間,到那時,您可能會擁有幾乎什麼都沒有訓練的模型。 沒有人真正知道他們能做什麼。

您是否徵求了在世藝術家的同意或仍受版權保護的作品?

不,沒有辦法獲得一億張圖像並知道它們來自哪裡。 如果圖像中嵌入了有關版權所有者或其他內容的元數據,那就太酷了。 但這不是一回事。 沒有註冊表。 沒有辦法在 Internet 上找到一張圖片,然後自動將其追踪到所有者,然後有任何方法對其進行驗證。

藝術家可以選擇不包含在您的數據訓練模型中嗎?

我們正在研究那個。 現在的挑戰是找出規則是什麼,以及如何確定一個人是否真的是某件作品的藝術家,或者只是把他們的名字寫在上面。 我們還沒有遇到任何人希望將他們的名字從數據集中取出。

藝術家可以選擇不在提示中命名嗎?

不是現在。 我們正在研究那個。 同樣,我們必須找到一種方法來驗證這些請求,這可能會變得很複雜。

您對擔心這會破壞他們生計的商業藝術家有什麼看法? 在某個時刻,為什麼藝術總監會聘請插畫師來製作概念藝術、產品設計、背景之類的作品,而他們只需輸入提示並以更低的成本更快地獲得有用的輸出?

仍然有很多工作要做。 這不僅僅是“讓我成為背景”。 工作量可能會少十倍,但比經理要做的工作量要多得多。

我認為這可能有兩種方式。 一種方法是嘗試以更低的價格提供人們消費的相同水平的內容,對嗎? 另一種解決方法是以我們已經願意花費的價格構建更好的內容。 我發現大多數人,如果他們已經在花錢,並且你可以在更好的內容或更便宜的內容之間進行選擇,實際上會選擇更好的內容。 市場已經確定了人們願意支付的價格。

我認為有些人會試圖將藝術家排除在外。 他們會嘗試以更低的成本製造類似的東西,我認為他們會在市場上失敗。 我認為市場將走向更高質量、更有創造力、更複雜、更多樣化和更深入的內容。 真正能夠像藝術家一樣使用並使用工具來做到這一點的人將會獲勝。

這些技術實際上在視覺媒體中創造了更深層次的欣賞和素養。 你可能真的有需求,超過了那個水平的製作能力,然後也許你實際上會提高藝術家的薪水。 這可能很奇怪,但這就是即將發生的事情。 對質量和多樣性的需求增長的步伐將導致一些精彩和意想不到的項目得以完成。

一代學生畢業於藝術學校,其中許多人負債累累,依靠娛樂製作、視頻遊戲製作、商業藝術等方面收入相對較高的工作。 AI文字轉圖像平台的出現如何影響他們的未來?

我認為有些人會嘗試削減成本,有些人會嘗試擴大野心。 我認為那些擴大野心的人仍然會支付同樣的薪水,而那些試圖削減成本的人,我認為會失敗。

人工智能通常被大規模用於呼叫中心或機場托運行李等工作,以及人們並不真正關心的工作。 其價值主張是,它讓人們有更多的時間去做更有價值、更有趣的工作。 但是藝術工作是有益的和有趣的。 人們一生都在工作,並發展他們的技能來獲得這些工作。 你為什麼要在那個經濟水平上將這項技術作為一種業務重點和你正在做的事情的優先事項?

就個人而言,我不是。 我的東西不是為專業藝術家製作的。 如果他們喜歡使用它,那就太好了。 我的東西是為這樣的人設計的我現在是銀行家。 我過著良好的銀行家生活。 但現在有了 Midjourney,我實際上開始體驗成為我真正想成為的人的體驗。” 或者在卡車停靠站的某個人正在製作自己的帶有狂野圖像的棒球卡,只是為了好玩。 它是為那些人製作的,因為和大多數人一樣,他們永遠不會做這些事情。

重要的是要強調這與藝術無關。 這是關於想像力的。 想像力有時被用於藝術,但通常不是。 在 Midjourney 上創建的大多數圖像都沒有被專業使用。 他們甚至沒有被分享。 它們只是被用於這些其他目的,這些非常人性化的需求。

然而,您的產品的輸出是圖像,除了所有其他屬性之外,它在專業環境中具有商業價值。 這對經濟非常具有破壞性。

我認為這就像我們在造一艘船,有人可以和這艘船賽跑,但這並不意味著這艘船就是為了賽跑。 如果您使用船比賽,那麼可能會喜歡,是的,當然。 就在那一刻。 但人性的一面真的很重要,我認為我們不是……我們想讓照片看起來很漂亮。 我們不認為自己試圖將藝術作為我們事物的一部分。 我們希望世界變得更加富有想像力。 我們寧願做漂亮的東西也不願做醜陋的東西。

您認為任何政府機構都有管轄權或權力來規範這項技術嗎? 如果是這樣,您認為他們應該這樣做嗎?

我不知道。 監管很有趣。 你必須在做某事的自由與受保護的自由之間取得平衡。 技術本身不是問題。 就像水一樣。 水可能很危險,你可能會淹死在裡面。 但這也是必不可少的。 我們不想為了避免危險的部分而禁止水。

好吧,我們確實想確保我們的水是乾淨的。

是的,這是真的。

資料來源:https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-創意經濟/