生成式 AI ChatGPT 與那些無限打字的猴子,沒有競爭表明 AI 倫理和 AI 法

那些脾氣暴躁的猴子。

有一個非常著名的思想實驗,您可能聽說過涉及猴子的實驗。 那些想要提出特別磨練的觀點的人經常使用完全有趣的發明。

劇情是這樣的。

想像一隻猴子正在打字機上打字。 如果猴子在無限長的時間內不停地打字,並且假設猴子純粹是隨機地打字,那麼很可能莎士比亞的整部作品都將不可避免地被打出來。

其要點似乎是,有時僅靠隨機機會就可以獲得可理解的答案。 我們都傾向於同意莎士比亞的作品是可理解的寫作和推理的巨大展示。 因此,任何產生莎士比亞珍貴文字的事物或任何方式似乎都令人印象深刻,但與此同時,我們會感到非常失望,因為這不是靠智慧本身,而僅僅是偶然的運氣。

現在有些人試圖將這個充滿猴子的比喻與最新的人工智能 (AI) 進行比較。

您可能知道當今最熱門的 AI 形式是 生成式人工智能,這通過 OpenAI 製作的名為 ChatGPT 的廣泛流行的 AI 應用程序來說明。 稍後我將詳細解釋生成式 AI 和 ChatGPT。 現在,只需知道這是一個文本到文本或文本到文章的 AI 應用程序,它可以根據您選擇的輸入提示為您生成一篇文章。

聲稱與傳說中的打字猴有關的聯繫是,據稱由生成式 AI 產生的令人印象深刻的輸出文章似乎完全流利,並不比打字靈長類動物的成就更令人震驚。 如果你接受猴子隨機打字可以生成莎士比亞作品的前提,如果你願意承認 ChatGPT 和其他生成式 AI 表面上是一樣的,那麼你必須得出結論,生成式 AI 根本不是特別值得注意的。 這只是隨機性在愚弄我們。

好吧,這似乎是一個令人信服的案例,但我們需要拆開它。 仔細的拆包將展示兩者之間的比較是 誤導和明顯錯誤.

停止比較。 對於那些堅持要繼續比較的人,請至少以一種謹慎和光明正大的方式進行比較。

那些簡單地進行比較的人正在損害生成人工智能。 而且,更重要的擔憂是,這會誤導公眾和整個社會。 我想我們還可以補充說,他們也在損害勤勞的猴子,或者可能破壞無限打字猴子定理的價值。 平心而論。 善待。 說實話。

在我們深入探討之前,有一個內部笑話利用了打字猴子的概念。 你可能會喜歡它。

憤世嫉俗的幽默常常追溯到互聯網最初全盛時期的個人通信。 那時,隨著使用 Internet 的人數明顯增加,Internet 逐漸擺脫了陰沉嚴肅的在線領域,進入了嘈雜、喧鬧和不守規矩的精神錯亂領域。

幽默的軼事說,如果猴子在打字機上打字最終會產生或我們應該說複製莎士比亞的全部作品,我們現在有證據表明,由於互聯網的出現,這肯定是肯定的 任何監管機構都不批准 是真實的。

你在笑嗎?

一些人認為這是一個非常有趣的言論。

這個笑話是在貶低互聯網及其所有泡沫和噴湧的帖子如何無法上升到生產莎士比亞的水平。 這是一個尖銳的評論,強調互聯網可能沒有提升話語權,而是貶低話語權。 許多人認為互聯網將是智能交互的福音,可以在全球範圍內進行發人深省的討論。 似乎我們並沒有像希望的那樣在大範圍內見證這一點。

當然,如果我們把這個笑話當成互聯網已經發生的事情的真實預兆,那就大錯特錯了。 有許多與互聯網相關的重大發現和值得注意的價值。 這個笑話是一種修飾或誇大。 儘管如此,我們需要警惕陰險和陰暗的內容,同時致力於通過使用互聯網尋找和提升具有社會啟發性的作品,這一點是很好的。 對於我關於人工智能如何既能提供幫助又能在 兩用 時尚通過互聯網上的負面帖子削弱了社會話語權,請參閱我的討論 這裡的鏈接.

在今天的專欄中,我將討論生成式 AI 與打字猴子的經典故事之間的重大差異。 我將解釋比較的不足之處。 毫無疑問,您最終會更多地了解打字猴子定理,同時更具體地了解生成式 AI 的工作原理。 我偶爾會提到 ChatGPT,因為它是生成 AI 的 600 磅重的大猩猩(雙關語),但請記住,還有許多其他生成 AI 應用程序,它們通常基於相同的總體原則。

同時,您可能想知道生成式人工智能究竟是什麼。

讓我們首先介紹生成式 AI 的基礎知識,然後我們可以仔細看看打字猴子定理的比較。

所有這一切都涉及大量人工智能倫理和人工智能法律方面的考慮。

請注意,目前正在努力將道德 AI 原則融入 AI 應用程序的開發和部署中。 越來越多的關注和以前的人工智能倫理學家正在努力確保設計和採用人工智能的努力考慮到做事的觀點 永遠的人工智能 並避免 壞的人工智能. 同樣,有人提出了新的 AI 法律,作為防止 AI 努力在人權等問題上失控的潛在解決方案。 有關我對 AI 倫理和 AI 法律的持續和廣泛報導,請參閱 這裡的鏈接這裡的鏈接,僅舉幾例。

正在製定和頒佈人工智能道德準則,以期防止社會陷入無數人工智能誘導陷阱。 關於我對近 200 個國家通過教科文組織的努力製定和支持的聯合國人工智能倫理原則的報導,請參閱 這裡的鏈接. 同樣,正在探索新的 AI 法律,以試圖讓 AI 保持平穩。 最近的一次拍攝包括一組建議的 人工智能權利法案 美國白宮最近發布的關於人工智能時代人權的報告,見 這裡的鏈接. 讓人工智能和人工智能開發人員走上正確的道路,並阻止可能削弱社會的有目的或無意的不正當行為,需要舉全村之力。

我將把 AI 倫理和 AI 法律相關的考慮因素交織到這個討論中。

生成式人工智能基礎

最廣為人知的生成式 AI 實例由名為 ChatGPT 的 AI 應用程序代表。 ChatGPT 在去年 XNUMX 月由 AI 研究公司 OpenAI 發佈時迅速進入公眾意識。 自從 ChatGPT 獲得了巨大的頭條新聞以來,令人驚訝地超過了其規定的 XNUMX 分鐘的成名時間。

我猜您可能聽說過 ChatGPT,或者甚至認識使用過它的人。

ChatGPT 被認為是一種生成式 AI 應用程序,因為它將用戶的一些文本作為輸入,然後 生成 或產生由一篇文章組成的輸出。 AI 是文本到文本生成器,儘管我將 AI 描述為文本到文章生成器,因為這更容易闡明它的常用用途。 您可以使用生成式 AI 來撰寫冗長的作品,也可以讓它提供相當簡短的精闢評論。 一切聽從您的吩咐。

您需要做的就是輸入一個提示,AI 應用程序會為您生成一篇嘗試回應您的提示的文章。 撰寫的文本看起來就像這篇文章是由人的手和思想寫成的。 如果你輸入“告訴我關於亞伯拉罕·林肯”的提示,生成式人工智能將為你提供一篇關於林肯的文章。 還有其他生成 AI 模式,例如文本到藝術和文本到視頻。 我將在這裡重點關注文本到文本的變化。

您的第一個想法可能是,就撰寫論文而言,這種生成能力似乎沒什麼大不了的。 你可以很容易地在互聯網上進行在線搜索,很容易找到大量關於林肯總統的文章。 生成式 AI 的關鍵在於生成的文章相對獨特,提供原創作品而不是抄襲。 如果你試圖在網上某個地方找到 AI 生成的文章,你不太可能會發現它。

生成式 AI 經過預先訓練,並利用複雜的數學和計算公式,該公式是通過檢查網絡上的書面文字和故事中的模式而建立的。 由於檢查了成千上萬的書面段落,人工智能可以吐出新的文章和故事,這些文章和故事是所發現內容的大雜燴。 通過添加各種概率函數,生成的文本與訓練集中使用的文本相比非常獨特。

人們對生成式 AI 有很多擔憂。

一個關鍵的缺點是,由基於生成的人工智能應用程序生成的文章可能會嵌入各種虛假信息,包括明顯不真實的事實、被誤導性描述的事實以及完全捏造的明顯事實。 這些虛構的方面通常被稱為 人工智能幻覺,一個我不喜歡但遺憾的是似乎越來越流行的標語(關於為什麼這是糟糕和不合適的術語的詳細解釋,請參閱我的報導 這裡的鏈接).

另一個問題是,儘管不是自己撰寫論文,但人類很容易將 AI 生成的論文歸功於他人。 您可能聽說過教師和學校非常關註生成式 AI 應用程序的出現。 學生可以使用生成式 AI 來撰寫他們分配的論文。 如果一個學生聲稱一篇文章是他們自己親手寫的,那麼老師幾乎不可能辨別它是否是由生成人工智能偽造的。 有關我對這個學生和老師混淆方面的分析,請參閱我的報導 這裡的鏈接這裡的鏈接.

社交媒體上出現了一些關於 生成式人工智能 斷言這個最新版本的人工智能實際上是 有感知的人工智能 (不,他們錯了!)。 AI 倫理和 AI 法律領域的人士尤其擔心這種不斷擴大的索賠趨勢。 您可能會禮貌地說,有些人誇大了當今 AI 的實際能力。 他們假設人工智能具有我們尚未能夠實現的能力。 那真不幸。 更糟糕的是,他們可能會允許自己和他人陷入可怕的境地,因為他們假設人工智能在採取行動方面具有感知能力或類似人類。

不要將人工智能擬人化。

這樣做會讓你陷入一個棘手而沉悶的依賴陷阱,即期望 AI 做它無法執行的事情。 話雖如此,最新的生成式 AI 的功能相對令人印象深刻。 請注意,在使用任何生成式 AI 應用程序時,您應該始終牢記一些重大限制。

現在最後一個預警。

無論您在生成式 AI 響應中看到或讀到什麼 似乎 要以純事實(日期、地點、人物等)的形式傳達,請確保保持懷疑並願意仔細檢查您所看到的內容。

是的,日期可以編造,地點可以編造,我們通常期望無可非議的元素是 全部 受到懷疑。 在檢查任何生成的 AI 文章或輸出時,不要相信你讀到的內容並保持懷疑的眼光。 如果一個生成式 AI 應用程序告訴你亞伯拉罕林肯乘坐他的私人飛機在全國各地飛行,你無疑會知道這是胡說八道。 不幸的是,有些人可能沒有意識到噴氣式飛機在他那個時代並不存在,或者他們可能知道但沒有註意到這篇文章提出了這種厚顏無恥的錯誤主張。

在使用生成 AI 時,強烈的健康懷疑和持續的懷疑心態將是你最好的資產。

我們已準備好進入這一闡明的下一階段。

那些打字的猴子怎麼了

既然您已經大致了解了什麼是生成式人工智能,我們就可以探索與打字猴子的比較。 從某種意義上說,我將逐步分解猴子類型定理。 我這樣做是為了闡明基礎。 然後我們可以使用揭示的元素與生成 AI 進行比較。

打字猴定理或假設包含一組核心元素:

  • a) 誰或什麼。 進行打字的已識別生物或演員
  • b) 數量和壽命。 他們有多少人和他們的長壽狀況
  • c) 符號輸出。 通過基本設備生成字母和已知符號
  • d) 時間。 執行任務的時間長度
  • e) 情報。 他們為任務的執行帶來了哪些悟性
  • f) 目標產出。 我們希望他們生產的產品的目標輸出

讓我們首先檢查打字猴子。

你可能還記得我在討論開始時提到過,我們要想像一隻猴子正在打字機上打字。 我將基本概念稱為只需要一隻猴子這樣做。 我們可以調整那個方面。

以下是通常描述情況的方式:

  • 日常生活中的一隻孤獨的猴子
  • 一千隻這樣的猴子
  • 一百萬隻這樣的猴子
  • 無數這樣的猴子
  • 長生不老的孤猴
  • 一些不朽的猴子
  • 等等

請注意,不是只有一隻猴子,我們可能會重新設計思想實驗,讓大量的猴子大概同時工作。 此外,另一個可調整的方面是猴子是凡人還是不朽。 我稍後會進一步深入探討。

我們還需要將時間因素作為一個關鍵因素。

通常,時間因素是以下兩個考慮因素之一:

  • 有限的時間
  • 無限時間

另一個有點不言而喻的潛在因素是,在這種情況下使用猴子是因為我們認為它們相對不思考。 他們不會讀或寫。 他們無法以我們將智力與人類能力相關聯的方式展示智力。

當您稍微考慮一下時,這有點侮辱。 我認為我們都可以合理地同意猴子非常聰明,至少在他們的思維範圍內可以完成的事情。 我敢說,我們認為猴子具有比其他許多動物更強大的思維能力。 已經進行了大量認真的研究實驗來展示猴子的思維敏銳程度。

無論如何,為了這個比喻的目的,假設猴子無法思考到它們可以自行構思莎士比亞作品的程度。 而經典電影 人猿星球 試圖預先警告我們這可能是一個錯誤的假設,無論如何我們在當今世界都會接受它。

如果我們用螞蟻代替猴子,這個比喻就有點消失了。 我們不認為螞蟻能夠在打字機上打字。 我們可以嘗試用狗或貓來代替,因為它們幾乎可以在打字機上打字,但最後,使用猴子是最好的,因為它們可以像人類打字一樣打字。 他們有合適的四肢和身體結構來完成手頭的任務。 他們在心理上也被視為能夠打字,儘管我們假設他們不知道自己在打什麼。

順便說一句,有許多研究實驗涉及猴子及其對符號的識別。 這些不同的研究包括讓猴子在打字機或類似設備上打字的設置。 如果處理得當,這對於尋求關於智力的有用見解和智能行為的產生是有意義的。

遺憾的是,涉及在打字機上打字的研究有時並沒有以特別嚴肅的方式進行。 有時,所使用的方法只不過是對著名或臭名昭著的猴子打字定理的無力眨眼點頭,而不是真正的基礎研究追求。 我覺得這樣的滑稽動作既不有趣也不合適。 一直以來的想法是,給猴子物理上的打字機,並鼓勵他們根據自己的心血來潮或有時為了食物等款待而打字。 除非這是以真正可靠的實驗方式完成的,否則它只不過是一個外觀。

一個更令人愉快的小改動包括設置基於計算機的模擬,旨在執行猴子在這些情況下可能做的事情。 計算機就是用來模擬這些方面的。 沒有真正的猴子參與。 有些人甚至做了一些所謂的 公民科學 通過將模擬分發給任何願意讓他們的筆記本電腦或計算機用於這些工作的人。 不要上當的假騙局陰險地聲稱他們這樣做是為了科學,而實際上他們正試圖用計算機病毒感染您的計算機。 警惕。

回到手頭的事情。

對這種情況也有幫助的一個方面是打字機被用於這個假設的打字猴。

為什麼打字機?

因為這就是我們如何產生字母,然後可以形成文字,然後可以形成故事。 產生大量字母的相同或相似概念並不一定需要我們鍵入它們。 事實上,這個比喻的變體可以追溯到亞里士多德時代,因此當時還沒有打字機。

我們可以改變這個比喻,並參考現代鍵盤和計算機。 我們可以說猴子們正在筆記本電腦甚至智能手機上敲打。 提到打字機的美妙之處在於,我們將打字機視為非計算機化的,因此它們本身不會幫助打字過程。 這對於所涉及的設計至關重要。

最後,我們通常會看到要製作莎士比亞作品的方面。 我們可以很容易地用莎士比亞代替任何其他知名作家。 可能是我們想知道猴子是否能寫出查爾斯·狄更斯、簡·奧斯汀、歐內斯特·海明威等人的全部作品。 這並不特別重要。 本質是寫作必須是我們都知道的東西,並且我們承認是傑出的寫作。

我們可以很容易地替換我們想要設置為目標的任何文字。

提及莎士比亞的便利之處在於,他的作品被認為是人類寫作的最高點或頂峰。 相反,我們可以找到一年級學生寫的一篇文章,並將其作為目標。 信不信由你,同樣的規則仍然適用。 人們可能不會覺得猴子能夠重現兒童的寫作有什麼鼓舞人心的。 為了保持吸引力,寫作必須是最高水準的。

目標輸出的一個變體是指莎士比亞的一部特定作品,而不是他的全部作品。 正如您很快就會看到的,這對問題的核心本質沒有什麼影響。 我想很多人傾向於提到 村莊 作為猴子打字定理的一部分,也許因為這恰好是他最長的劇本,據報導總計 29,551 個單詞(由大約 130,000 個字母組成)。

他的任何劇本都足夠了。

整個發明取決於各種概率定律。 您可能已經在學校上過的那些艱苦的統計和數學課程中了解了概率的細微差別。

讓我們用“哈姆雷特”這個詞來看看在哈姆雷特的特定序列中隨機產生這六個字母需要什麼。

算術計算的最簡單方法包括假設我們有打字機上可用鍵數的簡單整數。 假設我們有一台打字機,它有 50 個不同且同樣可用的鍵。 每個鍵代表一個特定的符號,例如常用英文字母表的符號。 假設按鍵以隨機順序排列,並且我們沒有通過將 Hamlet 單獨的按鍵置於特定排列中來操縱這種情況,以誘導比任何其他按鍵更多地鍵入這些特定按鍵。

每個鍵的按下完全獨立於之前按下的任何鍵。 因此,在 50 個鍵中,任何一個鍵被按下的機會都被認為是 1 分之一的機會。 這同樣適用於所有按鍵以及整個打字過程。 按下單個鍵的計算是 50 分之 1 的機會,即 50/1。

那麼輸入字母“H”的機會是 1/50,輸入字母“a”的機會是 1/50,輸入字母“m”的機會是 1/50,依此類推。

這就是:

  • 打出“H”的概率是 1/50。
  • 輸入“a”的概率是 1/50。
  • 鍵入“m”的概率是 1/50。
  • 輸入“l”的概率是 1/50。
  • 鍵入“e”的概率是 1/50。
  • 輸入“t”的概率是 1/50。

概率的標準規則或定律指出,如果兩個或多個事件在統計上完全相互獨立,我們可以通過簡單地將它們的概率分別乘以彼此來計算它們同時發生的可能性。 對於這六個字母,我們可以這樣做。

我們有這樣的計算:“H”(1/50)x“a”(1/50)x“m”(1/50)x“l”(1/50)x“e”(1/50)x “t”(1/50)

即:(1/50) x (1/50) x (1/50) x (1/50) x (1/50) x (1/50)

這個極小的數字是 1 / 15,625,000,000。

在其他條件相同的情況下,輸入六個字母的單詞“哈姆雷特”的機率大約是 15 億分之一。

這些都是令人生畏的可能性。 而這僅僅是為了輸入一個特定的六個字母的單詞。 嘗試對整個哈姆雷特戲劇的 29,551 個單詞應用同樣的計算。 如果你決定計算這個,也要意識到需要考慮單詞之間的空格。

目標輸出越長,我們就越不可能生成那些精確的字母和單詞集。 勝算越來越小。 機會是如此之小,以至於我們幾乎要認輸並說它似乎“永遠不會”發生(使用“永遠不會”這個詞時要小心,因為這是一個令人生畏的爭論)。

以一隻凡人猴子為例。

根據網上各種權威數據,野外猴子的正常壽命約為40歲左右。 如果您想討論壽命,我們可以只使用數字 100 並繼續使用一個不太可能的上限。 一隻猴子在打字機上不停地打字一百年,還不包括休息時間、吃飯時間等等,假設這就是猴子從出生到最後一口氣所做的一切,它仍然會贏'幫助提高賠率寫作 村莊 總而言之(如果在 100 年內每秒不停地敲擊一個鍵,這隻猴子將按下大約 3,155,673,600 個鍵)。

我們可以合理地說,一隻凡人猴子最終隨機打字的可能性極小 村莊.

你可以增加凡人猴子的數量,但這無助於改變打哈姆雷特的壓倒性可能性。 有人假設有一千隻猴子。 另一種方法說有一百萬隻猴子。 假設他們都活到 100 歲,並且每個人都以每秒一個鍵的不間斷速度在各自的打字機上隨機鍵入一個鍵,這仍然不會在統計上對打字產生顯著影響 村莊.

思考這一切。

有點開玩笑的是,為了完成這項任務,你究竟會將一百萬隻猴子安置在哪裡? 也想像一下打字機必須持續使用一百年(你能找到一百萬台沒有人想要也沒有人願意捐贈給這個以前的項目的工作打字機嗎?)。 看來您需要立即準備好大量備用打字機。 等等。 物流是驚人的。

這一切似乎令人沮喪,因為凡人猴子不太可能繁殖 村莊.

但是假設我們讓它們永生。 是的,我們給他們一些可以讓他們長生不老的魔藥。 我們甚至只需要一隻不朽的猴子。 一個就可以了。 聲稱我們有一千或一百萬隻長生不老的猴子可能會使這個比喻更令人興奮。

如果我們有一隻可以永生的猴子,我們可能會認為這是一隻無限猴子。 它可以無限期地敲擊打字機的按鍵。 那隻猴子會一直走啊走啊。 因此,即使打字的機會 村莊 非常小,猴子將無休止地繼續嘗試的方面暗示了在某個時刻 村莊 幾乎肯定會被打印出來。

經驗法則是,如果我們有無限的時間可以玩,那麼一系列事件發生的可能性非零,儘管可能性非常低,但我們會合理地同意幾乎會發生,其他一切都是平等的。 數學和統計學領域的人傾向於通過使用字符串甚至二進制數 0 和 1 來描述相同的考慮。如果你有一組有限的符號,並且有無限的字符串,其中每個符號都有被隨機均勻地選擇,那裡有一個有限的字符串,你幾乎可以肯定地預期它會發生。

所有這一切都有很大的收穫。

我們生活在一個有限的世界裡。 我們似乎都沒有無限的可用時間。 對於那些說你這樣做的人,榮譽。 我向你致敬。

如果你把有限的世界強加給打字的猴子,你會發現自己撞到了一堵相當硬的牆。 對打字猴子定理的分析將在很大程度上表明實現該遊戲的概率 村莊 在有限的時間內足夠接近於零,因此對於任何合理的操作基礎來說,它根本不可能發生。 通常的描述是,如果你使用了與已知宇宙中的原子一樣多的猴子,並且它們在宇宙的時間跨度中不斷地打字了無數次,你仍然在尋找看到玩 村莊.

打字猴子定理非常有趣,經常被列為我們這個時代的七大思想實驗之一。 歡迎您對該定理做一些額外的審查,因為網上有很多分析。 這是掌握概率和統計的一種生動而愉快的方式。 與其專門處理枯燥的數字,您還可以想像那些喜歡玩樂的猴子和所有那些老式的咔噠咔噠打字機。

我們現在已準備好將生成式 AI 帶入猴子和打字機的難題。

生成式 AI 被打字猴子惹惱了

我們要仔細研究的前提是有爭議的說法,即 ChatGPT 等生成 AI 與打字猴子沒有什麼不同。 據說,如果 ChatGPT 或任何生成式 AI 可以產生 村莊 或類似的已知作品,這完全是一個隨機的結果,可能會以與猴子可能輸入這部久負盛名且深受尊敬的莎士比亞戲劇相同的方式出現。

抱歉,關於這個重要話題的想法是錯誤的。

讓我們看看為什麼。

首先,讓我們回顧並擴展生成式人工智能的組成部分。

回想一下,我之前曾指出,生成式 AI 是一種軟件,它需要使用算法對存在於 Internet 和其他類似來源的文本進行數據訓練。 大量的模式匹配已經在我們人類撰寫的數以百萬計的敘述和文章中以數學和計算的方式識別出模式。

這些詞本身沒有特別的意義。 將它們視為對象。 在計算機中,它們被表示為我們表示為標記的數字。 它們被用作將其他單詞或標記相互關聯的便捷方式,在深入且複雜的統計網絡結構中這樣做。

人工智能領域的一些人擔心這只不過是所謂的 隨機鸚鵡.

你看,這不是試圖將某種“意義”的表象與單詞聯繫起來,而是只是對似乎在其他單詞周圍或旁邊使用的單詞進行廣泛的索引。 相反,我們假設人類可以“理解”詞語的性質和意義。

考慮一下您每天訪問單詞到單詞對應關係的情況。 與您在文字處理軟件中使用常見的自動完成功能類似,計算機會通過數學計算得出一個特定的單詞通常後面跟著另一個特定的單詞,而這個特定的單詞後面又跟著另一個特定的單詞,依此類推。 因此,您通常可以開始寫一個句子,文字處理包會告訴您猜測該句子的附加詞是什麼。

這是一個猜測,因為從統計學上講,這些可能是句子中常用的詞,但您可能還有其他想法要說,因此預測與您想要寫的內容不符。 可能存在足夠多的其他例子,這些句子確實使用了算法能夠估計您可能想要用預測的詞來完成句子的那些詞。 這不是鐵定的。 此外,這種計算猜測沒有任何“意義”。

一些 AI 研究人員認為,要獲得真正的 AI,通常被稱為 通用人工智能 (AGI), 我們需要以某種方式將一種尚未發現或發明的“理解”形式編入計算機(有關 AGI 和追求 AGI 的眾多帖子,請參閱我的專欄)。 他們擔心對生成式 AI 的狂熱只不過是一條死胡同。 我們將繼續努力通過擴大計算網絡的規模並在這個問題上投入越來越多的計算機處理能力來進一步推動生成人工智能。 他們爭辯說,當涉及到 AGI 時,所有這些都將無濟於事。

一個額外的疑慮是,也許這種對假設的死胡同的追求會分散我們的注意力,使我們無法採取正確或適當的行動方針。 我們將花費巨大的精力和努力走向誤入歧途的最終狀態。 當然,生成式 AI 的模仿技巧可能令人驚嘆,但這可能與 AGI 幾乎沒有關係或根本沒有關係。 我們可能會自欺欺人地浪費寶貴的注意力。 由於這種誘人的干擾,我們可能會延遲甚至無法實現 AGI。

無論如何,為了打字猴子的目的,讓我們回到整個爭吵。

我們需要考慮這些值得注意的因素:

  • 1)有知覺與無知覺
  • 2)思考與不“思考”
  • 3) 有限的思維過程與基於計算機的算法和模式匹配
  • 4)未經訓練或無法訓練與訓練有素的計算數據

讓我們來解決這些因素中的每一個。

有知覺與無知覺

我相信我們可以承認猴子是有情眾生。 無論您多麼聰明或缺乏智慧,您都可能希望爭辯他們; 不可否認,他們是有感覺的。 這是事實。 沒有人可以合理地反駁。

今天的人工智能沒有感知力。 期間,句號。

此外,我認為我們離 AI 感知還差得很遠。 其他人當然可能不同意。 但任何有理智的人都會同意今天的人工智能沒有感知能力。 關於我去年對那位谷歌工程師對 AI 感知的嚴重錯誤標記的分析,請參閱我在 這裡的鏈接.

因此,那些急於打字的猴子與當今的生成式人工智能之間的一個關鍵區別在於,猴子是有感知力的生物,而人工智能則不是。 最重要的是,開始將今天的人工智能與任何有感知力的東西進行比較通常是一個滑坡。 有一種將人工智能擬人化的趨勢。 我強烈敦促,為了防止這種簡單的心理陷阱降臨到我們身上,我們避免將人工智能與有情眾生進行任何比較,除非我們光明正大並清楚明確地識別和劃分這種差異。

在比較打字猴子和生成 AI 時,幾乎沒有人做出這樣的區分。 他們假設您要么已經意識到存在這種差異,要么他們不關心存在差異,要么他們沒有考慮過,等等。

思考與不“思考”

我會聲稱猴子可以思考。 他們是有思想的人。 我們可以很容易地討論他們能做多少思考。 幾乎可以肯定,您必須同意猴子可以思考。

今天的各種人工智能,包括生成人工智能,都沒有達到我認為的人類能力 思維.

我會重複我剛才提到的與感知有關的副詞。 這是一種誤導,我認為今天的人工智能可以思考是錯誤的。 可悲的是,人們總是這樣做,包括 AI 研究人員和 AI 開發人員。 我相信這又是一次不幸和不明智的擬人化。 你給人工智能提供了一種不存在的能力或能力的表象,這將在這個問題上誤導整個社會。 停止這樣做。

生成式 AI 是一種複雜的類似網絡的數學和計算屬性結構。 這是令人欽佩的。 這是對這所實現的目標的嘲笑。 我不相信任何對我們所設想的“思考”的合理解釋,在它所有的榮耀中,都適合這個人工智能。

有限的思維過程與基於計算機的算法和模式匹配

猴子的思維過程是有限的。

您可能會感興趣的是,科學文獻中有很多關於猴子大腦與人類大腦的比較。 例如,考慮一下這項研究:“人類的大腦大約是我們現存近親黑猩猩大腦的三倍。 此外,大腦中稱為大腦皮層的部分——它在記憶、注意力、意識和思維方面起著關鍵作用——在人類中包含的細胞數量是黑猩猩同一區域的兩倍。 大腦皮層中的腦細胞網絡在這兩個物種中的行為也不同”(發表於 e生活, 2016 年 XNUMX 月,題為“人類和黑猩猩神經祖細胞在大腦皮層發育過程中的異同”)。

我們都意識到猴子的思維與人類的思維不相上下。 毫無疑問,這些奇妙的生物可能很討人喜歡,並且會進行大量的思考。 他們只是沒有上升到人類思維的水平。 一旦猿類接管人類,我會後悔這麼說。

我剛才已經說過,今天的人工智能不思考。 我強調人工智能正在做的事情不應該被貼上“思考”的標籤,因為這樣做會產生誤導和混淆。

就使用基於人類設計的算法和基於人類創作的作品的計算機處理而言,這就是生成式 AI 確實勝過猴子的地方。 會思考的猴子幾乎沒有機會吸收和模式匹配人類已經想出的大量使用的書面符號。 猴子沒有那種思維能力。

考慮到我表達的其他疑慮,我不願提出這樣的比較。 但是,我清楚地說明了假設是什麼以及如何正確和適當地進行這種分析。

未經訓練或無法訓練與計算數據訓練

與我剛才所說的類似,你無法通過大量使用人類的書面符號來訓練一隻會思考的猴子。 你可以在極其有限的基礎上做到這一點,研究表明猴子似乎可以思考書面符號。 這遠不及能夠記住並重複大量的單詞、句子和整個敘述的模式。

生成式 AI 是一種基於計算機的統計模擬,可以通過計算數據進行訓練。 如果我們繼續提供更多數據,例如我們收集或發現的額外文本,假設和希望是發現的模式會越來越深。 此外,使用越來越快的計算機芯片和處理也將提高這種模式匹配和響應能力。

看底線

如果生成式 AI 來製作這齣戲 村莊,那意味著什麼?

首先,我們必須考慮在數據訓練時故事或戲劇是否被輸入到生成人工智能中。 如果是這樣,那么生成式 AI 稍後吐出它之前掃描過的相同單詞就沒有什麼特別值得注意或值得注意的了。

AI 研究人員可能會有點沮喪,因為模式匹配可能太過分了,基本上已經記住了單詞。 我們通常在機器學習領域將其稱為 過度擬合 訓練期間使用的數據。 通常,您不希望對確切的詞進行模式化,而是希望形成一個概括化的模式。

我在我的專欄中討論了在生成 AI 進行精確匹配而不是對饋送數據進行廣義匹配的情況下,有時我們可能會看到隱私入侵和洩露機密數據的擔憂,請參閱我的報導 這裡的鏈接.

二、假設該劇 村莊 沒有被送入生成人工智能。 接下來的考慮是在數據訓練期間是否掃描了莎士比亞的任何作品。

如果是這樣的話,可以想像這部劇 村莊 可以根據與莎士比亞其他作品相關的模式製作,特別是如果有其他參考或提及 村莊 數據訓練集中的其他地方。 所有這些都可能被模式匹配用於形成一種風格 村莊. 誠然,能夠生成 村莊 逐字逐句將是一個延伸的範圍,一個相當大開眼界和令人驚訝的結果。

第三,如果生成式 AI 產生了全部 村莊 並且之前從未被灌輸過任何關於莎士比亞的東西,好吧,那將是令人驚訝的。 儘管它不一定與啄打打字機按鍵的純粹隨機性質完全相同。 我們必須認識到,莎士比亞的文字就是文字,因此,它們是在輸入生成人工智能的大量文本故事和敘述中發現的全部文字的一部分。 從單詞的基石和單詞之間的關聯開始,您正在提高機率。 不過,發生這種情況的可能性很小。

結論

在造詞造文方面,基於人工造詞造文的生成式人工智能勢頭正猛(當然,我們需要正視錯誤、謊言和人工智能的幻覺)。 人工智能不“理解”發出的詞語。 那裡沒有,那裡。

您不必等待無限長的時間才能看到流暢的論文和完全可讀的輸出。 它們每天都在發生,只需按一下按鈕。 它們不會混亂,至少在大多數情況下不會,因為它們是根據人類編寫的內容生成的模式。 模式匹配應該進一步微調,最終足以精簡許多古怪的措辭,請參閱我對它如何工作的解釋,顯示在 這裡的鏈接. 這種調整將不斷完善,我們都會越來越迷戀生成式 AI 所產生的結果。

這些詞不是純粹隨機選擇的。 這些詞不是純粹隨機拼寫的。 有一些概率方面,例如在生成輸出的文章時選擇哪些詞。 但這仍然是基於人類的著作,因此大概不是純粹隨機的。 它基於在少數或一定數量的措辭選項中隨機選擇,否則這些選項可能在統計上都是可行的,作為下一個選擇的單詞或單詞集。

猴子在哪裡適合這個?

那些打字猴子作為與生成人工智能進行比較的基礎肯定很有吸引力。 猴子生產 村莊 與生成式 AI 生產 村莊. 這是一場精彩紛呈的比賽。 您可能會說根本沒有真正涉及比賽。 由人類設計並基於人類著作的人工智能在這方面具有不公平的優勢。

說到打字猴子,在 辛普森, 伯恩斯先生決定僱用猴子繼續在打字機上打字,作為辦公室打字池的一部分。 他是那種脾氣暴躁的老闆,如果可以的話,他會興高采烈地傾向於在他需要的辦公室工作中使用猴子而不是使用人類。

節目的粉絲可能還記得發生了什麼。

伯恩斯先生抓起其中一張打字紙,滿懷期待地閱讀猴子打字的內容。 他大聲朗讀頁面並說:“這是最好的時代,這是 模糊 of times”(即,有一個詞被弄亂了,“blurst”或類似的詞)。 他對那些“愚蠢的猴子”能生產什麼感到非常憤怒和失望。

我們知道,如果一隻猴子打出查爾斯·狄更斯的《兩城記》的那一部分,我們應該欣喜若狂,高興得跳起來。 伯恩斯先生並非如此。

作為對本次討論的最後評論,也許我們應該引用查爾斯狄更斯所寫的完整句子:“這是最好的時代,這是最壞的時代,這是智慧的時代,這是愚蠢的時代,它那是信仰的時代,那是懷疑的時代,那是光明的季節,那是黑暗的季節,那是希望的春天,那是絕望的冬天。”

我們不太確定人工智能的發展方向。 有人說這將是自切片麵包以來最好的東西。 其他人則預先警告說,我們正在製造的人工智能將對人類的生存構成生存風險。 這確實是最好的時代或最壞的時代。

看到生成式 AI 輸出這些詞不要感到驚訝。 如果您碰巧在動物園裡看到猴子在打字機上打字並設法打出同樣有見地的單詞,一定會感到驚訝。

如果您看到這種情況,請務必告訴我。

我願意等待很長時間才能發生這種情況,但可能不會無限期發生。

來源:https://www.forbes.com/sites/lanceeliot/2023/03/05/generative-ai-chatgpt-versus-those-infinite-typing-monkeys-no-contest-says-ai-ethics-and-艾法律/