ChatGPT V4 在酒吧、SAT 中名列前茅，並且可以識別 ETH 合約中的漏洞利用

GPT-4 是人工智能 (AI) 聊天機器人 ChatGPT 的最新版本，可以通過高中考試和法學院考試，分數排名在第 90 個百分位，並具有以前版本無法實現的新處理能力。

其創建者 OpenAI 於 4 月 14 日分享了 GPT-XNUMX 測試分數的數據，表明除了更有創意和可靠地處理“更細微的指令”之外，它還可以將圖像、音頻和視頻輸入轉換為文本。

OpenAI 補充說：“它通過了模擬律師考試，得分在應試者的前 10% 左右。” “相比之下，GPT-3.5 的得分在倒數 10% 左右。”

數據顯示，GPT-4 在 LSAT 考試中取得了 163% 的 88 分——這是美國大學生進入法學院需要通過的考試。

GPT4 的分數將使其處於進入前 20 名法學院的有利位置，並且僅比哈佛、斯坦福、普林斯頓或耶魯等名校錄取所需的報告分數低幾分。

先前版本的 ChatGPT 在 LSAT 中僅獲得 149 分，處於倒數 40%。

GPT-4 在統一律師考試中也獲得了 298 分（總分 400 分）——這是一項由最近畢業的法學院學生參加的考試，允許他們在美國任何司法管轄區擔任律師。

舊版本的 ChatGPT 在這次測試中表現不佳，在滿分 10 分中以 213 分的成績排在倒數 400%。

在美國高中生為衡量大學準備程度而參加的 SAT 循證閱讀與寫作和 SAT 數學考試中，GPT-4 得分分別排在第 93 和第 89 個百分位。

GPT-4 在“硬”科學方面也表現出色，在 AP 生物學 (85-100%)、化學 (71-88%) 和物理 2 (66-84%) 方面的得分遠高於平均百分位數。

然而，它的 AP 微積分分數相當平均，排名在 43r 到 59% 之間。

GPT-4 缺乏的另一個領域是英語文學考試，在兩個單獨的測試中得分在 8% 到 44% 之間。

OpenAI 表示，GPT-4 和 GPT-3.5 從 2022-2023 年的實踐考試中進行了這些測試，並且語言處理工具“沒有接受特定培訓”：

“我們沒有針對這些考試進行專門培訓。模型在訓練過程中看到了考試中的一小部分問題，但我們認為結果具有代表性。”

結果也引發了 Twitter 社區的恐慌。

相關新聞： ChatGPT 將如何影響 Web3 空間？行業解答

Nick Almond，FactoryDAO 創始人告訴他在 14,300 月 14 日的 4 名 Twitter 關注者表示，GPTXNUMX 將“嚇唬人”，它將“崩潰”全球教育體系。

多年來，評估理論一直是我生活的重要組成部分。許多年前，我一直在談論這一天。當時我真的聽起來像是常駐的怪人。
但是……這真的意味著從這一點開始除了監考之外的任何事情都結束了。
— drnick ️² (@DrNickA) 2023 年 3 月 14 日

Coinbase 前主管 Conor Grogan 表示，他在 GPT-4 中插入了一個實時的以太坊智能合約，並立即指出了幾個“安全漏洞”，並概述瞭如何利用這些代碼：

我將一份實時以太坊合約轉儲到 GPT-4 中。
瞬間，它突出了一些安全漏洞，並指出了可以利用合約的表面區域。然後它驗證了我可以利用合同的特定方式 pic.twitter.com/its5puakUW
— 康納 (@jconorgrogan) 2023 年 3 月 14 日

早期對 ChatGPT 的智能合約審計發現，其第一個版本也能夠在合理的程度上發現代碼錯誤。

人工智能時事通訊“The Rundown”的創始人 Rowan Cheung 分享了一段 GPT 將紙上手繪的虛假網站轉錄成代碼的視頻。

我剛剛看到 GPT-4 將手繪草圖變成了一個功能性網站。
瘋了吧。 pic.twitter.com/P5nSjrk7Wn
——張羅文 (@rowancheung) 2023 年 3 月 14 日