ChatGPT V4 在酒吧、SAT 中名列前茅,並且可以識別 ETH 合約中的漏洞利用

GPT-4 是人工智能 (AI) 聊天機器人 ChatGPT 的最新版本,可以通過高中考試和法學院考試,分數排名在第 90 個百分位,並具有以前版本無法實現的新處理能力。

其創建者 OpenAI 於 4 月 14 日分享了 GPT-XNUMX 測試分數的數據,表明除了更有創意和可靠地處理“更細微的指令”之外,它還可以將圖像、音頻和視頻輸入轉換為文本。

OpenAI 補充說:“它通過了模擬律師考試,得分在應試者的前 10% 左右。” “相比之下,GPT-3.5 的得分在倒數 10% 左右。”

數據顯示,GPT-4 在 LSAT 考試中取得了 163% 的 88 分——這是美國大學生進入法學院需要通過的考試。

最近一系列美國考試的 GPT-4 和 GPT-3.5 考試成績。 來源: OpenAI

GPT4 的分數將使其處於進入前 20 名法學院的有利位置,並且僅比哈佛、斯坦福、普林斯頓或耶魯等名校錄取所需的報告分數低幾分。

先前版本的 ChatGPT 在 LSAT 中僅獲得 149 分,處於倒數 40%。

GPT-4 在統一律師考試中也獲得了 298 分(總分 400 分)——這是一項由最近畢業的法學院學生參加的考試,允許他們在美國任何司法管轄區擔任律師。

UBE 分數需要被承認才能在美國每個司法管轄區執業。 來源: 全國律師考官會議

舊版本的 ChatGPT 在這次測試中表現不佳,在滿分 10 分中以 213 分的成績排在倒數 400%。

在美國高中生為衡量大學準備程度而參加的 SAT 循證閱讀與寫作和 SAT 數學考試中,GPT-4 得分分別排在第 93 和第 89 個百分位。

GPT-4 在“硬”科學方面也表現出色,在 AP 生物學 (85-100%)、化學 (71-88%) 和物理 2 (66-84%) 方面的得分遠高於平均百分位數。

最近一系列美國考試的 GPT-4 和 GPT-3.5 考試成績。 資料來源:OpenAI。

然而,它的 AP 微積分分數相當平均,排名在 43r 到 59% 之間。

GPT-4 缺乏的另一個領域是英語文學考試,在兩個單獨的測試中得分在 8% 到 44% 之間。

OpenAI 表示,GPT-4 和 GPT-3.5 從 2022-2023 年的實踐考試中進行了這些測試,並且語言處理工具“沒有接受特定培訓”:

“我們沒有針對這些考試進行專門培訓。 模型在訓練過程中看到了考試中的一小部分問題,但我們認為結果具有代表性。”

結果也引發了 Twitter 社區的恐慌。

相關新聞: ChatGPT 將如何影響 Web3 空間? 行業解答

Nick Almond,FactoryDAO 創始人 告訴 他在 14,300 月 14 日的 4 名 Twitter 關注者表示,GPTXNUMX 將“嚇唬人”,它將“崩潰”全球教育體系。

Coinbase 前主管 Conor Grogan 表示,他在 GPT-4 中插入了一個實時的以太坊智能合約,並立即指出了幾個“安全漏洞”,並概述瞭如何利用這些代碼:

早期對 ChatGPT 的智能合約審計發現,其第一個版本也能夠在合理的程度上發現代碼錯誤。

人工智能時事通訊“The Rundown”的創始人 Rowan Cheung 分享了一段 GPT 將紙上手繪的虛假網站轉錄成代碼的視頻。