GPT-4 是人工智能 (AI) 聊天機器人 ChatGPT 的最新版本,可以通過高中考試和法學院考試,分數排名在第 90 個百分位,並具有以前版本無法實現的新處理能力。
其創建者 OpenAI 於 4 月 14 日分享了 GPT-XNUMX 測試分數的數據,表明除了更有創意和可靠地處理“更細微的指令”之外,它還可以將圖像、音頻和視頻輸入轉換為文本。
OpenAI 補充說:“它通過了模擬律師考試,得分在應試者的前 10% 左右。” “相比之下,GPT-3.5 的得分在倒數 10% 左右。”
數據顯示,GPT-4 在 LSAT 考試中取得了 163% 的 88 分——這是美國大學生進入法學院需要通過的考試。
GPT4 的分數將使其處於進入前 20 名法學院的有利位置,並且僅比哈佛、斯坦福、普林斯頓或耶魯等名校錄取所需的報告分數低幾分。
先前版本的 ChatGPT 在 LSAT 中僅獲得 149 分,處於倒數 40%。
GPT-4 在統一律師考試中也獲得了 298 分(總分 400 分)——這是一項由最近畢業的法學院學生參加的考試,允許他們在美國任何司法管轄區擔任律師。
舊版本的 ChatGPT 在這次測試中表現不佳,在滿分 10 分中以 213 分的成績排在倒數 400%。
在美國高中生為衡量大學準備程度而參加的 SAT 循證閱讀與寫作和 SAT 數學考試中,GPT-4 得分分別排在第 93 和第 89 個百分位。
GPT-4 在“硬”科學方面也表現出色,在 AP 生物學 (85-100%)、化學 (71-88%) 和物理 2 (66-84%) 方面的得分遠高於平均百分位數。
然而,它的 AP 微積分分數相當平均,排名在 43r 到 59% 之間。
GPT-4 缺乏的另一個領域是英語文學考試,在兩個單獨的測試中得分在 8% 到 44% 之間。
OpenAI 表示,GPT-4 和 GPT-3.5 從 2022-2023 年的實踐考試中進行了這些測試,並且語言處理工具“沒有接受特定培訓”:
“我們沒有針對這些考試進行專門培訓。 模型在訓練過程中看到了考試中的一小部分問題,但我們認為結果具有代表性。”
結果也引發了 Twitter 社區的恐慌。
相關新聞: ChatGPT 將如何影響 Web3 空間? 行業解答
Nick Almond,FactoryDAO 創始人 告訴 他在 14,300 月 14 日的 4 名 Twitter 關注者表示,GPTXNUMX 將“嚇唬人”,它將“崩潰”全球教育體系。
多年來,評估理論一直是我生活的重要組成部分。 許多年前,我一直在談論這一天。 當時我真的聽起來像是常駐的怪人。
但是……這真的意味著從這一點開始除了監考之外的任何事情都結束了。
— drnick ️² (@DrNickA) 2023 年 3 月 14 日
Coinbase 前主管 Conor Grogan 表示,他在 GPT-4 中插入了一個實時的以太坊智能合約,並立即指出了幾個“安全漏洞”,並概述瞭如何利用這些代碼:
我將一份實時以太坊合約轉儲到 GPT-4 中。
瞬間,它突出了一些安全漏洞,並指出了可以利用合約的表面區域。 然後它驗證了我可以利用合同的特定方式 pic.twitter.com/its5puakUW
— 康納 (@jconorgrogan) 2023 年 3 月 14 日
早期對 ChatGPT 的智能合約審計發現,其第一個版本也能夠在合理的程度上發現代碼錯誤。
人工智能時事通訊“The Rundown”的創始人 Rowan Cheung 分享了一段 GPT 將紙上手繪的虛假網站轉錄成代碼的視頻。
我剛剛看到 GPT-4 將手繪草圖變成了一個功能性網站。
瘋了吧。 pic.twitter.com/P5nSjrk7Wn
——張羅文 (@rowancheung) 2023 年 3 月 14 日
資料來源:https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts