生成式 AI ChatGPT 會刺激學生在撰寫論文時大量作弊的擔憂激怒了人們對 AI 倫理和 AI 法的關注

現代學生的作文是不是已經一去不復返了?

充滿焦慮的學生學期論文是否正在狂熱地飛出窗外?

就是最近鬧得沸沸揚揚的騷動。 你看,一款名為 ChatGPT 的 AI 應用程序的出現引起了很多關注,同樣也引起了極大的憤怒。 有關我對 ChatGPT 的全面介紹,請參閱 這裡的鏈接. 有關我對 AI 倫理和 AI 法律的持續和廣泛報導,請參閱 這裡的鏈接這裡的鏈接,僅舉幾例。

大喊大叫的要點是這種人工智能,通常被稱為 生成AI, 將是要求學生做論文式作業的喪鐘。

為什麼這樣?

因為最新的生成式人工智能只需輸入一個簡單的提示就能寫出看似流暢的文章。 如果你輸入諸如“告訴我關於亞伯拉罕·林肯”這樣的一行,人工智能將生成一篇關於林肯生平和時代的文章,這篇文章往往足夠好,以至於被誤認為完全是人類親手寫的。 此外,這才是真正的關鍵,這篇文章不會是關於同一主題的其他文章的重複或引人注目的副本。 就任何不經意的檢查而言,所生成的論文基本上是“原創的”。

面臨寫作任務的學生只需調用這些生成式 AI 應用程序之一,輸入提示,瞧,他們的整篇文章都是為他們寫的。 他們只需要將自動生成的文本剪切並粘貼到一個空文檔中,偷偷地把他們的名字和班級信息貼在上面,然後帶著一點相當勇敢的虛張聲勢繼續把它作為他們自己的作品上交。

老師能夠查出這篇文章是由 AI 而不是學生寫的機會幾乎為零。

可恥!

頭條新聞匆忙宣布我們已經到了讓學生寫論文或基本上做任何類型的課外寫作作業的痛苦結局。 應對這種情況的唯一方法似乎是利用課堂論文寫作。 當學生處於教室等受控環境中,並假設他們無法使用筆記本電腦或智能手機時,他們會發現自己僅限於以老式方式撰寫論文。

需要澄清的是,老式的方式意味著他們將只能通過使用自己的腦袋來寫作。

在課堂外完成的任何類型的論文都會立即受到懷疑。 這篇文章是學生寫的還是 AI 應用程序寫的? 如前所述,這篇文章將寫得非常好,以至於您無法輕易發現它是由機器撰寫的。 拼寫將是無可挑剔的。 語法將是巨大的。 談話的路線和潛在的指導論點將是引人注目的。

哎呀,從某種意義上說,你可以建議生成式 AI 會通過撰寫一篇超出選擇走這條邪惡道路的學生的能力的文章來打破它眾所周知的手。 老師可能會因為這篇文章有點太好了而產生懷疑。 一個精明的老師會忍不住猜測學生不可能寫出如此優雅和密不透風的散文。 內部警鐘開始響起。

當然,對學生的論文提出質疑將是醜陋的,並且會產生不良後果。

假設學生自己認真地寫了這篇文章。 他們可能對其進行了雙重和三次檢查。 也有可能他們讓朋友或熟人看看是否有任何需要額外拋光的地方。 總而言之,還是他們寫的文章。 想像一下,一位老師向這位認真好學的學生提出有關論文的尖銳問題。 基本上被指控作弊的尷尬和懊惱是顯而易見的,即使老師沒有大聲提出這樣的要求。 僅僅是對抗本身就足以削弱學生的自尊心,讓他們感到被誣衊。

有些人堅持認為,任何懷疑文章作者身份的老師都應該要求學生解釋他們所寫的內容。 據推測,如果這篇文章是由學生寫的,那麼特定的學生可以充分解釋它。 老師們已經進行了億萬年的這種探究。 一個學生可能已經召集另一個學生為他們寫論文。 學生可能已經讓父母寫了他們的論文。 在當今世界,學生可能會花錢請互聯網上的人代為秘密撰寫論文。

因此,要求學生通過課堂詢問來驗證作者身份是一種習慣,沒什麼大不了的。

很高興你提出來。

試圖溫和地或明顯地盤問學生並不像你想像的那麼簡單。 學生本可以仔細研究人工智能生成的文章,並為可能的審訊做好準備。

這樣想。 學生首先只需按一下按鈕即可生成論文。 然後,學生會花費大量時間來寫論文,而不是仔細檢查和研究論文。 過了一會兒,這些話幾乎完全記在了記憶裡。 學生幾乎自欺欺人地相信他們確實寫了這篇文章。 這種表面上的自信和意識很容易讓他們通過教師主導的審查。

啊哈,有些人說與生成人工智能應用程序的恐懼有點相反,請注意學生實際上確實通過生成論文“學習”了一些東西。 當然,學生沒有跑腿去研究這個話題,他們也沒有寫論文,但是,如果他們仔細研究了這篇文章,似乎表明他們已經了解了指定的話題。 致力於背誦有關林肯的文章的學生大概已經了解了有關林肯的一些實質內容。

學習已經發生。

哇,反駁說,這項任務可能是一個雙重過程。 了解林肯可能相對次要。 真正的目的是讓學生學會寫作。 作業的這一重要部分已被完全削弱。 老師們經常佈置開放式的話題,實際上只是為了讓學生體驗寫作。 你必須列出你想寫的內容,你必須弄清楚你將使用的詞,你必須將這些詞放入一組合理的句子和段落中,等等。 僅僅閱讀 AI 生成的論文與論文作業的基礎方面完全不相符。

對此的反擊是聲稱學生可能通過仔細檢查人工智能產生的寫作來學習寫作。 難道我們不都研究寫作大師,看看他們是如何寫作的嗎? 我們的寫作是為了接觸莎士比亞和其他偉大作家。 研究書面文字是獲得如何寫作的有效手段。

就像一場激烈的網球比賽,球移到了網的另一邊。 雖然學習好的寫作很好,但如果你想寫作,你最終必須寫作。 你不能只是無休止地閱讀,然後茫然地假設學生現在會寫了。 他們必須寫,寫,一直寫,直到他們能夠切實展示和提高他們的寫作能力。

你明白這是一個怎樣的難題嗎?

請注意,所有這些都有無數或更多的曲折。

我將介紹一些更巧妙、更有趣的曲折。

通過 AI 提示調整論文

剛才提到了莎士比亞,這裡是生成式 AI 的一個方面,您可能會感到驚訝。 在許多生成式人工智能應用程序中,你可以這樣說:“寫一篇關於林肯的文章,就像莎士比亞寫的那樣。” 人工智能將嘗試生成一篇似乎是用莎士比亞在其作品中慣用的語言寫成的文章。 這是一個非常有趣和引人入勝的壯舉,許多人從中受益匪淺。

這與使用生成式 AI 寫論文“作弊”的學生有什麼關係?

在許多生成式 AI 應用程序中,您可以告訴 AI 以不那麼出色的方式編寫。 人工智能將設法寫出一篇邊緣有些粗糙的文章。 這里或那裡存在語法問題。 文章的邏輯可能會斷斷續續或略顯雜亂無章。

這將是一個聰明的詭計。 學生拿到作文並上交。作文好到可以拿高分,但又不能完美到惹老師生氣的地步。 再一次,人工智能為學生完成了所有的跑腿工作,包括讓這篇文章有些不完美。

最重要的是,大多數生成式 AI 應用程序都允許您隨心所欲地使用該應用程序。 這是如何發揮作用的。 一名學生輸入 AI 應用程序是為了寫一篇關於林肯的文章,有些不完美。 論文產生了。 學生看著這篇文章,發現它仍然過於完美。 學生輸入另一個提示,指示 AI 使缺陷更加明顯。

泡沫,沖洗,重複。

學生不斷輸入提示並檢查生成的論文。 這種情況一遍又一遍地發生。 最終,學生讓人工智能在文章中達到恰到好處的不完美程度。 金發姑娘版本已經獲得。 它完美到足以獲得高分,又不完美到足以避免引起懷疑。

我敢肯定你們中的一些人會狡猾地說,如果學生一開始就選擇寫那該死的論文,他們可能會花更少的時間或至少花同樣多的時間來寫論文本身。 AI 應用程序的所有這些消耗能量的使用本可以直接用於繼續撰寫論文。

好吧,請記住,學生並沒有想到這一點。 輸入提示以及反複檢查和選擇所需論文的簡便性必然會讓學生更容易做到。 這樣做一個小時比直接寫論文要輕鬆得多。 在這種情況下,必須權衡現實情況。

如果其他學生也這樣做會怎樣

我敢打賭,當您閱讀前面關於論文和生成式 AI 應用程序的分析時,您已經想到了這個聰明的想法,即如果很多其他學生都在做同樣的事情,那麼這個學生無疑會被抓到。

請允許我解釋一下。

一位老師讓全班同學寫一篇關於林肯的文章。 假設 90% 的學生決定使用生成式 AI 應用程序來完成這項作業。 如果 90% 看起來過於壓抑,請繼續使用 10%。 請記住,隨著學生對生成式 AI 應用程序的實用性有所了解,使用它們的誘惑將會如雨後春筍般湧現。

好吧,班上有相當一部分人使用了生成式 AI 應用程序。 你會假設學生們都將提交大致相同的林肯論文。 當老師給第三篇或第四篇作文打分時,他們會注意到這些作文幾乎都是一樣的。 這將是一個巨大的線索,表明有什麼不對勁。

對不起,但你不太可能那麼幸運。

大多數生成式 AI 應用程序對提示的具體組成方式高度敏感。 如果我寫“告訴我關於林肯的事”與如果我寫“告訴我關於林肯的生活”,很可能這些文章會有本質上的不同。 首先,也許 AI 生成的文章重點介紹了林肯總統在白宮任職期間的情況,而忽略了他童年的任何內容。 另一個提示可能會產生一篇涵蓋他出生到死亡的文章。

學生可能不會準確輸入老師給他們的作文提示。 作為作弊者,嘗試變體似乎是明智的。 但是,即使所有學生都輸入了完全相同的提示,每篇文章也很有可能與其他文章有所不同。

這些 AI 應用程序利用了一個龐大的內部製作的數學和計算網絡,該網絡基本上與互聯網上的文本進行了廣泛的模式匹配。 生成論文的過程中包含一個概率因素。 所選擇的詞不太可能具有相同的順序和相同的確切措辭。 生成的每篇論文通常都會有所不同。

不過有一個問題。 如果選擇的主題非常晦澀,則可能會產生一些相似的論文。 這部分是因為文本根部的模式一開始就很薄。 話雖這麼說,論文的寫作方式可能仍然大不相同。 我要說的是,內容本身的本質可能大致相同。

不想顯得悶悶不樂,但您可能會對像林肯的生平這樣的共同話題做出同樣的聲明。 您可以用多少種不同的方式詳細說明他生活的各個方面? 如果你以某種方式讓學生在一個鎖著的教室裡寫關於林肯的文章,並讓他們在線訪問以研究他的生活,我敢說這些文章有些相似的可能性無論如何都會發生。

灑脫的因素很重要

如果現在的學生想通過在 Internet 上付錢給別人寫論文來作弊,這樣做非常簡單(我希望這不會讓您感到震驚,也許我應該事先提供觸發警告)。

但問題是您確實需要為論文付費。 此外,您以後可能會被抓住的可能性很小。 你用信用卡支付論文費用嗎? 也許最好使用某種形式的地下支付處理來嘗試保持你的踪跡清晰。

生成式 AI 的美妙之處或者也許是令人惱火的因素在於,現在大多數都是免費提供的。 無需付款。 沒有關於您使用情況的特定跟踪記錄(好吧,需要明確的是,AI 應用程序可能會跟踪您的使用情況,尤其是因為許多 AI 應用程序要求您使用電子郵件地址註冊,當然,您也可以偽造該地址).

有些人自然而然地認為您需要成為 AI 嚮導才能使用生成式 AI 應用程序。

不是這樣。

總的來說,生成式 AI 應用程序使用起來非常簡單。 您調用 AI 應用程序。 它會向您顯示一個打開的文本框,供您輸入提示。 您輸入提示並點擊提交。 AI 應用程序生成文本。

就是這樣。

不需要專門的計算機語言。 不了解數據庫或數據科學。 我向您保證,幾乎所有學校的孩子都可以輕鬆使用生成式 AI 應用程序。 如果孩子可以打字,他們就可以使用這些應用程序。

一些人認為,提供生成人工智能應用程序的公司應該首先驗證用戶的年齡,大概是為了防止非成年人在寫作時使用人工智能作弊。 如果用戶表示他們不是成年人,請不要讓他們使用 AI 應用程序。 坦率地說,這是不太可能的預防方案,除非以某種方式頒布了與人工智能相關的法律,試圖建立此類限制。 即使通過了此類法律,您也可以通過使用在另一個國家等託管的生成式 AI 應用程序來解決這個問題。

另一個令人望而卻步的角度是生成式人工智能應用程序是否需要花錢才能使用。 假設有每筆交易費用或訂閱費。 這將使生成式 AI 應用程序與互聯網上的那些人相提並論,這些人會為你寫一篇文章,要求你這樣做。 工黨將與人工智能正面交鋒(順便說一句,這一切確實表明,以為學生寫論文為生的人類將被做同樣事情的人工智能所取代;問題是我們應該感到悲傷還是高興那些以這種方式謀生的人將不再能夠以這種方式這樣做)。

開發生成式 AI 應用程序的公司當然希望從這些應用程序中賺錢,儘管如何做到這一點仍然懸而未決。 收取交易費、訂閱費,或者可能按生成的字數收費,這些都在討論中。 與其向人們收費,不如通過使用廣告來實現貨幣化。 也許每次您使用特定的生成式 AI 應用程序時,您首先必須看到一個廣告。 那可能是一個賺錢的人。

我不想在這上面潑牛奶,但作為克服學生作弊的一種手段,它不會成為任何靈丹妙藥。 差遠了。

生成人工智能有開源版本。 人們把它們放在那裡,其他人則傾向於免費提供該應用程序。 不管怎樣,即使某些公司收取費用,您也可以找到免費使用的變體,儘管您可能需要查看廣告或可能需要註冊並出於營銷目的提供一些有關您自己的信息。

多步驟有幫助嗎

一名學生選擇使用生成式 AI 應用程序來撰寫論文。

學生決定編輯論文,而不是直接上交論文。 他們明智地在這裡說了幾句話。 在那裡說幾句。 上移一句話。 再往下移動一個句子。 經過一些編輯和提煉,他們現在有了一篇準備上交的論文。

這篇文章是學生的作品還是不是?

我已將您帶到了價值數百萬美元的重大未解之謎。

讓我們做一些關於合法權利和侵權的快速背景知識。 這是一個我已經涵蓋了很多的主題,例如 這裡的鏈接這裡的鏈接, 例如。

您可能已經對版權和所謂的知識產權 (IP) 有所了解。 擁有受版權保護的故事的人應該保留與該故事相關的各種合法權利。 他們沒有完全鐵定無所不包的合法權利。 有例外和例外。

侵犯某人受版權保護的材料的最棘手的問題之一是與原始來源相比您可能擁有的內容的接近程度。 也許您已經閱讀或看過有關著名歌手及其歌詞的新聞報導,據此,有人用看似相似的歌詞寫了一首歌,無論這是否合法。

我之前提到過,通常情況下,生成式 AI 應用程序不會生成一篇文章,該文章是其他材料的副本,而這些材料是早期通過檢查 Internet 上的內容進行訓練的。 有可能材料被概括並且全部模糊在一起,以至於它不再與源內容所包含的任何內容非常相似。

我們將不得不等待,看看法律程序如何處理這個問題。 如果生成式 AI 應用程序生成的藝術品在視覺上明顯類似於某些來源的藝術品,我們可能會傾向於指責 AI 和 AI 的製造者侵犯了與原始作品相關的版權。 我們可以親眼看到。

對於論文,這可能會更棘手。 最明顯的例子是整個句子和段落逐字相同。 我們都可以看到這一點。 但是當措辭略有不同時,我們就會進入灰色地帶。

新製作的材料必須與原始材料相差多遠才能根據其自身的優點宣布它是真正的原始材料?

這是一個沉重的問題。

讓我們將其與使用生成式 AI 應用程序撰寫論文的學生聯繫起來。

假設人工智能應用程序生成的一篇特定文章將被解釋為一篇“原創”文章。 我的意思是假設它不會以任何明顯的方式違反地球上任何地方任何其他先前存在的文章或文本敘述。

然後學生從材料的原始來源開始。 如前所述,學生編輯並完善了該材料。 事情到了一個地步,即 AI 應用程序生成的原始版本現在與學生設計的改進版本不同。

這是作弊嗎?

可能是,可能不是。

你可以說它是。 學生開始讓 AI 為他們寫論文。 學生所做的一切都是機械地玩弄這篇文章。 我們希望學生憑空寫出論文,並利用自己的頭腦來完成。 使用 AI 應用程序生成基線顯然是作弊。 給學生打“F”級。

沒那麼快。 你可以說這不是作弊。 學生重新製作了源材料。 如果 AI 應用程序生成的論文和學生修改後的版本之間的比較差異足夠大,我們會說學生寫了這篇論文。 不可否認,他們在這樣做時使用了其他材料,但如果他們使用百科全書或其他來源,你不能說同樣嗎? 這名學生通過自己的智慧撰寫了一篇論文(儘管參考了其他材料),應該得到“A”級。

教師們將陷入這個已經令人煩惱的問題之中。

一種方法是,教師可能會明確指出學生必須列出所有參考資料,包括是否使用了生成式 AI 應用程序。 如果學生沒有直接列出生成式 AI 作為參考,而老師發現他們沒有列出,則該學生的作業將立即獲得“F”等級。 或者,也許有些學校會認為這是一種導致學生自動不及格的作弊行為。 或者可能被開除。 我們必須看看學校在這些問題上能走多遠。

總的來說,我們正在走向一個知識產權和作品合法所有權的顛倒世界,例如論文(文本)、藝術(圖像)和視頻,包括:

  • 一些人會向生成式 AI 製造商尋求法律補救,以解決 AI 用於生成所產生輸出的內容來源。
  • 有些人會將生成式人工智能的輸出視為自己的作品,然後試圖向任何侵犯其“原創”作品的人尋求法律補救。
  • 這可能會循環,例如有人從生成式 AI 中生成輸出,這些輸出發佈在互聯網上,然後其他一些生成式 AI 出現並在其生產類似作品的培訓中使用它。

化消極為積極

所有這些關於生成式人工智能在學生作弊方面的壞處的討論可能正在蒙蔽我們的思想,一些勸告。

換個方向。

你坐下了嗎?

也許教師應該有目的地考慮讓學生使用生成式人工智能作為學習如何撰寫論文的過程的一部分。

我以前寫過關於所謂的 雙重用途 人工智能,見 這裡的鏈接. 這個概念是,有時 AI 系統可以用於壞事,有時可以轉換並用於好事。 令人擔憂的是,當有人為了好的目的而編寫 AI 時,卻幸福地沒有意識到他們的 AI 是多麼容易變成壞事的幽靈。 部分 道德AI 是意識到人工智能應該被設計成不能在一夜之間變成詛咒。 這是一個持續的問題。

回到用於撰寫論文的生成式 AI。

我早些時候提出了這樣一個概念,即學生可以通過查看已經存在的書面作品來學習寫作。 這很有道理。 基本上,您閱讀的內容越多,您就越有可能將您的精神表象擴展到能夠寫作。 如前所述,您仍然需要寫作,因為如果您不練習寫作,那麼世界上所有的閱讀都不一定能讓您成為一名優秀的作家。

我們可以使用生成式 AI 來促進這種讀寫耦合。 讓學生有意使用生成式 AI。 人工智能產生了一篇文章。 給學生的任務是評論 AI 生成的論文。 接下來,學生被分配寫一篇新論文,主題可能不同,但可以使用早期 AI 生成的論文的結構和其他一般元素。

一些人認為,對於學生來說,這可能比簡單地閱讀學生無法與之“互動”的作家的書籍或其他文本更有成效。 借助 AI 應用程序,學生可以嘗試使用大量提示一個接一個地重新運行並生成初始論文。 學生可能會告訴 AI 寫一篇關於林肯的準系統文章。 接下來,學生要求以非正式的語氣寫一篇關於林肯的長篇論文。 看完之後,學生指示 AI 應用程序生成林肯論文的高度形式化版本。 等等。

所做的斷言是,這可以在物質上幫助學生學習寫作以及如何進行寫作。

最近的一篇研究論文提出了這一點:“本文的作者認為人工智能可以用來克服課堂學習的三個障礙:改善遷移、打破解釋深度的錯覺以及訓練學生批判性地評估解釋”(在題為“人工智能聊天機器人啟用的新學習模式:三種方法和作業”的論文中,Ethan Mollick 博士和 Lilach Mollick 博士, 賓夕法尼亞大學沃頓商學院和沃頓互動,12 年 2022 月 XNUMX 日)

例如,他們指出,改善學習遷移可能會以這種方式發生:“人工智能是一種廉價的方式,可以為學生提供許多示例,其中一些示例可能不准確,或者需要進一步解釋,或者可能只是編造的。 對於具有某個主題基礎知識的學生,您可以使用 AI 來幫助他們測試他們的理解,並明確地促使他們說出並解釋某個主題的不准確、差距和缺失的方面。 AI 可以提供一系列無窮無盡的概念示例和這些概念的應用,您可以促使學生:比較不同背景下的示例,解釋概念的核心,並指出 AI 應用概念的方式中的不一致和缺失信息新情況”(同上)。

這類似於老話,如果你不能打敗他們,就加入他們。

將生成式 AI 變成一種教育工具。

哎呀,快速響應。

你把狐狸放進了雞舍。 不知道什麼是生成式人工智能的學生現在將通過老師和學校的公開行動公開展示它。 如果學生對作弊的機會一無所知,那麼您就是將其直接放在他們的臉上和手中。

那些當權者向學生介紹作弊手段似乎是完全令人反感的。 因此,您將永遠把最誠實的學生置於作弊誘惑的境界。 每個人都可以使用作弊機器。 他們被告知要這樣做。 無需隱藏它。 無需假裝您沒有使用生成式 AI。 學校和老師讓你用的。

對此的反駁是,你必須盲目和無知地把頭埋在沙子裡,以為學生不會熟悉生成人工智能。 當您愚蠢地假裝他們不知道時,他們正匆匆走出學校去使用它。 你更好的選擇是向他們介紹這個東西,討論它能做什麼和不能做什麼,並為整個難題帶來明亮的光芒。

這真是個傻瓜。

對於那些正在研究技術教育創新的人,您可能想看看生成式 AI 以及它如何改變教育方法的性質並影響學生的學習。 它很快就會到來。

使用檢測將我們從毀滅中拯救出來

換個角度,讓我們暫時考慮一下數字藝術作品。

如果您創作了一件數字藝術作品,您可能希望以某種方式對其進行標記,以便日後辨別是否有人選擇使用或重複使用您的藝術作品。 一種簡單的方法是更改​​數字作品中的一些像素或點。 如果你在這里或那裡做一些,藝術品的外觀在人眼中看起來仍然是一樣的。 他們不會注意到那些很小的像素,它們被設置為某種特殊顏色,只有通過數字工具仔細檢查才能看到。

您可能知道這些技術是一種水印形式。 就像過去嘗試給紙質材料和其他非數字化內容加水印一樣,我們也逐漸看到了數字水印的興起。

數字水印可能隱藏在數字藝術作品的圖像中。 如果這看起來對圖像有乾擾,您可以嘗試將水印嵌入到包含數字作品的文件中(數字作品的所謂“元數據”)。

可能會出現貓捉老鼠的遊戲。

一些壞人出現了,他們發現了您的數字水印。 他們將其刪除。 現在,他們似乎可以自由地使用您的數字藝術作品,而不必擔心您稍後會發現它並清楚地表明它是對您的努力的剽竊。 那些惡棍!

我們需要加強數字水印,我們可以通過使用密碼技術和技術來做到這一點。 想想秘密消息和編碼。

這個想法是我們對數字水印進行編碼,以便很難找到它。 它也可能難以移除。 我們甚至可以嘗試確保將顯示或允許使用數字藝術品的軟件必須首先檢查並查看作品中是否存在有效的編碼數字水印,否則將被視為不正確的副本。 當場抓住你。

我們可以對生成文本的生成 AI 做同樣的事情嗎?

一個挑戰已經放下。 不過,這個問題在某種程度上可能比考慮藝術品的數字水印時更棘手。

這就是原因。

假設您唯一可以放置水印的地方是直接放入文本本身。 我這樣說是因為生成的文本不一定會進入文件。 文字只是文字。 您可以從生成式 AI 工具中剪切和粘貼它。 從這個意義上說,通常沒有可以嵌入水印的元數據或文件。

你必須只關注文本。 純文字。

一種方法是偷偷讓生成式 AI 以可追踪的方式生成文本。 作為一個粗略但不切實際的例子,假設我們決定在每三個句子的開頭使用單詞“And”作為開頭。 我們仍然會生成一篇看似完全流利的文章。 唯一的詭計是每三個句子都以我們選擇的魔法詞開頭。 沒有其他人知道我們在做什麼。

一名學生使用生成式 AI 來製作有關林肯的指定論文。 學生直接從 AI 應用程序中獲取並通過電子郵件發送給老師。 事實證明,學生一直等到最後一刻才趕上公佈的截止日期。 沒時間複習論文。 只需發送它並希望最好。

老師看著作文。 假設我們已經告訴她,我們的水印由每三個句子開頭使用的神奇單詞組成。 老師檢測到這篇提交的論文就是這種情況。 儘管學生寫這篇文章的可能性非常小,並且可能喜歡在每三個句子的開頭使用這個特定的詞,但我認為我們可以合理地同意這是極不可能的,相反學生可能使用了生成 AI來製作論文。

你明白它是如何工作的嗎?

我相信你會的。

現在的問題是如何想出一個不太明顯的水印。 學生可能會注意到這些句子似乎奇怪地使用了一個特定的詞。 他們可能會猜到發生了什麼。 反過來,學生可能會移動句子並進行一些改寫。 這幾乎會降低這個特殊的水印,因為這篇文章不再容易被識別為由生成 AI 撰寫。

貓捉老鼠的遊戲再次向前推進。

我們需要生成流暢的文本,以某種方式以不易辨別的方式包含“水印”。 此外,如果可能的話,即使文章略有修改,水印也應該繼續存在。 全面修訂可能不會讓水印保留下來。 但是我們需要一些冗餘和彈性,以便即使對文本區域進行了一定程度的更改,水印也能被檢測到。

一位正在為製作 ChatGPT(OpenAI 的 AI 應用程序)的公司做一些工作的研究人員正在根據這些水印注意事項探索一些有趣的密碼學工作。 Scott Aaronson 是德克薩斯大學奧斯汀分校的計算機科學教授,他最近就正在進行的一些工作發表了演講(他的博客上發布了一份文字記錄)。

考慮一下他簡要解釋現有方法的這段摘錄:“它是如何工作的? 對於GPT,每一個輸入和輸出都是一串token,可以是單詞,也可以是標點符號,單詞的一部分,或者更多——總共大約有100,000個token。 GPT 的核心是不斷生成下一個要生成的 token 的概率分佈,以先前 token 的字符串為條件。 在神經網絡生成分佈後,OpenAI 服務器實際上會根據該分佈或分佈的某些修改版本對令牌進行採樣,具體取決於稱為“溫度”的參數。 但是,只要溫度不為零,下一個標記的選擇通常會有一些隨機性:您可以使用相同的提示一遍又一遍地運行,並且每次都得到不同的完成(即輸出標記字符串) ”

如前所述,關於將哪些單詞放在由 ChatGPT 應用程序生成的文章中,有一定的隨機性。 這也解釋了之前的觀點,即即使是同一主題,每篇文章也可能有所不同。 在論文生成過程中,有目的地使用特定範圍內的隨機選擇方法正在運行。

我們現在進入有趣的部分,密碼混合:“那麼要加水印,不是隨機選擇下一個標記,而是偽隨機選擇它,使用密碼偽隨機函數,其密鑰只有 OpenAI 知道. 假設最終用戶無法區分偽隨機數和真正的隨機數,這不會對最終用戶產生任何可察覺的差異。 但是現在你可以選擇一個偽隨機函數來秘密地偏置某個分數——在每個 n-gram(n 個連續標記的序列)上評估的某個函數 g 的總和,對於一些小的 n——如果你知道,你也可以計算哪個分數這個偽隨機函數的關鍵。”

我意識到這在技術上似乎有點擁擠。

實質是生成的文章看起來很流暢,您將無法通過閱讀文章輕鬆辨別它是否包含數字水印。 要弄清楚給定的文章是否確實包含水印,您需要將文章輸入專門設計的檢測器。 執行檢測的程序將根據文本計算一個值,並能夠將其與存儲的密鑰進行比較。 在所描述的方法中,密鑰將由供應商持有並且無法以其他方式獲得,因此,假設密鑰是保密的,在這種情況下,只有指定的檢測程序才能計算出這篇文章是否可能來自 ChatGPT。

他繼續承認這並非萬無一失:“現在,只要付出足夠的努力,這一切都可以被打敗。 例如,如果您使用另一個 AI 來解釋 GPT 的輸出——好吧,我們將無法檢測到它。 另一方面,如果你只是在這里或那裡插入或刪除幾個單詞,或者重新排列一些句子的順序,水印信號仍然存在。 因為它只依賴於 n-gram 的總和,所以它對這些類型的干預很穩健。”

一位教師可能被授予訪問檢測程序的權限,該程序將檢查學生的論文。 假設事情相對容易,因為老師讓學生將他們的論文通過電子郵件發送給老師和自動檢測器。 在這種情況下,檢測器應用程序會通知老師這篇文章由 ChatGPT 撰寫的可能性。

現在,如果檢測器對任何人開放,你就會有“成績優異”的學生作弊者,他們會簡單地將他們的論文輸入檢測器並進行一系列更改,直到檢測器表明該論文是由生成器派生的可能性很低人工智能。 更多的貓捉老鼠。 據推測,檢測器必須通過使用密碼進行嚴格保護,或者需要一些其他處理加密方法的手段或方法(可以使用多種基於密鑰和無密鑰的方法)。

教師可能面臨著數十或數百個生成的 AI 應用程序可在 Internet 上使用的可能性。 在這種情況下,試圖讓所有這些人都使用一些數字水印,並且必須向所有這些人提供一篇文章,好吧,它只會變得更加迷人和邏輯複雜。

課堂外不再有論文

一個悲觀的觀點是,也許教師將不得不放棄使用外部論文寫作。 所有論文必須僅在教室的受控環境中撰寫。

這有很多很多問題。

假設一個學生通常需要十個小時來寫一篇特定的完整論文,這是一個課堂項目。 這將如何在教室裡完成? 你打算把它打包,讓學生在幾天內寫一小段文章嗎? 想想這帶來的困難。

有人聲稱這件事可能被誇大了。

教師應該像往常一樣對待學生的剽竊行為。 老師預先聲明剽竊是一個嚴重的作弊問題。 強調以任何方式使用生成式 AI 都將被視為作弊行為。

做出具有重大意義的處罰,例如低分、不及格課程或開除學校。 要求學生為每項外部論文作業以書面形式證明他們上交的是他們的工作(在沒有生成人工智能等輔助工具的情況下完成,從互聯網上複製,使用同學,使用父母,支付完成它,以及很快)。 此外,要求學生列出在準備工作時使用的所有在線工具,包括特別要特別注意任何生成 AI 的使用。

老師可能會也可能不會使用檢測器應用程序來嘗試辨別提交的文章是否可能是由生成式 AI 應用程序生成的。 這可能是一個繁重的步驟,具體取決於檢測器使用和訪問的難易程度。

教師們大概應該已經在採取行動查明外部書面論文是否合法。 通過在課堂上寫作文,有機會進行比較和對比,但意識到在課堂上寫作的時間更少,而且也可能受到不允許訪問在線參考資料的限制。

要點是我們不應該採取突然放棄使用外部論文寫作的方式。 有些人會譴責這是一種輕率的行為,而且這似乎讓人想起把嬰兒連同洗澡水一起倒掉(一句老話,也許值得退休)。

如果完全停止將課外寫作作為一項學習活動,那麼將這種看似日常的教育活動從課程中移除可能會帶來嚴重且長期的不利影響。 這涉及到權衡。 儘管有上述所有製衡措施,但有多少學生會作弊? 有多少學生不會作弊,因此會繼續使用有益的教育方法來提高他們的寫作能力?

從理論上講,希望作弊者的比例足夠小,使得課外寫作仍然對占優勢的學生有利。

結論

人工智能可能非常令人頭疼。

對於教師來說,人工智能既是福也是禍。 無論哪種方式,這都意味著教師需要了解人工智能,以及如何應對與教學活動相關的人工智能曲折,這又給他們已經過度伸展的背部和肩膀增加了負擔。 向各地的老師致敬。

也許我們可以希望人工智能消失。

不。

你看,我們不會讓時光倒流並淘汰生成式人工智能。 任何呼籲這樣做的人都是夢想家。 而且,順便說一句,我使用“和”這個詞作為本段第三句話的第一個詞(哎呀,放棄了鑰匙!),生成式人工智能將繼續存在。

這是讓您進行激烈討論的提示: 生成式人工智能將變得更加普遍,並具有更加驚人和令人不安的能力。

麥克風掉落。

現在的最後想法。

莎士比亞有句名言:“生存還是毀滅:這就是問題所在。”

我向你保證,生成式人工智能將會成為現實。 已經是了。

我們必須弄清楚我們希望生成式人工智能如何進入我們的生活,以及社會將如何選擇塑造和引導這種使用。 如果你需要一個思考 AI 倫理和 AI 法律的理由,也許生成 AI 會促使你去尋求了解我們是什麼,即使我們不知道我們可能是什麼(隱藏的莎士比亞參考)。

來源:https://www.forbes.com/sites/lanceeliot/2022/12/18/enraged-worries-that-generative-ai-chatgpt-spurs-students-to-vastly-cheat-when-writing-essays- spawns-spellbound-attention-for-ai-ethics-and-ai-law/