剛剛看到很有趣的研究指出,如果在大學考試中把AI的答案混在人類的答案中,是否會被發現為AI生成?以及誰的品質比較好?
考試分為簡答題(從6 個問題中選出4 個回答,每個問題的字數限制為200 字;)跟Essay題(繳交一篇1500字的essay),都是在家進行的考試,學生可以使用教學資料、書本跟網路,也有可能同學間一起作答或使用AI。
簡答題的prompt是:請用 160 字回答下列問題,包括參考學術文獻,但不另列參考文獻:{題目}
Essay題的prompt是:請撰寫一篇 2000 字的論文,回答下列問題,其中包括學術文獻參考文獻,但不單獨列出參考文獻部分:{題目}
再將答案交給真人老師評分。
結果是將近94%的AI生成的答案未被發現,而AI的成績比學生的成績更好。
未來AI將被廣泛的應用在各個場域(特別是學習),而根據目前的研究,不論是教師甚至AI偵測軟體都無法有效發現學生是否使用AI完成作業。那我們該如何應用AI來促進學生學習而不是替代學生學習呢?我們如何幫助學生應用AI確保學習以及進行更高層次的思考?
沒有留言:
張貼留言