擔心 AI 讓學生懶?一篇 Nature 子刊的元分析匯總了 51 項研究,揭示 ChatGPT 顯著提升中小學生學業(yè)表現(xiàn)和高階思維能力。從語言到 STEM,從短期突破到長期成長,AI 正以科學的方式走向教育未來!
現(xiàn)在的學生,已經(jīng)離不開各種 AIGC 工具了,不論是寫作業(yè),還是生成筆記,或者通過閱讀 AI 生成的摘要來讀文獻。
面對這些離不開 AI 的學生,老師和家長都開始擔憂了,這樣下去,孩子會不會越變越笨啊。
然而,最近一項發(fā)表在 Nature 子刊的研究,基于對 59 項研究對匯總(元分析)指出,ChatGPT 的使用對提高 K12(中小學生)的學習表現(xiàn)有顯著的正向影響,對于培養(yǎng)學生解決復雜問題的能力也有所幫助。
這下家長們老師們可以稍微放心一些了。

https://www.nature.com/articles/s41599-025-04787-y
為何說這項研究的結(jié)論足夠靠譜,是因為不是進行了一兩次實驗,而是將近年來所有涉及大模型對教學效果影響的研究進行匯總后,得到的集眾家之所長的集體智慧。
成績和思維能力顯著提升
最初該研究通過關(guān)鍵詞檢索,找到了 6621 篇研究,經(jīng)過一次次篩選,最終找到 51 篇研究。
這些研究都在考察 ChatGPT 的使用對教學效果的影響,都采取了隨機雙盲實驗,并將實驗數(shù)據(jù)進行了完整公開。
之后研究者將所有 51 項研究的實驗數(shù)據(jù)匯總,重新分析,最終得到 ChatGPT 的使用對教學效果的影響。

研究中匯總論文的篩選情況
被選入的研究,其涉及面相當廣泛。
既包括考察大模型對語言機寫作教學的影響,也包括對數(shù)學,物理等 STEM 課程,還有一些研究關(guān)注大模型對諸如編程等專業(yè)技能教學的影響。
從各研究涉及的實驗時長來看,不止有關(guān)注 1 周內(nèi)短期影響的,也有一些會觀測大模型適應(yīng)對學生造成的長期(8 周以上)后果。
研究中對 ChatGPT 的使用方法,也可分為個性化推薦,評價(打分),讓 ChatGPT 充當導師,以及混合四種。
研究進行的地點,最多是在亞洲,包括了所有五大洲,因此其結(jié)論具有跨文化性。
不過,這些元分析所涉及的研究大多考察中學階段,只有一項涉及小學生,因此該研究得到的結(jié)論,可適用于中學階段。
在最受大家關(guān)注的教學效果上(成績),該研究得到的結(jié)論是使用了 ChatGPT 之后,學生的成績有顯著提升,下面的每一點是一項研究,豎線代表匯總后的均值。
可以看到大部分研究都顯示學生在使用 ChatGPT 之后的學習成績有所提升,平均來看,使用 ChatGPT 后,教學效果提升了 0.867 個標準差。這一提升不限特定學科,也不管如何使用 ChatGPT。

對學生使用 ChatGPT 后,學習成績顯著提升
此外,該研究研究還發(fā)現(xiàn),使用 ChatGPT 之后,有助于學生培養(yǎng)高階思維(平均提升 0.457 個標準差),即不是簡單的記憶特定的知識點,而是推理,匯總及創(chuàng)新性使用學到知識解決復雜問題的能力。

學生使用 ChatGPT 后,高階思維能力有所提升
無獨有偶,另一項今年 4 月發(fā)表的關(guān)于大模型在教學活動中的元分析,匯總了總計 69 篇關(guān)于大學本科及 K12 階段在教學過程中使用大模型造成的影響的研究,得到了相同的結(jié)論,即 ChatGPT 提高學業(yè)表現(xiàn),改進了高階思維。
減輕精神負擔
除此之外,該研究還發(fā)現(xiàn),ChatGPT 減輕了學生的精神負擔,提升了學習積極性,并且不會影響學生對自己能力進行評估的準確性。
對比大模型在各類課程教學中的影響,可發(fā)現(xiàn)其對技能相關(guān)課程的成績提升最為顯著。
這可能是因為這類課程通常涉及明確的任務(wù)目標和程序步驟;ChatGPT 提供即時反饋、針對性指導和問題解決支持。
同時,研究還發(fā)現(xiàn),ChatGPT 使用帶來的更明顯的是短期提升,即相比對照組,使用 ChatGPT 的學生 1 周內(nèi)的成績提升最明顯。
而如果是對比使用 2 月后的長期影響,則提升的效果就沒那么顯著,這反過來說明,即使不使用大模型,對學生來說負面影響也只是暫時的,而非持久性的。
至于大模型的引入,為何能提升學習成績,有兩種可能的解釋。
第一是由于這些研究進行的 23-24 年,大模型作為一項新出現(xiàn)的技術(shù),其體驗是全新的。參與實驗的學生由于要嘗試一項新技術(shù)而產(chǎn)生了好奇心,因此更為專注,學習積極性更高,因此成績有所提升。
而另一種解釋,是認為學習的過程是對學到對知識進行信息壓縮,在此過程中學生需要與環(huán)境互動,并在心理上構(gòu)建對知識的理解,而大模型同樣是對訓練數(shù)據(jù)進行了壓縮,并能據(jù)此在學習過程中給出更為及時的反饋,因此能幫助學生更好地掌握新知識。
不過,這些研究中,實驗者對大模型對使用,都是受到監(jiān)管的。
實驗者設(shè)定了大模型將被如何使用,而家長老師們擔心的,是學生使用大模型去完成作業(yè),而在此過程中,自己什么都不做,只是復制粘貼大模型的輸出。而這并不是這些研究要關(guān)注的。
在上述兩項研究中,大模型多被用于對學生對回答給出反饋和指導,這說明要想利用好大模型提升教學效果,需要注意使用方法,家長和老師要對學生如何使用大模型給予適當?shù)闹笇?,切勿放任不管?/p>
參考資料:
https://www.nature.com/articles/s41599-025-04787-y
https://www.sciencedirect.com/science/article/pii/S0360131524002380#sec4
本文來自微信公眾號:新智元(ID:AI_era)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。