人工智能没有显著提高作弊行为

去年春天,Turnitin(一家提供反作弊工具,检测学生论文中人工智能使用情况的公司),发布了基于其软件审查的两亿多个样本研究结果。其中,百分之三的论文几乎完全由人工智能撰写,大约百分之十的论文,呈现出使用人工智能的一些痕迹。这些数字表明作弊现象并不显著。其他研究表明,自从 ChatGPT 等大型语言模型的出和大规模普及以来,学生抄袭现象并没有明显增加。

然而越来越多的老师和成年人似乎相信孩子都会作弊。美国民主与技术中心的一项研究发现,“大多数教师仍然表示,生成式人工智能让他们更加怀疑学生的作业,是否真的是他们自己完成的。” 当前,许多学区未能实施明确而全面的人工智能政策,教育工作者之间就如何处理涉嫌作弊的情况,展开了另一层辩论。堪萨斯大学卓越教学中心最近发布了一套 Turnitin 使用指南,警告教师不要根据该公司的软件做出“快速判断”,并建议教育工作者“多采取一些步骤”收集信息”,包括比较学生以前的作业示例、提供第二次机会以及与学生交谈。

我认为在使用 ChatGPT 的学校中,正在发生这样的事情:老师可能对学生有点过度怀疑,部分原因是他们被给予了检测作弊者的工具。这些能够检测作弊的工具,可能直接吓坏了一些学生,但作弊者还是会作弊。

当我在美国上高中时,图形计算器被指责为学生作弊的罪魁祸首。十年后,手机在教室中的普及,激起了孩子们在老师一转身时就互相发短信发送考试答案的景象。维基百科也曾一度成为学校研究和知识的破坏者。如今,维基百科显然已经成为社会的利好工具,它可能比其所取代的大英百科全书更准确、更少偏见。

这种情况让我想起了体育博彩应用程序的问题。赌博和剽窃一样,并不是什么新鲜事。如果你把一百个一生中从未下过赌注的人关在赌场里,他们中的一小部分人会在第二天、第三天、第三天回来。其余的人要么不再下注,要么只是偶尔以负责任的方式赌博。

在我看来,学校作弊是一种类似的现象——也许大多数孩子确实会做一些不守规则的功课,但有些孩子永远不会,而且更多的孩子可能只会在最琐碎(或最困难的)情况下才会这样做。

技术改变了作弊边界

技术确实改变了体验;它可以鼓励极端情况下,人们开始在掷骰子桌上掷骰子或要求 ChatGPT 写一篇论文。但是,在大多数情况下,这并不是成年人在体育运动中赌博或孩子在学校作弊的原因。正如维基百科没有破坏书面文字一样,并且可能通过简化了解某个主题的介绍性任务,来加深许多学生论文的研究——核心文章将在大型语言模型中幸存下来。

急于解决人工智能作弊问题,以及开发并销售给全国各地学校的无数教育工具,引发了一个比书面文字能否生存更有趣的第三个问题。当我们思考学生的作业时,我们如何在他们发展中的思维中产生的东西和没有产生的东西之间划清界限?

在STEM科目中,界限更加清晰一些。如果一个学生只是偷偷地看着同桌并写下相同的答案,大多数人都会认为这是作弊。但是,如果一个学生试图证明他理解如何解决涉及乘法的复杂数学问题,那么使用计算器是否意味着该学生在作弊?他并不是在测试是否知道如何乘法,那么为什么要浪费时间并可能引入粗心的错误呢?

我不认为用 ChatGPT 写论文与使用计算器在更大的数学问题中完成更琐碎和基本的任务是一回事,但值得一问的是,为什么我们对研究的自动化和书面文字有不同的感觉。即使在美术领域,赞助人和鉴赏者也早已接受这样的观点:艺术家不需要实际表演每一笔,建造每一个雕塑,或者建造大型装置的每一个部分。一小群未署名的助手涉足了安迪·沃霍尔、达米恩·赫斯特和杰夫·昆斯的作品,这不时引发争议,但还不足以结束这种做法。如果一台机器完成了助手的所有工作,我们会不会对这些艺术家产生轻视?

这些问题是抽象和荒谬的,但它们也反映了我们思考什么构成作弊、什么不构成作弊的任意方式。除了公然抄袭行为之外,人文学科中作弊与不作弊之间的界限似乎取决于完成任务所需的时间。例如,如果一名学生访问图书馆档案馆以研究诺曼底登陆后一周发生的事情,将一些缩微胶片卷入一台古老的机器中,并尽职尽责地记下笔记,我们可能给学生谷歌搜索中的同一篇文章——当他转述某些维基百科编辑对该文章的阅读更是如此。

应该学习什么

根据这种逻辑,作业的目的不是创造新的学识或正确回答问题,而是习得正确的学习习惯。花时间去图书馆的年轻人更有可能养成某种工作习惯,使他能够找到可能对创作小说、算法或令人信服的论点有用的附带信息。撇开明显的不诚实行为不谈,作弊的问题并不在于学生跳过了解释所学内容的过程,而在于他们剥夺了自己实际阅读书本的耗时劳动。

互联网给课堂带来的根本危机之一是:由于事实和历史的参考不再需要存储在你的大脑中,所以实际上你不再需要学习任何东西。搜索引擎、维基百科和 ChatGPT 都有相同的解释:如果我们有这些工具,那么这些课程的意义何在?即使教育趋势来来去去,学校往往变化缓慢。但是,近年来,我注意到人们对于孩子应该在人文学科中学习什么的看法,发生了微妙的转变。只注重记忆的做法,在很大程度上已经消失了。孩子们不再被迫说出布拉格第一次破窗事件(1419)的日期或记住相同的词汇表。

然而任何共识的实际实施,可能需要数十年才能完成。这种低效率可能是有害的——例如,美国学校取消手机的时间太长了——但它也导致了一些小恐慌,比如当前围绕大语言模型作弊的恐慌。我不认为人工智能会以某种革命性的方式鼓励作弊,而且我认为抄袭行为的增加,可能更多地与大学招生压力、高中竞争氛围有关。在这种情况发生改变之前,一些孩子会将任何新应用程序转变为作弊工具——与此同时,教育技术公司将出售拦截作弊工具,这样的循环就会重演。

其他阅读

为什么人工智能机器人不太可能取代人类教师 ?

人工智能对计算机科学教育的影响

观点:人工智能为什么不会“解决”教育问题?

“人工智能无法取代教学,但可以让教学变得更好 ”

新东方2024财年业绩:营收创新高超双减前,达43亿美元;新教育业务最新财季增幅超50%

2024上半年回顾:头部教育公司保持两位数增长,素质教育、AI 智能硬件新品最活跃

2024上半年回顾:教育智能硬件,AI大模型驱动,学习机、词典笔软硬件迭代更新…

2024上半年回顾:素质教育探索新业务,启蒙、阅读、博物馆、国际游学成关键词…

2024上半年回顾:成人学习二级市场,头部公司增长显乏力

2024上半年回顾:智慧教育,AI加持,加速创新落地

人工智能在高校教育中的应用

30 款让教师工作更轻松的 AI 工具

新东方、好未来、高途最新财季:营收增幅显著,海外备考、非学科辅导推动增长

生成式 AI 在教育中的应用与挑战

AI 在教育中的优势与风险

人工智能在教育中的 8 项示例

人工智能在教育中的 43 种用途

2024 年 10 款人工智能教育工具(学生和教师版)

10 款教育 AI 工具用例

和神经科学家聊聊:究竟是什么让人们快乐?| Edu指南专访

和沟通专家聊聊:好好说话,有哪些简单方法?| Edu指南专访

和领导力专家聊聊:出色领导者有怎样的思维模式?| Edu指南专访

和《你想过怎样的一生》作者聊聊:0~100岁的故事,重要的一课是什么 | 专访

和心理学教授聊聊:积极思维是一种可以练习的技能 | Edu指南专访

教育头部公司2024年有哪些业务看点 | 年度展望

2024年教育硬件赛道4大看点 | 年度展望

和斯坦福商学院“人际互动之父”聊聊:孤独社会,如何与他人建立深度关系 | Edu指南专访

素质教育2024开年展望:STEM走向差异化竞争;阅读、语言素养数字化加速

成人学习赛道2024关键词:市值修复、AI、全球化与全兴趣学习 | 开年展望

和高管教练聊聊:新的一年,如何制定目标?|  Edu指南专访

Coursera2023财年:收入6.4亿美元,增长21%;引入GenAI新课程,推出GenAI学院

和《优秀的绵羊》作家聊聊:当下精英大学的问题与信心的重建  | Edu指南专访

好未来2024财年Q3:收入3.7亿美元,增长61%;经营现金净流入2.5亿美元,增幅158%

新东方2024财年上半年:收入19.7亿美元,增长42%;东方甄选收入3.9亿美元,增长34%

和《睡眠革命》作者聊聊:睡眠教练如何帮助顶尖运动员达到最佳表现 | 专访

可汗学院创始人:“我们正处于利用AI实现教育史上最大变革的风口浪尖”

大模型加持,教育智能硬件创新不断、单品GMV数倍增长 | 2023年度回顾

2023年度回顾:头部教育公司各自形成新版图

素质教育2023年度回顾:线上线下齐推进,科技素养、游学研学、阅读成热门品类

成人学习2023年度回顾:留学、考研、公考品类驱动增长;VR、AI学习平台获高额投资

从线上到线下:印度技能提升公司竞相创办“新时代大学”,转变教育科技模式

专访Uolo创始人:印度中产以上家庭倾向选择K12私立学校,EdTech产品当前只覆盖2%学生

ChatGPT 已进入课堂:LLM 如何改变教育

新东方30周年:“轻舟已过万重山”,重回市值百亿美元

知乎2023财年Q3业绩:收入10.2亿元,增长12%;职业培训收入1.4亿元,增长86%

高途2023财年Q3业绩:营收7.9亿元,增长30%;净亏损额5766万元,同比收窄6%

抖音双11:小猿硬件跻身3C数码Top10,学而思图书教育领先,泡泡玛特位居玩具乐器榜首

Edtech创始人从融资1700万美元到关闭的7条经验教训

增强数字化课堂的 10 个教育科技工具

Edtech+AI:正在发生什么以及下一步可以做什么?

发表评论