“翟天临”克星?哥本哈根大学开发反“枪手”AI,识别作业代写准确率接近90%

大数据文摘出品

编译:曹培信、周家乐

随着毕业季的邻近,翟天临又一次被网友们骂上了微博热搜。

翟的论文抄袭事件过后,许多高校都加强了论文评审标准,更有严格的院校连非毕业生的论文结课都要查重。

许多深夜改论文的学生于是结伴来到微博@翟天临:你睡了吗?你怎么睡得着?我还在改论文!你配睡觉吗!

图片来自微博

翟天临自己可能也没有想到,竟然阴差阳错对中国高校教育做出了卓越的贡献。

然而,也有学渣表示,以后查重这么严,抄袭是不可能了,只能找人代写了。

早有媒体曝光过学术圈“论文代写”的产业链。据第一财经报道,相关淘宝搜索的本科文科论文每千字200元左右。

不过,这条“学术歪路”也要被AI堵死了。近日,哥本哈根大学的研究人员的最新研究称,刚刚开发出一款“反枪手代写”的AI系统。

这款系统意图通过智能写作分析技术,来检测论文作弊。可以根据你的写作习惯,确定论文究竟是你自己写的作业还是由他人代写。

根据对13万份书面作业的分析,科学家们可以以近90%的准确率检测出学生究竟是自己写的作业,还是由代笔撰写。

基本上可以达到“代写”作业一抓一个准的结果了。

高中代写成风,哥本哈根大学的神操作

这套针对学生论文作弊行为的研究,已经在哥本哈根大学计算机科学系(DIKU)进行了几年了,最初,这款研究是针对丹麦的高中生进行的。

在丹麦,高中目前主要使用的作业查重平台叫做Lectio,可以用来检查学生的作业中是否有段落是直接复制先前提交的作业的。

然而,随着各类线上服务平台的盛行,在丹麦高中生中,找人代写作业变得越发容易。

面对这种情况,学校一直缺乏有效的检测手段。

学习轨迹项目或“SRP”(丹麦语的“Studie Retnings Projekt”)是丹麦高中毕业生的必修跨学科课程,也是一项非常重要的书面作业。在这个项目中的作弊现象尤其引人注目。

由于SRP对于毕业十分重要,很多学生们在丹麦竞拍网站Den Bla Avis上发布他们的写作任务来找人代写。

和中国的老师和大多数查重系统一样,Lectio只能查重,没法判断一份作业是否是找人代写的。

哥本哈根大学的一些院系一直和很多高中有着SRP项目的合作,深受代写作弊行为之害,一直在探究解决之道。

这所大学的计算机科学系DABAI项目组决定教教这些偷懒的高中生们“做人”。

DABAI(丹麦大数据分析驱动创新中心)是一个成立于2016年的丹麦国家研究中心。除了研究机器学习的高效算法,这个研究小组本来就对学生教育特别关注。之前,他们曾研究了“优化学生的个性化学习”、“提高教师洞察力”等教育项目。

名叫“枪手”的反枪手神器

这个防作弊程序被叫做Ghostwriter(枪手),它本质上属于一种基于机器学习和神经网络技术的一款文本分析程序。

项目组成员Stephan Lorenzen博士称,这款程序可以比较该学生最近提交和以前提交的文章来识别写作风格的差异。

“程序会关注单词长度、句子结构以及单词的使用方式等诸多特征。例如,它会察觉‘for example’被写成了‘ex’,还是‘e.g.,’。”

其数据集来自为丹麦高中提供Lectio平台的MaCom公司,该公司覆盖了丹麦90%以上的高中,他们为GhostWriter项目的研究人员提供了13万份不同高中学生书面作业。

这个研究组认为,这款产品非常具有实际效用,很多学校对于找出“论文究竟是谁写的”这个问题有着越来越高的技术需求。

但Stephan Lorenzen博士也认为,“在此之前,还需要认真讨论一下应用这项技术所面临的伦理问题。我们不能把这个程序得到的结论作为判别是否作弊的唯一标准,更应该把它看作一份辅助性的证据。”

Ghostwriter是怎么工作的?

Ghostwriter程序使用Siamese 神经网络来区分不同文本的写作风格:通过大量数据的训练,学习不同写作风格的外在表现(representation),然后进行比对。

这个项目分两步来解决作者身份验证问题。首先是解决了计算两个文本之间写作风格相似性的问题,主要通过使用Siamese网络学习相似度函数s:T×T→[0,1]。其次是再解决作者A的验证问题,通过比对未知作者文本X和已知是作者A的文本T之间的相似性。

在网络方面,他们考虑使用不同的输入通道考虑几种不同的体系结构(例如,char,word,POS-tags),最终确定了一种表现最佳的网络架构:

Best performing network

编码部分包括一个字符嵌入(Embd),然后是两个不用的卷积层,每个卷积层后面都有一个全局最大池化层(GMP)。

在比较部分,他们首先计算合并层中的编码之间的绝对差值,然后,应用4个密集层,每层有500个神经元,最后使用具有两个输出的softmax层来进行归一化。

他们将数据集分为三份,T-train用于训练,T-val用于训练提前停止和selecting Cs,T-test仅用于估测试模型。

经过训练,模型的准确率达到了87.5%。

最后实现的功能就是,当学生提交作业时,该网络会将其与以前的作业进行比较。对于每个作业,神经网络都会计算出一个百分数,用于表示新旧作业的相似性。然后,通过综合考虑新旧作业相似性、交作业时间等多种因素计算出一个加权平均值。这个最终值就可以用来表示新作业和学生写作风格之间的相似性。

这一研究已经被发表在一篇名为《识别高中代写“枪手”》的论文中。

论文链接:

https://www.science.ku.dk/presse/nyhedsarkiv/2019/fristet-til-at-snyde-med-eksamensopgaven-kunstig-intelligens-opdager-dig-med-90-procent-sikkerhed/Detecting_Ghostwriters_in_High_Schools.pdf

除了论文,还能与警方合作筛查伪造文本

除了代写作业,Ghostwriter的技术也可以应用于社会的其他地方。

例如,该程序可辅助警方的文档审查员执行各类文件的真伪分析任务,比如一份商业合同是否是伪造的;或者一个离奇的自杀案中,死者留下了一封遗书,这封遗书是不是死者本人写的等等。

“与警方合作将是一件有趣的事情。警方现有的方法是聘用文件审查员来定性的比较文本之间的相似性和差异。而我们的方法则适用于大数据并自动找到其中潜藏的模式。我认为结合两者将有利于警察开展工作。”Lorenzen说,他强调这里也同样需要讨论其面临的伦理问题。

这项利用人工智能来检测作业中作弊行为的技术,具有广泛的应用前景。

目前,它还被用来分析Twitter文本,以确定文本内容是由真实用户撰写的,还是由水军或机器人编写的。也就是说,淘宝店铺雇佣水军好评,很有可能也能被识别出来。

相关报道:

https://www.sciencedaily.com/releases/2019/05/190529145048.htm

Image placeholder
divano
未设置
  77人点赞

没有讨论,发表一下自己的看法吧

推荐文章
30万微博评论看翟天临与毕业生的爱恨情仇

作者:朱小五&王小九 来源:凹凸数读我将带着北京电影学院表演系的精神伴随我一生的演艺事业!——翟天临硕士论文致谢辞2019年5月27日凌晨,翟天临又上了热搜。这次的热搜绝对不是买的,因为实时搜索微博“

揭秘!一个高准确率的Flutter埋点框架如何设计

背景用户行为埋点是用来记录用户在操作时的一系列行为,也是业务做判断的核心数据依据,如果缺失或者不准确将会给业务带来不可恢复的损失。闲鱼将业务代码从Native迁移到Flutter上过程中,发现原先Na

IBM 思想之夜:⼀场关于 AI 辩论,⼀名“AI 辩⼿”

5⽉20⽇,在2019IBM中国论坛隆重举⾏前夜,⼀场围绕关于“⼈⼯智能(AI)是否会改写商业规则”的思想对话辩论在北京盘古七星酒店激烈展开。由《哈佛商业评论》与IBM携⼿主办的“HBRC年度对话暨I

Google Brain推出语音识别新技术、面部表情识别助力商业再发展|AI一周学术

大数据文摘专栏作品作者:ChristopherDossman编译:fuma、云舟呜啦啦啦啦啦啦啦大家好,本周的AIScholarWeekly栏目又和大家见面啦!AIScholarWeekly是AI领域

美埃默里大学华人实验室突遭关闭,两华人教授及部分中国雇员被强制遣返

大数据文摘出品作者:魏子敏、宋欣仪据美《科学》杂志报道,佐治亚州亚特兰大的埃默里大学(EmoryUniversity)突然关闭了知名华人生物学家李晓江和李世华教授夫妇的实验室。22日,埃默里大学解雇了

清华大学教授马智亮:如何走向高度智慧建造?

什么是智慧建造?普遍意义上的智慧建造是指生物基于神经器官所具有的一种高级的综合能力,包括感知、知识、记忆、理解、联想、情感、逻辑、辨别、计算、分析、判断、文化等多种能力。显然,具备这种能力的生物,首当

英特尔数据中心“全家福”助燃上海交通大学“π2.0”超算系统

前不久,英特尔推出了一系列以数据为中心的产品组合,包括第二代英特尔至强可扩展处理器、英特尔傲腾数据中心内存和存储解决方案、软件以及平台技术等,以帮助用户从数据中挖掘更多价值。笔者得知,上海交通大学“π

都9012年了,怎么还会有人不会面试?

我是一家互联网公司的一线HR,负责公司技术人员的招聘。今天我有两个候选人又被fail了。关于这个岗位,我也很无奈。按理说,全是基础岗位的招聘,薪资也给的不算低,应该很容易招才对。但好巧不巧,我们公司是

到2023年,智能城市的支出将达1890亿美元

IDC最新发布的“全球智能城市支出指南”显示,到2023年,全球智能城市支出计划将达到1895亿美元。其中首要是能源和基础设施项目,其次是数据驱动的公共安全和智能交通。在2019年至2023年的预测中

过了35岁,90%以上DBA都在迷茫:未来要何去何从?

墨墨导读:如今,越来越多35岁以上的数据库从业者面临着各种各样的压力,对前进的方向有些迷茫,本文就这一普遍现象做出了简要的分析,包括压力产生的原因、如何应对这些压力、如何迎接未来的挑战!你的事业做了十

稳定彰显强悍实力,商务办公首选ThinkPad L490

商务本主要面向的人群是职场精英,他们对于产品的稳定性以及数据的安全性都有极高的要求,与此同时为了满足繁杂的办公任务,也需要强劲的性能来保驾护航。全新产品ThinkPadL490采用了英特尔第八代低功耗

商务办公的理想之选,联想ThinkPad L490全面评测

对于职场精英们来说,一台稳定耐用、功能强大的商务本可谓是工作中的必须品,在高端商务本市场中的代表品牌当属ThinkPad,ThinkPad的很多条产品线都可称得上商务本市场中的标杆级产品!不过Thin

我们走访了900名微软员工,为你揭秘全球最大软件公司的代码评审机制

大数据文摘出品来源:michaelagreiler编译:倪倪、钱天培、毅航全球最大的软件公司之一微软拥有约140,000名员工,其中大约44%,即超过60,000名员工,是工程师。Office、Vis

助力“油腻大叔”追梦电竞 Linksys MR9000X无线路由评测

自从大学毕业正式参加工作,打游戏的时间可以说越来越少,曾经的游戏少年已经成为一名熬夜加班改文案,闲暇时间睡个懒觉刷刷抖音的典型“油腻大叔”。没成想转战职场多年后,中国的电竞却迎来了巅峰时刻,在去年英雄

阿里巴巴为什么能抗住90秒100亿?看完这篇你就明白了!

1、概述本文以淘宝作为例子,介绍从一百个并发到千万级并发情况下服务端的架构的演进过程,同时列举出每个演进阶段会遇到的相关技术,让大家对架构的演进有一个整体的认知,文章最后汇总了一些架构设计的原则。2、

连不上 GitHub 的朝鲜,也开发出了人脸识别技术

场景描述:近日,朝鲜媒体《统一的回声》发布刊文,介绍了新开发的自研智能蓝天手机。文章中称,该款手机处理速度快,支持人脸识别和指纹解锁等功能。据朝鲜媒体早前报道,该智能手机的人脸识别功能,是由朝鲜的顶级

Oracle调度作业引起的空间骤增问题处理记录

1、 问题描述接到客户电话告知,说是近期数据库磁盘目录空间增长特别快, 1-2 天就满了。联系客户对数据库进行分析后,发现造成空间急剧增长的原因主要是 job 任务的 trace 文件产生的量太大造成

光看走路就知道你在想什么!AI步态识别情绪系统

大数据文摘出品来源:yellrobot编译:张大笔茹、张秋玥普京走路的样子大家应该都见过,大开大合,每一步都写着霸气,很有战斗民族的特色。但是有一次普京走路却让人感觉好像和平常不一样,步伐有点匆忙,头

10分钟,用TensorFlow.js库,训练一个没有感情的“剪刀石头布”识别器

大数据文摘出品编译:Luciana、小七、宁静“剪刀石头布”是我们小时候经常玩的游戏,日常生活中做一些纠结的决策,有时候也常常使用这种规则得出最后的选择,我们人眼能很轻松地认知这些手势,“石头”呈握拳

自动识别Android不合理的内存分配

写在前面Android开发中我们常常会遇到不合理的内存分配导致的问题,或是频繁GC,或是OOM。按照常规的套路我们需要打开AndroidStudio录制内存分配或者dump内存,然后人工分析,逐个排查

直男福利!手把手教你做一只口红色号识别器,秒变李佳琦

大数据文摘编辑组出品技术实现:宁静 七夕将至,送礼时节。直男送礼,首选口红。毕竟李佳琦一句”OMG买它”,女朋友披头散发抢购,钱包就空了一半。但是,口红色号千千万,选对了牌子才成功了一半。快乐橙、伤心

丰巢刷脸取件被小学生破解,号称3D、深度学习加持的人脸识别究竟靠谱吗?

大数据文摘出品作者:曹培信经费不够,2D来凑?前些天,丰巢智能快递柜被“小学生”用打印照片破解,让人大跌眼镜。据《人民日报》报道,嘉兴上外秀洲外国语学校402班科学小队向都市快报《好奇实验室》报料:他

iOS开发60分钟入门

===============本文面向已有其它语言(如Java,C,PHP,Javascript)编程经验的iOS开发初学者,初衷在于让我的同事一小时内了解如何开始开发iOSApp,学习目标包括: 能

自己撸一个 LaraDock(使用 Docker LNMP 部署 PHP 开发环境)

项目简介 DockerLNMP是基于docker-compose开发的运行在Docker上的LNMP开发环境,包含PHP、MySQL、Redis等镜像并支持多版本切换,满足您的学习、开发和测试需求。

硬核盘点,华为面向开发者的十大技术

随着社会的发展,科技的进步,5G落地、AI爆发、大数据持续突破、云计算已然成为新时代的水电煤。日益增多的新兴技术,为开发者带来机遇的同时也带来了不少挑战。尽管开发者们经常身处历史性事件的前沿,但由于