新闻动态

大数据驱动的教育变革:从线下到线上、从人工到智能

2019-08-26 17:50:27 53

刘淇,中国科学技术大学计算机学院副教授、博士生导师, CCF大数据专家委员会委员,CAAI机器学习专委会委员、中科院青促会优秀会员。主要研究数据挖掘与知识发现、机器学习方法及其应用。

教育的发展历程

从古至今,时代的变革往往会伴随着教育发展的重大变化。当下时代,随着人类社会信息化进程的不断深入,教育教学方式从依赖于黑板和纸笔的经验模仿教学范式逐渐转变为计算辅助教学范式。通过综合应用计算机、互联网等各种新兴技术,计算辅助教学使得教学内容与教学媒介更加丰富。例如,多媒体课件早已大范围普及我国的课堂教育,各类网络教育、远程教育也极大地方便了人们学习的过程。然而,在计算辅助教学范式下的中国教育,尤其是基础教育仍然存在诸多痛点,优质教师依然匮乏、教育资源越来越不均衡、学生学习压力较大却效率低下等问题依然是当前教育发展的重要问题,亟需借助更先进的思想和技术进行解决。

近年来,信息技术革命与经济社会发展的交融,带来了数据爆炸式增长。海量数据的收集和积累,在诸如金融、电子商务、军事、医疗、交通、气象、教育等行业领域均发挥了重要的作用,使得大数据从“概念”走向“价值”。现如今,基于大数据分析技术的智能化服务系统极大地便利了人们的日常生活,分析大数据已经成为科研的核心任务,解读大数据已经成为决策的基本依据,应用大数据成为民生的重要助力。

特别是在教育行业领域,大数据为教育信息化、智能化注入了新的活力。其中,教育大数据是指整个教育活动过程中所产生的以及根据教育需要所采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。事实上,我国有非常好的教育大数据基础,据《2016年全国教育事业发展公报》显示,我国有超过51万所学校而且绝大部分都实现了互联网接入,拥有大于2.6亿的学生,在线教育用户超过1.4亿,数字化校园系统、在线学习平台以及智能教辅系统层出不穷,产生了大量的教育数据。在大数据的驱动下,教育发展正在迎来新的变革,2017年发布的《中国基础教育大数据发展蓝皮书》认为,教育在大数据技术与理念的冲击下正在发生一场“静悄悄的革命”。即,从计算辅助教学范式走向数据驱动教学范式。

相比较而言,数据驱动的教学范式具有“高效率”、“有智慧”、“产业化”等优点:1)利用教育大数据,可以模拟优质老师做出决策,实现优质师资的快速、规模化“复制”。利用大数据技术进行资源收集存储、协同管理、开放获取,可以自动、高效地对教育资源进行整合;2)通过对学生的性格、综合能力、知识状态等特征进行诊断量化,实现深度、全面的学生精准画像,进而提供千人千面的个性化、自适应智能教育,真正实现“因材施教”;3)有效协调教育各类资源,实现智能教育智能服应用的实际落地,为教育产业化的商业模式提供了可能,使得教育发展形成了良性闭环。与此同时,我国各级政府和部门也十分重视,把大数据驱动的智慧教育作为国家信息化战略的重要组成部分。国务院印发的《新一代人工智能发展规划》中强调:要加快智能教育建设,利用智能技术加快推动人才培养模式、教学方法改革,构建包含智能学习、交互式学习的新型教育体系。在此背景下,教育正在渐渐从线下走向线上,从人工走向智能。

大数据驱动的智慧教育

大数据驱动的智慧教育已经初步运用在教育领域的多个方面。对于教学者而言,可以帮助调整教学方案、打造精准教学;对于学习者来说,可以帮助制定个性化学习计划、选择学习路径;同时,智慧教育也可以运用到教学媒介与产品中,如教育机器人、智能教育平台等。可以说,教育大数据分析研究已经渗透至教育领域的各个环节,发挥着重要的作用。参考学者们的已有分类,从教、学、考、评、管这五个方面简要介绍智慧教育的研究进展情况。

在“教”方面,主要研究如何提升教学方式与质量,从而更有效的给学生教学,包括基于深度学习技术的智能搜题、基于深度增强学习的智能解题、基于脑科学的智能辅助学习系统以及针对不同教学情境和教学对象的个性化教学设计方案生成等。在“学”方面,主要针对于如何深度理解和掌握学生的行为以及给学生推荐个性化的学习内容,例如在MOOC上研究学生的学习行为预测、基于深度学习的行为轨迹模式挖掘以及个性化学习内容、学习路径推荐等。在“考”方面,试题作为衡量学生学习水平、检验学生学习成果的工具,包含有大量的可挖掘信息,目前,主要研究关注于试题知识点的自动标注、试题的难度预测以及试题的自动生成、智能组卷,智能批改等。对于老师和学生更好的理解试题、使用试题非常有帮助。在“评”方面,智能评测是重要的研究方向。其中,知识与能力结构的智能化表征与学生静态、动态的认知诊断,生成个性化的认知诊断报告,可以帮助学生更好的认知自己的学习情况。同时,研究对教师的多维知识界定,衡量教师专业能力的评估,形成精准的教研评价也是目前的研究热点。在“管”方面,基于教育大数据可以生成各种管理平台,辅助学校以及机构完成各方面的管理,例如电子科技大学开发了校园大数据分析决策平台,中国科学技术大学也通过行为预测来挖掘贫困生,形成了“隐形补助”体系。

近年来,我们团队针对智慧教育诸多场景中都涉及的学生认知水平“不可见”、教育资源“不可比”、教育推荐结果“难评价”等关键科学问题,着重从学生认知水平建模、教育资源深度表征与分析、以及个性化学习推荐等方面开展了技术攻关,取得了一系列研究成果(研究框架如图1所示),代表性论文发表在人工智能、数据挖掘领域的重要国际会议和期刊,如IJCAI2015、AAAI 2017、AAAI 2018、KDD 2018、KDD 2019和ACM TIST。例如,提出了结合注意力机制的教育资源深度表征框架,它不仅利用深度表征思想实现了异构资源各部分内容(如文本、图像)的统一建模,而且设计了注意力机制自动学习信息资源的内部序列关系(如文本的语义关系)并识别出与所预测的属性最为相关的内容,在试题资源“难易度”属性自动标注任务中,通过与教育专家的人工标注进行比较,深度表征框架不仅提高将近25%的标注精度,而且还能为试题找到关键语句,提升标注结果的可解释性。

 总结与展望

从工业化时代的模仿经验教学范式到信息化时代的计算辅助教学范式再到数据驱动的教学范式,教育不断发生着变革,逐渐从线下走向线上、从人工走向智能、从千人一面的“照本宣科”走向千人千面的“因材施教”。无论是在日常教学还是各类考试等,大数据分析驱动的智慧教育都取得了很多令人惊叹的研究和应用成果。然而我们仍然要看到,在智慧教育的发展过程中,仍然面临诸多需要解决的问题,例如:(1)现阶段教育大数据分析技术研究多集中于单学科(如数学等结构化学科和英语、语文等语言学科)以及单学段(如初高中学段)。在其它学科(如物理、化学)上的数据理解困难。同时在其它学段(如幼儿)的数据收集困难,因此,将教育大数据分析技术推广到全学科、全学段,服务更广泛的老师与学生仍有待于基础条件、理论方法等的突破;(2)在智慧教育的应用中,一个核心的问题是如何增强智能服务的可解释性。例如,对于学生而言,试题答错了,学生更想知道为什么答错,以及如何学习能够掌握相应的知识。同时,对于老师而言,很想了解自己的教学方式有哪些地方需要改善,以及如何改善。目前,基于大数据的智慧教育研究在可解释性的方面还涉及较少,需要我们更进一步的研究;(3)数学、物理等学科均对逻辑能力要求很高,要使教育服务更具有智慧,必需从数据中抽取教育知识、进行融合与关联,实现类人智能的知识理解与逻辑推理,即实现从数据驱动到知识驱动的跨越。这就涉及如何从多源异构数据中提炼教育知识、如何构建知识库并实现逻辑推理、如何基于知识库与推理完成决策等一系列关键问题。

总之,在大数据和人工智能的浪潮下,智慧教育正在不断发展,不断快速变革,教育领域涉及的各种问题正在渐渐被解决。在教育变革的风口下,需要我们有发展的眼光、过硬的技术、交叉创新的思维以及坚定的决心,才能砥砺奋进,不断前行。