您的位置: 首页>> 教育文萃
大数据:寻找教育中隐藏的智慧
来源(作者):区域教育研究中心 发布时间:2017-07-04 11:52:53

  张生

  目前,教育大数据和深度学习炙手可热。然而教育大数据由于涉及到教育的各个要素,存在跨专业等复合型人才,需要不同领域的专家协同,需要教学原有体系发生变化等诸多影响因素,尤其还存在过程性数据的采集、自然语言处理、教育心理参与不够,以及深度学习人才匮乏等诸多困难,在教育实践中尚未发挥到最大价值,需要进行更多的探索。

  教育大数据是挖掘大千世界中的小数据

  教育大数据是在教育生态系统中寻找、挖掘隐含教育发展规律、学生身心发展规律等,从思维方式、技术内容到结果应用的整套解决方案,也是从教育的全样本、全过程的教育大数据中挖掘形成教育智慧这个小数据的过程。

  教育大数据分为个体教育大数据、课程教育大数据、班级教育大数据、学校教育大数据、区域教育大数据、国家教育大数据等六种,它们从下向上、从小到大逐级汇聚。有三层含义:第一层含义,教育大数据是教育领域的大数据,是面向特定教育主体的多类型、多维度、多形态的数据集合;第二,教育大数据是面向教育全过程的数据,通过数据挖掘和学习分析支持教育决策和个性化学习;第三,教育大数据是一种分布式计算架构方式,通过数据共享的各种支持技术达到共建共享的目的。

  总之,教育大数据首先是一种思维方式,即让数据开口说话,让数据背后的规律、智慧成为人类在教育领域思考问题、做出决策的基本出发点。其次,教育大数据也是一种数据处理技术和能力,即从海量复杂的教育数据中寻找有意义关联、挖掘事物变化规律、准确预测教育发展趋势的能力。最后,教育大数据更是一种生产力,结合深度学习等构建教育的人工智能,从单个领域向多个领域覆盖的过程,直接影响人与工具的关系,也决定了未来教育的目标。

  对真实性、表现型、发展性数据的挖掘

  教育大数据的重点是要求数据是真实客观的,它是来自学生学习过程,是学生学习过程中的表现,体现的是学生素养和能力的发展的非结构化数据,而非一般的为了收集学生发展状况而专门采集的结构化数据的挖掘与分析。

  随着“AI+”时代的来临,人类的生活生产方式发生了重大变化,人类赖以生存的知识和技能以及某些单一领域的创新已经被人工智能所取代,呼唤复合创新能力等培养学生高层思维能力的新工具、新模式新方法,高级思维能力的培养与评价更加关注教育的过程而非结果。我们应当把关注点由教育成果迁移到教育过程从而为教育系统带来变革,需要我们对教育大数据进行深度挖掘后有效使用。

  具体就教育变革而言,大数据技术可以对海量管理数据、教学数据及学生学习行为数据进行深度挖掘、分析与预测,以“互联网+志愿填报”为例,大数据可以帮助学生做出明智选择,即基于大数据来提高填报志愿精准度已经成为一种趋势,关键就在于其分析的科学性和精准性。

  比如,升学e网通就从这两点上充分利用了大数据分析的优势,得出有效的预判,从而帮助考生在志愿填报时进行科学选择。拿2016年高考举例来说,浙江一名理科考生高考成绩529分,剔除自选模块31分,实际有效成绩498分,当年浙江第二批分数线为429分。作为理科生来说学生自己倾向于选择通信工程、环境科学、计算机等理科热门专业,但是最后该学生被浙江工业大学之江学院广告专业录取,今年上大二的她这样说道:“读这个适合自己的专业感觉一份学费学到了好多东西!”

  该学生填报志愿的第一步,是利用平台的升学专业测评系统,科学专业地帮助她清晰认知自己的性格特征、职业兴趣、专业兴趣,测评结果显示该学生是理想主义者气质,专业和职业兴趣全部是法学类、语言类、新闻传播类等文科类专业。随后又测出学生在文字和绘画方面的优势以及她自己的喜好,进一步确定了学生的适合且能够发挥优势的专业。

  专业大致确认之后,在升学e网通全面完整的院校、专业的历年大数据库中,根据该学生的名次在系统内按位次法以及按专业两种主要查询方式,筛选出她这个位次学生历年的去向,再结合按专业查询所得的结果框定了合适的几所备选院校。通过清晰明了的统计图表,了解院校、专业录取情况,以及全国各省份的本科录取人数、录取率等大数据,包括院校库、专业库、职业库三大库。院校库涵盖了全国近3000所本专科院校的详细信息;专业库涵盖本专科31个学科大类1300余个专业具体信息;职业库涵盖近1000种职业的信息资源,学生能够全面地比较,正是这些“库”里的大数据帮助学生做出了明智的选择。

  大数据在教育评价中的创新应用

  教育大数据助力国家大规模表现型评价。2016年5月,教育部基础教育质量监测中心在音乐表现型测评上开创了先例,真正实现了表现型评价的大规模应用,覆盖了全国31个省、直辖市、自治区以及新疆建设兵团,参加演唱测试的学校近万所,有近5万学生参加此次演唱测试的数据采集,总回收音频数据近10万条。科学的音乐监测指标和工具通过专业的音乐演唱测试平台、结合专用演唱测试设备进行学生音乐演唱数据的电子化采集、存储及回收,并在此基础上利用智能语音识别与分析技术、机器学习技术等人工智能算法对学生的演唱数据进行机器自动评分,机器评分的准确性达到了专业评委的水平,开创了我国对学生的音乐表现性水平进行监测评价的先例。在此基础上,又将大数据技术,机器学习技术应用到了中文作文的自动评分,以及对教师、校长的问卷调查的作答过程数据进行挖掘,国家监测评价从评价工具、评价方法、评价的技术等多个过程进行不断创新。

  教育大数据助力学生学习过程数据的挖掘。以教客网·数字学伴互动网络学习社区为例,这是一个教育型SNS平台,学生通过注册开设个人空间。截至2017年6月13日网站访问量1843万,积累了5万多篇个人日志,近60万条小作文,成为辽宁、甘肃、四川等地多个学校上千个班级师生开展学习活动的重要联通平台,也因此积累了大量中小学生创作的语言素材以及互联网操作行为数据。

  我们正与英国剑桥大学心理测量中心、北京师范大学心理学院、脑科学、心理健康、教育测量等专家,如刘红云、骆方、薛贵和中山大学大数据分析专家胡延庆教授等合作,对教客网上的数据进行多维度分析,也有了很多发现。对于学生人际关系的画像可以及时发现每个学生偏离共性的发展特点,建立异常情况预警机制;网络学习空间不仅为班内同学之间的沟通提供了一个虚拟的平台,同时一定程度上也起到了弱连接的作用,促进了信息在不同群体之间的传播。

  总之,无论是大规模的国家评价,如高考和基础教育质量监测,还是对过程性数据的研究,大数据已经变得不可或缺,在评价、教育变革的多个环节和阶段将发挥越来越重要的作用。(作者张生,系中国教育技术协会教育测量与评价专业委员会常务副会长)

Copyright @ 2012-2012 区域教育发展研究中心 版权所有