近日,易观在北京举办了《数据至上VS流量为王,在线教育下半场的创新与挑战》的线下沙龙活动,来自易观数据应用中心、智慧树、新东方和爱思益求职的行业大咖和嘉宾,就2018年在线教育行业发展进行了精彩的观点分享。新东方用户运营中心主任朱兆为,发表了题为《数据驱动学习的前沿探索》的演讲,以下为演讲内容:
为什么有数据驱动学习这个事?以前的中国教育是传统的工业时代,跟现在一样的场景,统一的教室、统一的班级、统一的铃声培养出了应试的人才,因为我是山东人,应试教育培养出来的。其实发现到了现在应试教育培养出来的人才,很难适应现在经济的发展,很多人都在探索未来的教育是怎么样的。
教育的预测上来说,就是我们说专业选手做教育家,种子选手从来没有预测对过,学教育的人或教育家们从来没有预测对过,就是预测科技也是一样的。在我们现在的教育中,是不是都在这样的去做?比如说我们以前在山东,可能是六七十人的一个班,现在基本上都在小班化。你看新东方以前是一个200多人或者更多人大班课的机构,现在逐步的在往小班课去走。另外大班课就是纯粹教灌书的东西,网红的模式。还有一种是小班课,教育是需要孩子参与和互动,因为孩子要和老师之间有PK和互动,和这个也有关系。
大家都想现在不行,教育存在问题,技术去做,然后有很多的人回归到人文,回归到教育的初心。比如说我们不可能再像这两天曝出红黄蓝的事件回归到教育的初心和良心,对于技术领域和想法来说希望对学生有一定的用户画像,你里头真正的实现孔夫子在很久之前说的因材施教,我们用夸张词来说就是学生缺什么补什么,考试考什么学什么,什么层次的学生面,什么层次的题,哪不会验哪儿,这是我们所说的这一部分的东西。
要想构建用户画像,怎么去构建用户画像?用户画像除了核心素养德智体美外的五个维度,最重要的是学业的数据、学业的画像,无外乎要给他进行测评,测评接下来分为两种情况,一种是结果性的测评,也就终结性的考试来去做的,另外一种是作业过程性的数据。可以看无外乎市面上都是走的这两种场景。
下面可能会用5到10分钟讲一下用户画像是怎么构建的,因为很多人都在讲数据怎么去应用,我会分为几个地方。一个数据是怎么构建的,另外在构建中有什么技术和设备能构建这一块,构建了数据以后怎么能够去真正的知道学生的学习,最终实现商业盈利。
我刚才说了过程性的数据、结果性的数据,学生每天经历最多的在中国就是考试,每个学生每年要经历N多的考试,这是一个学生解数学题不会,解不出来,干脆划掉了,划掉以后还不解气,拿个绳把自己吊死算了。数理化把学生给逼死了,解数学题不会,化学上画了一个云,这是一个杠杆。这是真实的现象,现在很多人都在说素质教育。
看今年里的少儿编程很火,那天跟一个人聊天,大家知道少儿编程的用户是哪个年龄阶段吗?他说就只是小学到初二,我就直接告诉他,我在讲的直白一点,五六年级也不怎么学。是,现在线上是什么?应试教育的补充,甚至披着素质教育的外衣做应试教育的一些东西,里头很多家长的心理是什么?一到考试的时候,一到升学的时候,你去学素质教育吧,我的孩子还是去学学校的,真实的现象是这样的。小升初一般来说是不学少儿编程,到了初中升上去了,头两年又可以学一学,一到初三涉及到中考压力又不学了。所以说学生真正解决教育的问题,可能还是在于让他们的学习怎么更有效率,如果他学习更有效率才有时间去做素质教育的事情,这是中国真实的现状,你想脱离这个东西,只能说大家想得很美好,只能恭喜你,然后你想的很美好。中国本身还是一个考试定终身的状况。
对于学生来说,现在还是有三座大山,就是说学校的考试,作业和培训机构里的。我们新东方也是培训机构,新东方叫七步教育法和标准化的教育体系,很多人说新东方是段子手,我们不是了,我们在推行七步教学,七步教学第一步是入门测,进门考试,找出你的问题在哪,推荐给你课程,然后出门考,到后面去和测评相关的测评考。在学校考试,回到家写作文,到培训机构里头呢?因为你要保证他的效果,一定要考试的。另外在可当教育里说,为什么有的学生学习好?还是纠正了学生的学习习惯。我们说里头有三清、四清、五清你们听说过吗?课堂上要做双清,回家学的东西要做日清,每周的东西要做周清,月请,只要保证学习流程了,学习成绩一定会好。孩子成绩出了问题,一方面是孩子知识的问题,更多的是孩子学习习惯的问题,你会发现很多的机构或者是线上的教学效果感到成绩出色的时候,一定是教学的服务流程做的OK、细致。因为教育培训有两种,一种是以提分为目的的,另一种是素质也好,以提升能力为目的,那只要有参与感孩子高兴就OK了,这是我们孩子里残留的问题。
对于老师来说,孩子这么累了,老师也很累。我记得现在的读书比以前好一点,因为现在的老师在培训机构加课还有一点钱,可能没钱了。以前给我们拼命的要加课时,生怕学生没听懂,拼命的发作业、发卷子,生怕没做过,这个本身的原因是什么?老师对学生的状况他是不了解的,他了解的只是班上头部的。尾部的学生说白了,在学校里是没人管你的,然后只要你别闹事就行,爱睡就睡,通常是不管的,这是学校里的真实状况。所以他基本上是不知道的,考试以后效果怎样的缺乏评估。
对于校长们来说,他可能是对学校里的整体教学状况,每个老师的教学状况,这个老师的到底教的怎么样,他和另外的一个老师到底差距在什么地方他是不知道的。本校的学生可能和名校差异到底在哪?你是哪个学科差异,这个学科里的哪个部分有差异是不知道的。因为以前我们说教育和医疗是一样的,教育的老师像老中医一样的越容易吃香,因为很多是凭着有经验的。但是他们没有这些,不知道。有了经验可能慢慢的判断出来。
所以说,整个层面上来说,我们就说里面正在像什么?因材施教,个性化学习来回走,我们说出现了问题怎么去解决它?当时国家层面里头,我是山东潍坊。当时的校长来了北京,首先最开始是在教育部,带了三四十个博士成立了教育部基础质量检测中心,现在好像别的老师在负责。学校里的小班化教学,机构里是一对一,然后小班化,基本上都是这种策略。
大家都在往因材施教和个性化学习方面走。关键是该怎么走。最核心的是要构建一个学科知识树或者是知识图谱,基本上都是这两个,说白了还是贯通的。通常会把知识分三类,一类是你会了的,一类是你从来没会过的,另外一类是待会不会的。有时候学习的过程当中,很多学生的学习是无效的,有的学生是分为两类,天天做,学习很辛苦,然后成绩就不见得提高。为什么?他天天做自己会的题,大家想一想,为什么天天做自己会的题?有成就感,因为能做出来。这真的是这样的状态。
另外一类学生就天天解一道题,解两小时解不出来,解三小时,甚至解一个星期。你这种心理,我小时候也被人洗脑了,当时讲愚公移山,这个精神好。但是从学习上,从方法论上来说这是存在巨大问题的,为什么彻底解不出来?因为知识点有可能是说有这三类,他从来没会过。因为他有一个基础的知识点,他有一个中间层的还不会,你跳到最难级的怎么可能做得了?学生的真正状况是这样的。今天很多是技术派的,我本身是出来当了三年的大学老师,后来在北京读硕士,又开了培训机构,开了培训机构以后,基本上管过三家创业公司,然后自己创过两次业,第一次来到了新东方大集团,我也在经受集团的考验,来了半年了。
再次总结一点是什么?我们获取数据从哪儿来?一种是过程性的数据,一种是结果性的数据。获取的方式上是,要么来说现在最容易做的一个方式是纸质的东西来去获取。另外很多人告诉我是做测评的,但是测评经常会鄙视他做的都是伪测评,得到伪数据,因为他改变了用户的行为习惯。我不知道有没有做网上课程的,做网上课程的为了你好卖怎么办?让他在网页上做一个小测试,你告诉他有病,我的课能治你的病。所以你的测评都是网上留了10个题或者15个题做告诉人一个报告,报告准确度可想而知。
我们说有很多线上学习的东西,实际上是违背了孩子的学习规律,违背了实际的场景,它不符合大数据的原则,大数据里头要自然而然发生的过程。本来比如说线下写作业的非要强让他线上写作业,可能吗?不可能的事。有些作业平台的通常来说小学还OK,到了初中有人用吗?没人用。小学里头老师驱动强一点,这是一个真实的状况。
收集完了数据以后,要给他形成一定的结果,到最后商业上一定要驱动它进行一个解决方案。你要发现人家有病,给人治病的时候,咱们体检的时候有时候不收钱,正规的体检中心是收钱的,你看门口经常测你血压什么的一般不收你的钱,为什么?他是要发现你有病,给你治病的时候收钱。你看里头都是通过测评找到有病,给他提供解决方案,要使你的解决方案真实有效,用户要为此买单。因为以前我也没用互联网的一套,免费入门,留存、转化,我觉得这一套跑了这几年以后发现,因为我们当时A轮也融了很多钱。
教育是没法免费的,提供内容是没有价值的。总结一点,数据怎么来用一张图能够解释市面上基于主流的模型?更多的是基于测评来的。
通常来说,要想实时的获取真实的数据,学校里用的最多的还是纸质的教辅图书和试卷,如果你能够和工具真正结合起来,学校的老师也许会去用。或者是在课堂上,你看我们新东方的课堂是用什么采集学生的数据?你一定要有工具采集下来。获取了学校的数据以后对数据进行分析、加工、挖掘,挖掘以后怎么来实现解决方案,怎么来实现商业价值?目前基本上就这几个流派。
第一种是卖提分方案的,通常是有两个地方,一个是智能测试本,一个是训练。第二个是卖报告,卖学生的学业报告,还有做直播答疑的,我发现测评里的目的就是告诉你我直播答疑或者是混合式学习给你解决这个东西。比如说网易100通过测试做入口。再比如说通过测试来去线上线下解决。新东方里很重要的一个引流的东西是什么?我们叫万人测。在武汉以及南昌几万学生来参加,因为我们抓的是培优,我一测就知道哪个学生好,哪个学生不好,有问题了就报道解读,这样就解决了培训里面对面销售。
数据驱动学习,从学习流程来说分为课前、课中、课后,还在家庭课外做。整个学校流程讲一个发展式的学习,希望课前通过微视频来去进行预习,学生做课前的练习,练习的结果一定要有反馈的数据,有一个学习的模型建立用户的初步画像,有了画像以后,学生在课堂学习的时候,老师的教学方案一个班里不太一样,因为他会,他可能就不太教了。课堂里头的数据能够再次收集起来,每个学生的作业应该还是不一样的,到形成学生这一块再进一步课外去解决它,这就说的是数据,我们要建立不同的用户画像。