大数据(big data),大在哪里,它和传统数据又有何区别,在教育领域有何应用?

大数据:也称巨量资料,指的是所涉及的资料量规模巨大,其产生背景是随着当前网络技术及智能设备的普及,使数据产生极其便利。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式

但大数据技术并不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。或者说是从各种各样类型的数据中,快速获得有价值信息的能力。

原始的数据信息并没有利用价值,或价值利用度很底,因此需要——快捷的选择、关联和处理加工技术,大数据技术可能更指这种数据处理技术

一、大数据及其特点:

1,Volume(大量)

数量级别从TB级别,跃升到PB级别,数据产生的类型、维度与传统的结构化数据采集有了质的不同。对于一个人的传统数据描述可能是姓名、身高、体重等标准化数据,大数据背景下是关于一个人的全面信息。

        1 Byte = 8 bit
1 KB = 1,024 Bytes
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB
1 TB = 1,024 GB = 1,048,576 MB
1 PB = 1,024 TB = 1,048,576 GB
1 EB = 1,024 PB = 1,048,576 TB
1 ZB = 1,024 EB = 1,048,576 PB
1 YB = 1,024 ZB = 1,048,576 EB
1 BB = 1,024 YB = 1,048,576 ZB
1 NB = 1,024 BB = 1,048,576 YB

        1 DB = 1,024 NB = 1,048,576 BB

2,Velocity(高速)

包括数据产生以及传输处理的速度。

3,Variety(多样)

数据类型繁多,包括传统的文本、图像声音以及各种设备载体的稳定信息类型,如网络日志、地理位置、物联网传感器获取对象的实时运行信息等等。

4,Veracity(精确)

一张试卷,它带给我们的数据是什么?可以是简简单单的一个 92 分,但如果我们拥有足够的技术与耐心,我们还可以得到许多充满想象力的数据:可以是每一大题的得分,每一小题的得分,每一题选择了什么选项,每一题花了多少时间,是否修改过选项,做题的顺序有没有跳跃,什么时候翻卷子,有没有时间进行检查,检查了哪些题目,涂改了哪些题目……等等,这些信息远远比一个 92 分要来的有价值得多。不单是考试,课堂、课程、师生互动的各个环节都渗透了这些大数据。

二、大数据利用的关键技术

如何利用信息技术等手段处理非结构化和半结构化数据
如何探索大数据复杂性、不确定性特征描述的刻画方法及大数据的系统建模
数据异构性与决策异构性的关系对大数据知识发现与管理决策的影响

三、大数据技术在教育中的应用

1,让所有社会科学领域能够借由前沿技术的发展从宏观群体走向微观个体,让跟踪每一人的数据成为了可能,从而让研究“人性”成为了可能。而对于教育研究者来说,我们将比任何时候都更按近发现真正的学生。

传统数据诠释宏观、整体的教育状况,用于影响教育政策决策;大数据可以分析微观、个体的学生与课堂状况,用于调整教育行为与实现个性化教育。

你现在上网的时候,有没有发现,这些网站正在变得越来越了解你?比如淘宝网,它会根据你买过一些什么,浏览过一些什么商品,来判断你还有可能购买一些什么。比如新浪微博,它会根据你关注了哪些人来判断你还可能对哪些人感兴趣。这种技术实质上是通过数据的归类与分析,来预测“出现某种行为的人还很有可能出现另种行为”。

如果这样的技术能够应用在作业上,会是怎样呢?比如A同学做对了第4题,系统马上可以告诉他,他可以跳过第7题和第9题,这是因为,做对第4 题的学生几乎不可能做错第7题与第9题,做这些题目是简单重复浪费时间。如果B同学做错了第 5 题,那么系统也会提示他继续练习第 6 ,第 9 题,这是因为数据显示,做错第 5 题的人很可能做错后两题,这个知识点是该学生需要反复进行操练与巩固的。这样的应用,对于我们实现个性化教育有何启示?

2,信息真实性的凸显,让信息从可疑到可信,使研究者能够真正获悉真实的情况。

比如调研学生课外运动的时间,我们最通常的做法是设计一个问卷,问他“本学期平均每周参加课外运动的时间,A、l 小时以下,B、1-1.5 小时,C、1 .5-2 小时,D、 2小时以上”,且不论选项的设计是否能体现区分度,我们自己又能否比较准确地估算出自己一个学期里平均每周参加多少运动呢?
经常上微博的人也许会关注SOHO中国的总裁潘石屹,他每天早上都会发微博“今天早上我跑了几点几公里”。他的数据是可信的吗?我相信是非常准确的。为什么呢?因为他随身携带的手机上有这样个 App ,能够记录他跑了多少公里,花了多少时间,甚至跑步的路线也能记载下来。

3,思维路径的改变——从演绎转向归纳,在“去经验”的过程中找到真正重要的教育影响因素。

一个经典案例:作为一个笔记本电脑销售门店的主管,哪些方法可以帮助提高销额呢?有许多专家、专业人士会给出建议,比如提高库存管理的能力,提供员工更多专业培训,做更新更炫的广告,或者搞一些促销活动。这些方式当然都会很有效,分别能够提高 2%-9%左右的销售额。但是,历来讲求创新的苹果公司偏偏不信这个邪,而是将门店中所有能够收集到的数据,不管看上去是不是有关联,全都输入了软件。最后发现了一个惊人的现象,电脑屏幕和桌子呈70度角左右的电脑销售量比其他电脑高出15%,比其他任何经验式的建议更有效。这是为什么呢?因为当我们走到一个70度角的电脑前,总觉得反光非常地不舒服,而当人觉得电脑屏幕反光不舒服,很自然而然地会伸手去扳动屏幕。心理学理论告诉我们,一旦潜在客户与货物发生了肢体按触,他购买这个商品的可能性就上升了15%。

教育技术研究对大数据也比较关注的,现在可以看到一篇文章:基于大数据的教育技术研究新范式,单击下载此文章