在过去的几十年里,我们的生活和工作已经发生了翻天覆地的变化,这一切的背后推手正是计算机和互联网,在未来,智能化还将为我们带来无限的便捷。
在网络应用中,我们每个人都在源源不断地产生数据,无论是你在好友的微博上点赞还是进入网上书城购买图书,服务器都会自动记录下你的数据,并且对数据进行分析整合提炼出有价值的那一部分,进而了解你个人的偏好和消费习惯。
对这些海量的数据再进行有组织的分析、运用,并以世界的商业/公用服务、产品信息做基底,从而精准快速地提供全方位帮助信息,一个大数据时代就此而生了。
那么,大数据跟传统的数据又有着怎样的本质差别呢?
首先,大数据是永远在线的,不在线的数据就不能称之为“大数据”。目前,业界对大数据的概念还没有一个统一的界定,一般是指“无法用现有的软件工具提取、储存、搜索、共享、分析和处理的、海量的、复杂的数据集合”。因而大数据必须是随时随地能调用,并且马上被计算的,而不是储存在磁带、U盘等软件工具中的数据。
其次,大数据必须反应迅速及时。我们上天猫搜索一个商品,后台便会自动在数十亿商品中进行筛选,将符合你的要求的产品瞬间呈现。如果要等上一个小时才会出现搜索结果,相信没有用户愿意再上天猫购物。数十亿商品、几百万个卖家、一亿的消费者,瞬间完成匹配呈现,这才能称之为“大数据”。
最后,大数据还有一个特征,就是数据的全面性。大数据不是样本思维,它是一个完整的全面的系统。在现在的互联网时代,我们要的是尽可能全面的数据,而不是数据的某一个样本或抽样。因而也有人将大数据称为全数据。
与传统数据相比,大数据的价值和优势更加凸显,这也是大数据广泛应用的根本原因所在。如今,大数据对我们的生活正在产生广泛影响,但是传统数据并没有退出历史舞台在某些特殊的领域,传统数据发挥的作用还是无可替代的。