数字标牌网 服务热线:400-6787-360 | 投稿邮箱 | 会员登录 | 免费注册 | 设为首页 | 加入收藏 | RSS | 客户服务 | 月刊订阅 | |||
|
![]() |
四个“V”精准概括何为大数据
大数据(Big Data)是近年才出现的IT热词,而且如今跟各种IT人士交流的时候,仿佛不提大数据这个词就跟落伍似的。但是到底什么是大数据?大数据是单指数据量大吗?这可能是很多人会提出的问题。
笔者从百度百科和ZOL存储论坛中查了一些资料,虽然资料很多,但是相似度较大,很多资料生涩令人难懂。笔者在这里希望跟大家交流一下我对大数据学习后的一些总结,希望能让您对云计算有个全新的了解。
首先我们可以从百度百科中查看到大数据的概念:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
通过上面的定义,可能很多人依然不能够彻底的了解大数据,其实业内专家已经将大数据的特点给我们做了形象的描述,简称4个“V”:Volume、Variety、Velocity、Value。
大数据的4个“V”是目前人们形容大数据用到最多也是大家比较公认的大数据特点。这4个“V”从四个层面对大数据进行了比较形象的描述。即更大的容量(Volume,从TB级跃升至PB级,甚至EB级)、更高的多样性(Variety,包括结构化、半结构化和非结构化数据),以及更快的生成速度(Velocity)。前面三个“V”的组合推动了第四个因素——价值(Value)。
这四个“V”让用户能够更形象的了解大数据。我们可以看出大数据不但有型(数据大),而且更有财(数据价值),四个“V”虽然看起来简单、易懂 ,但却又是对大数据的一个总体的阐述,这4个“V”的相互作用才形成了如今的大数据。
读了这些内容,网友有可能会问,大数据为什么受到这么多的关注?怎么可以说大数据是IT界发展的潜力股呢?请看下文:
大数据数量大但还拥有大的价值
爆炸式增长 大数据到底有多大?
随着移动计算的发展,如今的数据呈现爆炸式的增长,但是是大数据到底有多大呢?或者是多大的数据才能被称为大数据呢?
数据呈现爆炸式增加,我们熟知的G(1G=1千兆,即2的30次方字节)和T(即1千G)已经不能衡量存储的数据,如今PB,EB甚至ZB等更多的容量单位已经出现。举例:百度首页每天就要从超过1.5PB的数据中进行挖掘,这些容量的数据如果打印出来的就将超过5千亿张A4的纸,全部摞起来的话就要超过4万公里高,接近地球的同步卫星轨道,平铺可以铺满海南岛。
到2012年年底,全球数据总量将达到2.7ZB,到2015年将达到8ZB,而这种增长的趋势并不是递增的方式,而是爆炸式增长。据麦肯锡预测,到2020年全球数据使用量要暴增44倍(不是生产量,而是使用量)达到35.2ZB。只需两天就能创造出自文明诞生以来到2003年所产生的数据总量,这是一个多么大的数据。
数据是资源 大数据的价值有多大?
很多人通常会认为大数据就是只数量很大的数据,如果单纯的用数量大来形容大数据是并不确切的,前面的4个“V”已经非常形象的描述的什么是大数据。数量大只是之中的一个元素,而最核心的依然是价值。
能够发掘价值的数据才拥有意义,数据就像我们的资源,如空气、水、石油和煤炭一样。我们能够从这些资源中获取我们需要的“养分”,也就是我们需要发掘大数据的价值,这样的大数据才拥有意义。我们需要从数据资源中发掘我们的价值来为我们服务。
利用大数据发现价值的案例如今已经屡见不鲜,沃尔玛等零售商通过对销售额、定价以及经济学、人口统计学和天气数据进行分析,藉此在特定的连锁店中选择合适的上架产品,并基于这些分析来判定商品减价的时机。京东商城,通过对客户的浏览页面以及购买情况,来锁定用户的喜好和关注点进行产品的推荐,等等,这些都是利用大数据来实现商业价值的典型案例。
编辑点评:大数据并不仅是只是容量大的数据,大数据还拥有大价值,而且这已经是业内公认的事实。大数据时代的来临,其让整个IT产业和整个社会的商业模式正在发生的巨大的变化,接下来我们来看下大数据所引领的变革!
大数据挑战基础平台与商业模式
大数据时代临近,企业数据呈现爆炸式增长,如何为了更大的发掘企业数据价值将是很多公司必须要面对的挑战。首当其冲的是大数据的快速发展对我们原有的IT基础设施提供了更高的挑战,原有的IT基础设施以及很难满足大数据时代的需求。发现价值的过程离不开基础平台技术的创新与发展。
基础平台的改变
首先大数据挑战的就是企业的存储系统,大数据爆炸式的增长使得存储系统的容量、扩展能力、传输瓶颈等方面都面临着挑战。与之相连的还有服务器的计算能力,内存的存储能力等等都面临着新的技术攻关。目前闪存技术的发展以及英特尔、IBM等公司在大数据方面都已经投入相当大的资金进行研发,主要也是为了解决大数据对基础平台所带来的挑战。
同样,大数据分析同样面临着软件方面的挑战,同时也引发数据库、数据仓库、数据挖掘、商业智能、人工智能、内容/知识管理等领域的技术变革。Hadoop是近年大家经常提到了一个能够对大量数据进行分布式处理的软件框架,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。
商业模式的挑战
大数据具有强大的数据价值,当我们可以利用大数据挖掘到需要信息的时候,则需要我们根据得到的信息对企业的商业模型、产品和服务等方面进行创新,这样才能够真正的让大数据的价值得到体现。
如何利用大数据信息来改变商业模式最终实现价值呢,这里我们引用Tesco为案例。Tesco收集了海量的顾客数据,并且通过对每位顾客海量数据的分析,Tesco对每位顾客的信用程度和相关风险都会有一个极为准确的评估。在这个基础上,Tesco推出了自己的信用卡,未来Tesco还有野心推出自己的存款服务。
编辑点评:谈到这里,可能大部分人已经对云计算有了初步的了解,但也有可能又要问,大数据真的那么好吗?其没有发展上的存在的一些问题?下面我们就来谈一下大数据在发展上遇到的一些问题!
隐私成为大数据亟待解决的问题
大数据分析能够帮用户发掘他们的价值,从而使其在市场竞争中处于更有利的地位,同时提升他们的市场生命力,但其在发展过程中仍有需要解决的问题,依然存在着这样那样的问题,在这些问题中我们不得不提其在隐私方面的问题。
隐私问题是大数据亟待解决的问题
大数据挖掘不但可以挖掘数字信息,同样还能够挖掘图像、文本、视频等等,如今我们甚至能够通过数据挖掘了解一个人的整天的行动,甚至能够预判一个即将要做的事情。但当我们的数据挖掘关系到公民的生活问题时就会遇到一个问题,那就是隐私。
隐私是目前很多人都关注的问题,如今,电话推销的人几乎天天都有,这就是我们隐私被透露的结果。甚至有的犯罪分子利用从即时通讯上得到的信息,冒充孩子的家长来实施犯罪,这些都是我们需要解决的问题。
那么目前对个人隐私数据方面的保护如何呢?有,但是目前扔不完善。有的时候我们虽然将注册信息设为不公开,但是仍然会接到各种骚扰电话。所以在这方面的保护并不完善,这主要是背后一个庞大的利益集团在驱动。而且现在相关的法律法规并不完善,让个人信息在大数据时代泄露的时间比比皆是。
法律框架的搭建远远赶不上新技术的发展,各国对个人隐私也界定不一,为此Facebook还专门设立了首席隐私官这个职位。但是目前的措施并不能够完全保护个人隐私的安全,个人在大数据时代似乎总是站在被分析的地位。隐私问题是大数据亟待解决的问题。
文章总结:大数据时代的来临已经成为行业的共识,如何更好分发掘大数据这块“蛋糕”将是我们必须要考虑的事情,大数据不但影响着整个IT行业的发展,同样影响着企业商业模式。如何了利用好大数据将是决定企业未来走向的关键要素。