我先来阐述一下云计算和大数据是什么东西,这两者目前没有什么确切的官方定义,一下纯为我的经验之谈。 云计算在我看来核心就是X as a Service,也就是说传统IT平台内的任意组件都可以对外提供服务。举个简单的例子,传统IDC内有计算服务,也就是服务器,如果将资源池化之后做成一个个虚拟机,然后以租借的方式租出去,然后按需要收费,这个其实就是所谓的ECS:Elastic Compute Service弹性计算服务,其实就是把服务器当作服务提供了。同样的还有数据库服务、虚拟网络等等。按照服务类别划分的话,大体上承认的也就是IPS as a Service(基础设施,软件服务和平台中间件即服务),对于IaaS,我个人倾向于40%虚拟化+30%存储+30%网络这么个比例;对于PaaS,就是把我们常用的中间件以服务的形式对外提供;对于SaaS,则为云端软件形式对外提供服务,如Office365。 关于大数据呢,一直以来很多人对于大数据和云计算的认知是这俩货在一起(跟客户聊天的时候我就发现了这种认识不在少数),但实际上,大数据平台可以依托于传统IT服务,也可以依托于云服务,这个取决于大数据平台的大小和伸缩性,如果伸缩性很高的话,云IaaS是不错的选择。什么是大数据呢:大数据直观的感受就是数据量大,其实量大不是关键,关键的是大数据中数据量不仅大,而且种类还多,比如传统SQL结构化数据,甚至还有半结构化数据和非结构化数据,大数据平台的作用就是储存、管理、维护这些数据,至于使用的话,是交给大数据平台应用去处理的(比如某动公司的一些系统就用到了Hadoop平台)。再来解释一下Hadoop,Hadoop其实是一个数据处理平台,它里面有若干组件,比如MapReduce作业处理、HBase数据仓库、MQ消息队列、BI Stone等等。 关于大数据和云计算的关系呢,怎么说呢,可以说有关系,也可以说是没关系,这个还是取决于企业业务需求和生产环境的实施和部署,针对具体应用场景采取不同的框架和策略,达到效益最大化。