大数据与云盘算相辅相成
- 时间:2013-11-18
- 泉源:
888集团6008(泉源:CIO时代网 作者:不详)
大数据的价值最先日益受到重视,人们对数据处置惩罚的实时性和有用性的要求也在一直提高。现在对大数据的应用己经不局限于BI(商业智能)领域,在公共服务、科学研究等各方面,大数据也都在施展着重大的影响力,并且应用面要宽得多。好比美国国家海洋和大气管理局实验使用大数据要领协助举行天气、生态系统、天气和商业方面的研究一谷歌流感趋势则使用经由汇总的谷歌搜索数据来估测流感疫情。数据无疑已经成为信息社会日益主要的资源。
大数据的意义并不在于大容量、多样性等特征,而在于我们怎样对数据举行管理和剖析,以及因此而掘客出的价值。若是在剖析处置惩罚上缺少响应的手艺支持,大数据的价值将无从谈起。
详细到企业而言,处于大数据时代的谋划决议历程已经具备了显着的数据驱动特点,这种特点给企业的IT系统带来的是海量待处置惩罚的历史数据、重大的数学统计和剖析模子、数据之间的强关联性以及频仍的数据更新爆发的重新评估等挑战。这就要求底层的数据支持平台具备强盛的通讯(数据流动和交流)能力、存储(数据保有)能力以及盘算(数据处置惩罚)能力,从而包管海量的用户会见、高效的数据收罗和处置惩罚、多模式数据的准确实时共享以及面临需求转变的快速响应。
古板的处置惩罚和剖析手艺在这些需求眼前最先遭遇瓶颈,而云盘算的泛起,不但为我们提供了一种挖掘大数据价值使其得以凸显的工具,也使大数据的应用具有了更多可能性。
云盘算包括两方面的内容;服务清静台,以是云盘算既是商业模式,也是计荞模式。好比美国加州大学伯克利分校在一篇关于云盘算的报告中,就以为云盘算既指在互联网上以服务形式提供的应用。也指在数据中心里提供这些服务的硬件和软件。
就现在手艺生长来看,云盘算以数据为中心,以虚拟化手艺为手段来整合服务器、存储、网络、应用等在内的种种资源,并使用SOA架构为用户提供清静、可靠、便捷的种种应用数据服务;它完成了系统架构从组件走向层级然后走向资源池的历程,实现IT系统差别平台(硬件、系统和应用)层面的“通用”化,突破物理装备障碍,抵达集中管理、动态调配和按需使用的目的。
借助“云”的力量,可以实现对多名堂、多模式的大数据的统一管理、高效流通和实时剖析,挖掘大数据的价值,施展大数据的真正意义。
大数据敌手艺提出高要求
大数据处置惩罚首先是获取和纪录数据;其次是完成数据的抽取、清洁和标注以及数据的整合、群集和表达等主要的预处置惩罚或处置惩罚(取决于现实问题)事情;再次需要一个完整的数据剖析办法,通常包括数据过滤、数据摘要、数据分类或聚类等预处置惩罚过权最后进入剖析阶段,在这个阶段,种种算法和盘算工具会施加到数据上,以求能获得剖析者想要看到的或者可以举行诠释的效果。
涉及到重大的数据量,这一整套处置惩罚流程在各个差别阶段都会对古板的手艺手段提出挑战。好比,海量的网络化装备、海量的在线用户、不中止的网络联接,都在时刻天生大宗的、多名堂的内容数据和状态信息,这些经由种种客户端(网页、应用或是传感器等)收罗而来的信息数据,连同成千上万的会见和操作请求,会以高并发的方法向系统服务器施加压力。
通常为了阻止由于服务能力的缺乏而造成服务请求排队的问题,会来用负载平衡手艺将单个服务器的压力举行分摊,大幅提高服务性能;在数据收罗时,也会通过在收罗端安排大宗的数据库来对系统性能提供支持,然后对收罗到的数据(包括种种结构化、非结构化和半结构化数据等)举行数据整理、去重、正规化以及响应的名堂转换处置惩罚。在凭证预定规则举行过滤后,输出到漫衍式数据存储系统中举行存储,为之后的剖析和展示做准备。
在剖析阶段,为了完成数据挖掘的目的,通常需要处置惩罚海量的历史数据,构建重大的数学统计和剖析模子(好比盘算冬天的气温水平对特定厚度的羽绒服销量的影响),并针对大宗的效果之间的关联性做出高效准确的处置惩罚,同时还要支持数据更新带来的重新评估;而在展示阶段,则应当隐藏诸如数据存储拓扑和数据存储结构等实现细节,对营业应用袒露规范的数据会见接口,对重大的数据会见需求提供透明支持,大大减小营业应用的构建难度。
这些重大的需求敌手艺实现和底层盘算资源提出了高要求。以是,为应对这些重大的大数据处置惩罚事情,需要从服务器、网络、存储、软件等各个环节构建一个兼具高可用性和高可靠性的系统情形,提供端到端的周全解决计划。
大数据与云盘算相辅相成
古板的单机处置惩罚模式不但本钱越来越高,并且不易扩展,并且随着数据量的递增、数据处置惩罚重漂后的增添,响应的性能和扩展瓶颈将会越来越大。在这种情形下,云盘算所具备的弹性伸缩和动态调配、资源的虚拟化和系统的透明性、支持多租户、支持按量计费或按需使用,以及绿色节能等基本要素正好契合了新型大数据处置惩罚手艺的需求;而以云盘算为典范代表的新一代盘算模式,以及云盘算平台这种支持一切上层应用服务的底层基础架构,以其高可靠性、更强的处置惩罚能力和更大的存储空间、可平滑迁徙、可弹性伸缩、对用户的透明性以及可统一管理和调理等特征,正在成为解决大数据问题的未来盘算手艺生长的主要偏向。
基于云盘算手艺构建的大数据平台,能够提供聚合大规模漫衍式系统中离散的通讯、存储和处置惩罚能力,并以无邪、可靠、透明的形式提供应上层平台和应用。它同时还提供针对海量多名堂、多模式数据的跨系统、跨平台、跨应用的统一管理手段和高可用、迅速响应的机制系统来支持快速转变的功效目的、系统情形和应用设置。
好比在基于云盘算平台而构建的新型企业信息系统中,在以漫衍式集群手艺构建高性能、高延展的存储平台之后,我们可以实现对差别营业应用中差别名堂、差别会见模式的海量数据的统一存储,相关的数据剖析系统则构建于漫衍式事情流和调理系统框架之上,接纳漫衍式盘算手段面向多模式海量数据提供数据的转换、关联、提取、聚合和数据挖掘等功效。在企业信息系统中经常提到的BI的详细营业功效,好比决议支持、销售展望等,就可以由上层营业应用通过挪用数据剖析系统所提供的功效附加营业逻辑来实现。
云盘算使大数据应用成为可能;没有云盘算的泛起,大数据将仍是蜃楼海市,缺乏基本和落地可能。借助云盘算手艺,可以提高系统整体的弹性和无邪性,降低管理本钱和危害,并且刷新应用服务的可用性和可靠性;云盘算不但为大数据处置惩罚打造一个高效、可靠的系统情形,并且充分验展云盘算平台的优势,为大数据应用找到更多样化的出口。
若是说大数据是一座蕴含重大价值的矿藏,云盘算则可以被看作是采矿作业的得力工具;没有云盘算的处置惩罚能力,大数据的信息沉淀再富厚,或许也只能望洋兴叹,入宝山而空手回;但从另外的角度说,云盘算也是为相识决大数据等“大”问题生长而来的手艺趋势,没有大数据的信息沉淀,云盘算的功用将得不到完全施展。因此,从整体上看,大数据与云盘算是相辅相成的。
下一篇:信息缭乱不堪 清静问题越发棘手