分布式云的研究进展综述

作者:张晓丽;杨家海;孙晓晴;吴建平; 刊名:软件学报 上传者:张云华

【摘要】云计算作为全新的计算模式,将数据中心的资源包括计算、存储等基础设施资源通过虚拟化技术以服务的形式交付给用户,使得用户可以通过互联网按需访问云内计算资源来运行应用.为面向用户提供更好的服务,分布式云跨区域联合多个云站点,创建巨大的资源池,同时利用地理分布优势改善服务质量.近年来,分布式云的研究逐渐成为学术界和工业界的热点.围绕分布式云系统中研究的基本问题,介绍了国际、国内的研究现状,包括分布式云系统的架构设计、资源调度与性能优化策略和云安全方案等,并展望分布式云的发展趋势.

全文阅读

云计算(cloud computing)是指数据中心(data center)通过互联网将应用(application)、系统软件和硬件作为服务提供给用户的新型的计算模式.近年来,云计算得到了迅猛的发展,越来越多的公司(应用服务提供商)倾向于将其应用部署在云系统中.从硬件配置和价格的角度考虑,云计算的优势主要有3点:(1)提供无限大的可用 资源池,且具备负载激增的适应能力,使得云用户不需要对资源使用量进行预先计算;(2)按需供给模型提高了业务的扩展能力;(3)基于用户的资源使用情况进行细粒度的计费(计算资源以小时为单位进行计费,存储资源以天为单位进行计费),降低成本支出和操作开销.虽然云计算得到了广泛的推广,但其依旧存在严峻的挑战.(1)服务的高可用性需求.应用服务商将应用部署在云环境中,其最关心的莫过于服务的高可用性,以保证终端用户的体验.虽然云服务提供商通过与云用户之间签订服务等级协议(service level agreement,简称SLA)来保障服务的可用性和可靠性,然而这并不能从根本上解决问题.同时,由单一云站点提供的云服务始终受到单点失败(a single point of failure)的威胁,许多不可抗因素,如能源供应中断、自然灾害、人为攻击等都会导致服务不可用.即使对于拥有多个数据中心的公司来讲,虽然基于不同的网络提供商的服务,其实现了基础设施的构建,但是一般情况下,其基础设施和计费系统都是相同的,使得其风险规避能力较弱.因此,学术界越来越关注联合多个云提供商共同提供服务来保证服务的高可用性[1].(2)应用请求的分布变化.随着全球化的发展,应用的受众不再局限于某一区域,其往往呈现出离散的分布状况,文献[2]分析了商业云服务的用户追踪信息,发现对于特定的云应用,例如邮件系统,其不需要大规模的计算服务和通信服务,但是需要利用地理上的多样性来改善其在扩展性、可靠性和性能等方面的需求.因此,将应用部署在分布式的云系统中,有利于缩短应用到终端用户的平均距离[3],能够有效降低访问时延和带宽开销[4].分布式云系统(geo-distributed cloud,federated-cloud,multi-cloud,intercloud,简称GDC),能够有效地解决以上问题,其联合多个云站点,提供更好性能的服务,保障了服务的质量和可靠性,同时降低了资源消耗,节约了开销,达到云服务提供商和云用户的双赢局面.每个云都有其独一无二的基础架构,其中的存储接口处于专有的状态,用户不能方便地将数据从一个站点导入到另一个云站点中.同时,对于数据密集型应用来说,其部署在多个云中会使得数据放置问题和传输问题变得十分复杂.因此,在云环境中,基于多个云服务提供商的基础平台,不仅需要提供云间的互操作标准,建立统一的接口,设计合理的分布式云架构,促使应用提供商能够跨云部署服务和放置数据,还需要优秀的资源调度策略来优化数据的放置问题,以降低数据传输的开销和时延.同时,云站点间的资源互访问往往引入广域网带宽消耗,因此,其中的网络架构和带宽分配策略都值得考虑.在多云环境中,虚拟机迁移是其内部常见的跨云操作,这相较于在单一云站点的内部迁移,具有更大的挑战性.另外,云服务提供商间在安全策略方面也存在着一定的差异,异构的云环境往往也会引入一些安全问题.对于分布式云环境下数据存储一致性的问题,目前工业界已经有了比较成熟的技术,其中包括谷歌公司内部应用状态的分布式文件系统GFS[5]、Amazon公司的简单存储服务S3(simple storage service)[6]和分布

参考文献

引证文献

问答

我要提问