首页 理论教育云计算关键技术探究-差异表达基因检测数据分析研究

云计算关键技术探究-差异表达基因检测数据分析研究

【摘要】:虚拟化技术是云计算最重要的核心技术之一,支撑云计算服务提供基础架构层面。资源切分型云计算中的典型代表是虚拟化系统,通过虚拟化系统实现对单个服务器资源的弹性化切分,从而有效地利用服务器资源,其核心技术为虚拟化技术。

1.从资源封装的层次角度看

云计算的服务类型分为三层,即基础设施即服务、平台即服务和软件即服务。

IaaS是Infrastructure as a Service(基础设施即服务)的简称,位于云计算三层服务的底层,不经封装地把计算和存储资源直接通过网络以服务的形式提供给用户使用,其对象通常是具有专业知识能力的资源使用者。IaaS基于Internet访问存储和计算能力,把IT基础设施像水和电一样以服务的形式提供给用户,可以按即用即付的方式从云提供商处租用IT基础结构,提供基本单元为服务器和虚拟机、存储空间、网络以及操作系统等计算和存储能力。

PaaS是Platform as a Service(平台即服务)的简称,位于云计算三层服务的中间层,也被称为云操作系统,把计算和存储资源封装后再以某种接口和协议的形式提供给用户调用,其使用者不再直接面对底层资源,通常是具有一定技术能力的云计算应用软件的开发者。PaaS提供给终端用户构建和托管Web应用程序的工具,用户能够访问通过Internet快速开发和操作Web或移动应用程序时所需的组件。在PaaS层面,服务提供商主要面向软件开发者,提供的服务是经过封装的IT能力,或者是一些逻辑的资源,用户不用再考虑设置或管理服务器、存储网络和数据库的基础结构。

SaaS是Software as a Service(软件即服务)的简称,位于云计算三层服务的最高层,将计算和存储资源封装为用户可以直接使用的应用并通过网络提供给用户;其服务的对象为对软件功能进行使用的最终用户。SaaS基于Web的应用程序,是一种通过Internet提供软件的模式,用户向提供商租用基于Web的软件。服务供应商负责维护和管理软件、硬件设施,托管和管理软件应用程序,通过云端访问可更轻松地在所有设备上同时使用相同的应用程序。

以上三层服务,每层都相应提供该层的服务,具有云计算的特征,如弹性可伸缩和自动部署等。每层都独立成云,并可以直接为最终用户提供服务,或者同时支撑上层的服务[155]

2.从计算资源技术角度看

云计算平台创新性地融合了各种技术思想,核心意义在于通过组织各种技术,使得建立IT系统的思路和结构发生根本性的变化。从计算资源技术角度看,云计算体现出了分布式数据存储技术、虚拟化技术、负载均衡等各种技术的联系。(www.chuimin.cn)

虚拟化技术是云计算最重要的核心技术之一,支撑云计算服务提供基础架构层面。从技术角度看,虚拟化在软件中仿真计算机硬件,以虚拟资源为用户提供服务,打破应用系统各个硬件之间的物理划分,实现架构的动态化和物理资源的集中管理和使用,从而合理配置计算机资源,增强系统的弹性以及灵活性,提高系统的利用效率。从变现形式看,虚拟化通过统一管理、动态分配资源,提高资源利用率,可以将一台性能强大的服务器虚拟成多个独立的服务器,以服务不同的用户,也可以将多个服务器虚拟成一台强大的服务器,以完成特定的功能。

分布式数据存储技术将数据存储在不同的物理设备中,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息。分布式数据存储技术摆脱了硬件设备的限制,同时扩展性更好,能够快速地响应用户需求的变化,可靠性高、可用性和存取效率高、扩展性好。云计算领域比较流行的云计算分布式存储系统有GFS(Google File System)技术和HDFS(Hadoop Distributed File System)技术两种。GFS是一种可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用,GFS包括一个主服务器(Master)和多个块服务器(Chunk Server),这样GFS能够同时为多个客户端应用程序(Application)提供文件服务。谷歌非开源的GFS云计算平台并行地为大量用户提供服务,使得云计算的数据存储技术具有高吞吐率和高传输率等特点。HDFS是指被设计成适合运行在通用硬件(Commodity Hardware)上的分布式文件系统(Distributed File System),采用了主从(Master/Slave)结构模型。HDFS是由一个NameNode和若干个DataNode组成的,其中NameNode作为主服务器,管理文件系统的命名空间和客户端对文件的访问操作;DataNode管理存储的数据。HDFS的数据存储技术已经被大部分ICT厂商(包括Yahoo、Intel)的云计划采用。

云计算项目广泛采用分布式并行编程模式,该模式可以更高效地利用软、硬件资源,使得应用或服务更加快速、简单。在分布式并行编程模式中,后台复杂的任务处理和资源调度对于用户来说是透明的。当前云计算的主流并行编程模式之一是MapReduce,该模式将任务自动分成多个子任务,通过Map和Reduce两步实现任务在大规模计算节点中的高度与分配。

3.从技术路线角度看

资源整合型云计算在技术实现方面主要体现为集群架构,通过将大量节点的计算资源和存储资源整合后输出,通常能实现跨节点、弹性化的资源池构建,其核心技术为分布式计算技术和存储技术。MPI、Hadoop、HPCC、Storm等都可以被分类为资源整合型云计算系统。

资源切分型云计算中的典型代表是虚拟化系统,通过虚拟化系统实现对单个服务器资源的弹性化切分,从而有效地利用服务器资源,其核心技术为虚拟化技术。虚拟化系统的优点是用户的系统可以不做任何改变就能接入采用虚拟化技术的云系统,其缺点是跨节点的资源整合代价较大,如KVM、VMware技术[154]