• 6.59 MB
  • 2022-04-29 14:14:40 发布

云计算数据中心建设规划方案模板

  • 117页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'云数据中心建设规划方案前言1.1数据中心的概念与现状数据中心是信息系统的中心,通过网络向企业或公众提供信息服务。具体来说,数据中心是在一幢建筑物内,以特定的业务应用中的各类数据为核心,依托IT技术,按照统一的标准,建立数据处理、存储、传输、综合分析的一体化数据信息管理体系。信息系统为企业带来了业务流程的标准化和运营效率的提升,数据中心则为信息系统提供稳定、可靠的基础设施和运行环境,并保证可以方便地维护和管理信息系统。一个完整的数据中心在其建筑之中,由支撑系统、计算设备和业务信息系统这三个逻辑部分组成。支撑系统主要包括建筑、电力设备、环境调节设备、照明设备和监控设备,这些系统是保证上层计算机设备正常、安全运转的必要条件。计算设备主要包括服务器、存储设备、网络设备、通信设备等,这些设施支撑着上层的业务信息系统。业务信息系统是为企业或公众提供特定信息服务的软件系统,信息服务的质量依赖于底层支撑系统和计算机设备的服务能力。只有整体统筹兼顾,才能保证数据中心的良好运行,为用户提供高质量、可信赖的服务。数据中心经过十几年时间的建设与发展,目前已经深入到各个大中型企业的内部,基本上每个大中型企业都已经建立了自己的数据中117 心。常见的数据中心逻辑拓朴图如下所示。数据中心包含了支撑业务系统运行的基础设施,为其中提供的业务系统提供集中运营环境,并具有一套完整的运行、维护体系,以保证业务系统高效、稳定、持续运行。近几年随着IT技术的发展,尤其是虚拟化和云计算技术的日渐成熟与广泛应用,传统的数据中心已远远不能满足新的业务发展需求,存在着资源利用率低下,电能消耗过高,物理空间不能满足业务扩展的需求,服务质量低下等问题,无法适应当今绿色IT,节能减排,低碳,智能先进管理,降低运维成本和投资成本等新型数据中心要求。所以越来越多的企业CIO主管更多地希望通过虚拟化和云计算技术,实现数据中心改造,以满足当前激烈竟争及金融危机环境下,快速占领市场,使企业立于不败之地。通过自动化的管理方式、虚拟化的资117 源整合方式,结合新的能源管理技术,来解决数据中心日益突出的管理复杂、能耗严重、成本增加及信息安全等方面的挑战,实现高效、节能、环保、易管理的数据中心。虚拟化及云计算技术应用于数据中心并不是传统的数据中心的复制,而是一种全新的IT服务提供模式,通过提供简单的用户接口实现自动化补署IT资源;能够提供足够的按需可扩展的计算容量和能力;通过虚拟化技术实现全新的应用服务。1.1虚拟化技术的优势虚拟化技术应用于数据中心可给用户带来巨大益处:Ø资源整合,硬件成本缩减通过虚拟化可以实现多个独立的系统同时运行在同一个物理系统上。完成多应用需求,然而却不用采购额外的服务器。充分利用计算机资源。Ø兼容性与物理计算机一样,虚拟机承载着自身的客户操作系统和应用程序,并具有物理计算机上的所有组件(主板、VGA卡、网卡控制器等)。因此,虚拟机与所有标准的x86操作系统、应用程序和设备驱动程序完全兼容,这样,您就可以使用虚拟机来运行您在x86物理计算机上运行的所有相同软件。Ø封装虚拟机实质上是一个软件容器,它将一整套虚拟硬件资源与操作117 系统及其所有应用程序捆绑或“封装”在一个软件包内。封装使虚拟机具备超乎寻常的可移动性并且易于管理。例如,您可以将虚拟机从一个位置移动和复制到另一位置,就像移动和复制任何其他软件文件一样。Ø资源动态平衡当需求增加时,可以把虚拟机系统及应用软件动态在线迁移到具有足够可用资源的系统中,实现整个平台计算资源动态平衡。而应用对外提供的服务不中断。Ø管理成本降低、效率提高虚拟化系统的创建和部署快捷简单,是以通用的映像模式快速复制来实现,部署一个完整的应用系统往往只需几分钟时间就可以完成,完全颠覆了传统应用安装和部署方式。在虚拟化的环境中,虚拟化软件一般会提供一个集中虚拟化平台管理中心,所有物理资源(服务器、存储、网络等)和虚拟机资源都可以通过集中管理中心进行统一管理,可以大大提高整个数据中心系统及应用的灵活高效管理。Ø物理/环境成本降低硬件服务器需求减少意味着电源电能消耗的降低和减少、降温制冷需求减少、网络设备减少和网络布线、简化等其他不动产成本削减。同时还可以提高整个数据中心空间的更合理利用与优化。Ø资源共享在基本Linux服务器系统上,通过虚拟机软件可以支持同时运行Linux、windows、solaris(x86/x86_64)、FreeBSD等系统。不仅117 服务器利用率提高,网络和存储基础设施也可以实现优化。组件减少,出错机率降低,管理轻松。Ø维护成本降低由于稳定性的原因,虚拟的服务器和存储基础设施维护起来成本较高。用来运行旧的成本高的服务器应用软件可以被简便地虚拟到一个新的、低成本的系统上。Ø高性能应用需求应用程序不会因为运行在虚拟机系统而在性能上有所下降,具有和运行在物理机上的系统相同的性能表现。Ø满足高安全性需求每个虚拟机可以根据需求设定自己的安全策略与机制,互不影响与干扰,就如同分别运行在不同的物理机器上;同时开源的虚拟机软件本身通过安全专家机构评审,具有可靠的安全性。Ø实现不同系统运行需求在工业标准服务器系统上,通过虚拟机软件可以支持同时运行Linux、windows、solaris(x86/x86_64)、FreeBSD等系统。1.1云计算技术的优势云计算技术提供的是多种功能服务的集合,在虚拟化技术支撑下几乎可以达到无所不能的功能,对云计算平台组织中心及用户都会带来具大的优势。对云计算平台组织中心来说,优势主要体现在:117 Ø集中管理云计算平台就是通过最新的IT技术对传统数据中心的升华,最集中的体现是通过虚拟化技术引擎和云计算管理平台,实现对资源的统一化及动态化分配和管理,一组服务器、网络和存储通过虚拟化技术,可以看做是一个超大规模的计算机,好像是只有一个服务器、一个网络设备、一个大的存储。通过管理平台,可以对其进行资源的动态分配和调整及回收,与传统的数据中心相比,其资源利用率可以提供数倍,管理效率可以提高70%以上,资源的划分可以虚拟的方式进行,而且通过安全设置可以保证虚拟的资源的安全性和独立性。Ø无限可扩展能力云计算平台是可以按需要动态在线增加资源的(如服务器、网络、存储、软件、服务),通过云计算的管理平台可以实现按需在线扩展能力,当云计算平台整体计算资源不足时,可以增加各自的独立计算单元,服务器不足时,可以在线增加服务器,系统自动安装,自动加载到管理平台中心,用作新的运算单元。存储不足时,可以在线增加存储,提供新的存储容量的需求。从理论上,云计算平台可以支持无限的服务器数量和存储空间。Ø最可靠的平台云计算平台中通过高可用性软件,可以实现最可靠的运算平台,任何一台服务器的失败,云计算管理平台都可以自动发现,并把失败的服务器从可用服务器列表中剔除,从而保证任意时间用户请求的计算资源都是建立的可用的服务器之上,同时,通过HA功能,还可以117 保证失败的虚拟机计算资源可以自动迁移到其他可用的服务器上。网络配置为多链路,任何一条链路的失败,都有另一条链路可替代,以确保网络的高可用。存储的配置可以通过冗余配置和备份的方法保证数据的高可靠性。通过服务的负载均衡功能,可以保证服务的高可用性,用户申请多台功能相同的服务计算单元,同时申请两个负载均衡器(互为备份),这样用户只需访问负载均衡器,来获得服务保证,负载均衡器把用户请求转发到功能服务器上,获得响应,一旦功能服务器或负载均衡器失败,由备份负载均衡器接管理负载均衡功能,负载均衡器可以把失败的功能服务器隔离,但对用户来讲,其请求仍然可以由其他的功能服务器提供。达到高可用性、高效运行环境。Ø快速部署能力不象传统的数据中心的应用部署方式,云计算中的服务的部署是简单而快速的,通常的作法是,把最常用的服务以模板的方式事先创建好,并放置于模板管理库中,当用户需要某一服务时,只需从模板库中选择自己需要的功能,并从资源池中选择所需硬件资源,发出申请,云计算平台会自动按用户的需求在几分钟之内就构建成。而不象传统的数据中心,一个功能服务器的申请需要从系统、中间件、应用等一系列安装步骤才能完成,而且这个过程需要数小时甚至数天才能完成,并且还需要数据中心系统管理员人为操作才能完成。Ø广泛适应性平台及丰富应用建立在工业标准服务器之上的云计算平台具有广泛的适应性,通117 过虚拟化技术可以支持通用的主流的操作系统,主要包括windows系统,Linux系统,Solaris系统(Solaris9,10x86版本及OpenSolaris),FreeBSD系统。所以在云计算平台上可以构建通用的适用于不同操作系统的应用和功能Ø超低的总体拥有成本TCO通常情况云计算平台的底层通过采用虚拟化技术,每个服务器上可以运行独立的多个操作系统,使得单个服务器及存储资源利用率可以达到70%以上,从而降低硬件投资成本;由于当然各主流硬件厂商及软件供应商及操作系统厂商都推出了云平台的价格列表,软件的许可证不再按传统的收费模式来计算,不是按运行多少实例及操作系统个数来计算软件许可,这样就可以大大节省了硬件、软件采购成本及软件许可费用。原先需要在1000台服务器上运行的应用现在可以在100台甚至更少的服务器上完成,加上云平台方便的管理功能,使得整个平台的长期运维成本大大节省,减少了系统管理的复杂度,从而降低的整体成本TCO。Ø虚拟化及动态资源调整云平台计算资源的物理位置及底层的基础架构对于用户来说是透明和不相关的,通过虚拟化技术可以实现硬件资源的整合与再分隔,所分配置独立的计算资源可以根据需要动态地调整,从而达到整个云计算平台的资源的平衡,最合理地利用硬件计算资源。云计算平台对用户来说,带来的优势主要体现在:Ø易用性117 云计算平台通常会提供一个统一的、易用的客户端工具(一般主要是通用的浏览器),用户通过客户端工具可以方便地连接到云计算平台,在云计算平台上申请自己所需的服务(功能)与所需的硬件资源(cpu、memory、storage、network等),然后经过验证获得自己独立的运算系统,通过工具登录到系统,就和使用本地操作系统和功能软件一样,没有任何改变,也不需任何培训就可以使用并进行自己的运算。Ø节省硬件、软件投资和维护费用用户只需依所申请资源的使用时间、流量带宽、空间、IO等因素按月/年来支付廉价的使用费用,而不用去购买任何硬件、软件许可等昂贵的费用,也不需要专业系统管理员去安装、配置复杂的应用环境,也不用考虑如何架构一个HA高可用计算环境,只需放心地使用从云中申请的高可靠性平台支撑的资源与服务(功能)。Ø安全的平台云计算平台通常是由业界最专业的IT厂商协助构建,提供最高的安全设置和高可靠性运行环境,客户不必担心数据丢失和系统失效,所以运行的环境比自己的IT服务人员搭建的计算环境要具有更安全可靠的服务运行环境。Ø丰富的功能选择性通常情况下,云计算平台可以提供各种丰富的功能应用平台,几乎包括的用户所需的常用的各种功能,这样用户就可以按自己的需要从中选择自己的最需要的功能模块。比如最常见的邮件服务器、WEB117 服务器、中间件应用开发平台、CAD设计、动漫设计、CI设计、CRM、ERP、高性能运算(HPCC)等功能是云计算平台中最常见的功能。Ø位置无关性、设备无关性无论用户处于任何地方,在公司还是外地,使用的是手持设备、笔记本还是PC机,只需通过internet连接地云计算平台都可以方便地处理自己的云中业务,由于所有计算都是在云计算平台中,所以客户端任何可连接互连网的瘦客户机都可以无障碍的进行自己的计算。云计算的其它功能:Ø云计算平台硬件资源动态分配与收回功能当某一虚拟机系统不再有效,云计算平台系统管理员可以通过云计算虚拟机管理中心,销毁虚拟机并回收硬件资源。收回的硬件资源可以被再分配服务于其他新的用户或企业。Ø云计算平台计算资源无限在线可扩展功能云计算平台具有无限可在线扩展计算资源的功能,主要体现为最初创建云计算平台时可能不会直接搭建上百台服务器和海量存储。最常见的做法是初期搭建符合基本用户使用的少量的硬件服务器和存储,随着平台用户的增多,如果当前的云计算资源满足不了更多的用户的时候,可以购买新的硬件计算资源和相应的软件许可。在线扩展整个云计算平台计算能力。同样云计算从功能上来分是无所不能,通用的作法也是初期只需购买少量的满足当前用户使用功能需求,随着用户使用云计算平台人数的增加及新的功能需求出现,可以分批添加新的功能软件,搭建新117 的功能服务器。提供IaaS、PaaS、SaaS服务。Ø云计算平台可以方便实现商业云平台功能对运维商来说,初期可以作为私有云方式提供内部资源/服务计算平台,私有云计算平台的资源使用是不考虚资源使用费用与成本,然后可以免费开发公共服务与应用给外面的企业或用户,随着云计算平台用户的增多,更多行业用户的加入,可以考虑构建商业云的模式,通过云计算平台中商业计费模块,可以方便地实现资源服务计费功能,用户就可以按使用资源的多少和使用时间,云计算平台自动生成用户帐单系统和支付系统,从而上升为真正商业公共云计算平台。1.1云计算的服务形式云计算集成了当今IT最新的各种技术,从广泛意义上讲,云计算无所不能,从当前规范的定义上来讲,通过云计算可以实现如下功能服务。ØIaaS架构即服务通过虚拟化技术,可以在云计算平台上,按需分配相应的虚拟硬件资源(CPU、Memory、Storage、Network)等,在虚拟的硬件资源上安装并运行不同虚拟机系统(linux,windows,OpenSolaris,FreeBSD等),不同的虚拟机系统可以给不同的用户使用,用户拥有root/administrator最高权限和密码,完全可以利用和控制自己的虚拟机系统,用户是感觉不到自己是登录到虚拟机系统上,象使用安装在物理机器上的操作系统一样使用虚拟机系统,用户自己决定运行117 什么样的应用。在管理上,云平台管理员可以预先安装好常用的操作系统(linux,windows等)并制作成模板,给用户分配并创建虚拟机资源时不需要从头开始安装系统,只需要选择已经安装好的模板,并选择相应的虚拟机硬件资源,就可以快速构建一个新的虚拟机系统,这个过程大概只需要几分钟时间就可以完成。完全不同于传统的操作系统安装。更高级的功能,用户可以自己登录到云计算平台上,通过GUIweb界面自己选择要用的系统模板,并选择希望使用的硬件资源,自己创建虚拟机操作系统,这样就可以大大节省云平台管理员的工作负担。并实现云计算平台资源自动化申请和创建功能。如果在商业的云计算平台中,加上帐单计费和支付系统,用户只需支付使用硬件资源时间上的费用,不用考虚或购买软件许可证,大大节省了硬件和软件上的投资。实现架构即服务IaaS功能。ØPaas平台即服务平台即服务功能就是为IaaS加上各种功能服务器软件,提供一个计算平台的某种功能。常见的平台即服务的功能服务器如开发服务器,数据库服务器,中间件应用服务器,CAD制图环境,动漫设计环境。用户不必要自己再安装功能服务器软件,只需直接使用功能服务器设计开发自己的应用。功能服务器虚拟机的创建过程同样可通过分配虚拟硬件资源和功能服务器虚拟机软件映像来搭建,也支持客户自己登录并自主创建117 功能服务器虚拟机。ØSaaS软件即服务软件即服务功能几年前就成为一种流行的基于互联网的服务,用户通过internet可以直接使用软件提供商所提供的功能软件,最常见的SaaS的服务如网上日历、任务调度、消息协作、网上office或CRM客户关系管理、邮件系统等。用户只需申请已建搭建的应用软件的帐户,不需要任何开发和软件许可费用就可以直接使用软件所完成的功能。这种服务用户不需要获得/也得不到登录支持运行应用软件的虚拟操作系统中,不需要安装任何应用程序和功能服务器,只需要直接使用软件所提供的功能就行了。例如某企业用户可以直接使用在云计算平台中搭建的邮件服务器,客户只需要登录到自己域名对应的邮件服务器地址,就可以收、发邮件。这种方式需要云计算平台运维商事先构建好不同功能的应用软件服务,为不同需求的客户提供服务。当某一虚拟机资源不够时可以动态调整硬件资源来扩展应用软件的计算能力,甚至可以复制、快速布署另一相同虚拟机应用软件,满足更多客户的需求。117 第一章中国XXX企业云数据中心建设整体分析1.1当前企业云计算技术发展现状云计算是当今热门的一个话题。从最近与业界专家学者和代表性厂商的交流来看,大家普遍认为,云计算代表着一种新兴的网络计算技术,云计算时代将是我国走向信息社会的一个必经阶段。它适应了用户的需求和软件即服务的发展趋势,体现了信息系统聚集的趋势—集中服务模式,终将重构整个信息网络体系和信息服务模式。有业内人士认为,在企业的信息化建设中,云计算也可以起到很大的作用。随着企业信息资源开发利用的深入,企业系统的用户数量在快速增长,系统内容也在日趋多媒体化。传统企业私有数据中心建设和运行的成本(包括电力成本、空间成本、维护成本等)在不断攀升。此外,随着移动终端的普及,3G等大容量移动通信技术的应用,还会有越来越多的移动设备要与企业业务应用系统进行对接,企业应用系统要处理大量的数据,将比以前承受更多的负载。在这种情况下,需要一种较好的计算模式来提高政府数据中心的运行效率,减低企业数据中心的建设成本。云计算则能满足这种需求,作为一种能够提供动态资源池、虚拟化和高可用性的新一代计算模式,云计算可以快速调动系统中所有可以利用的资源,组成一个虚拟机环境,提供高性能运算服务,不仅大大地提高了信息处理能力,而且彻底改变了计算与存储的方式,极大的降低了成本,提高了效率。117 结合目前应用例子来看,国内外众多已经有很多采用云计算技术建设数据中心的案例,如,美国的Apple,AutoDesk,安泰保险等,欧洲的诺基亚,德国大众,韩国三星,台湾Acer等公司都无一例外以云计算作为企业下一代IT的建设方向。目前,国内制造企业也已涌现或正在推出众多的云计算平台,如宝钢云计算项目,德国大众北京集团公司,中航信集团公司,国家电网云计算项目,PICC云数据中心等,他们的触发点主要出于自身应用/商务需求,以及企业政府开支,提高企业信息化服务效率,为企业提供更方便的服务。“绿色IT”已经同环境保护、能源危机一同成为整个国家和社会乃至全世界都越来越关心的议题。作为国民经济各个行业发动机地位领军的制造行业,如何构建节能环保的绿色IT,成为信息化建设中的新问题。云计算是计算能力的整合与分发配给。在云计算的底层架构中,操作系统、数据库管理系统、中间件、办公软件等基础软件占有非常重要的地位,集中反映了云计算的整体发展水平和趋势。21世纪是网络经济的社会,一体化、网络化、服务化、智能化、高可信已成为引导基础软件技术发展最具影响力的因素。一体化:软件的竞争已从产品竞争发展成体系竞争,操作系统、数据库管理系统和中间件软件呈现出相互渗透、一体化发展的趋势,软件开发平台正在日益与软件运行平台相集成,形成统一的基础软件平台。网络化:“以机器为中心”向“以网络为中心”的转变,使得基117 础软件技术朝网络化方向发展,网络化的软件运行环境和软件开发环境成为重要研究方向。服务化:随着“软件即服务”概念的深入人心,如何更好地支持这种新型的软件开发、部署、运行、管理和应用模式,对基础软件提出了新的挑战。智能化:基础软件功能越来越丰富,对应用系统功能与质量的影响愈发重要。如何智能地适应复杂多变的计算环境和应用需求,实现软件的自配置、自修复、自优化、自保护等能力,成为基础软件技术发展的重要趋势之一。高可信:社会对软件的依赖程度日益增长,国防和经济支撑系统关键软件一旦被破坏或失效,将会导致灾难性的后果。以信息系统的安全性、可用性和服务质量保证(QoS)为核心内容的高可信技术将是未来基础软件的重点研究内容。1.1当前企业私有云数据中心发展趋势云数据中心的建设是一个复杂而又庞大系统工程,采用虚拟化技术为基础的底层支撑,又可以实现灵活分步建设和实施的方法。结合XX省国土资源的厅的实际IT数据中心的现状,我们提供了分阶段建设思想。第一步构建一个测试云数据中心建设平台,以IaaS云服务为该阶段的主要实施内容,建设一个以云计算方式为基础的数据中心基础平台,充分理解并测试云计算技术对中国XXX企业IT信息系统带来的117 新的创新体验,验证传统的业务系统中新的云数据中心的运行状态,熟悉基本云计算技术的操作、运维、管理并为下一阶段的建设积累更多的经验与需求。第二步构建平台云、桌面云和服务云,在第一步基础上,实现真正以提供“服务”为目的的全功能云计算平台,包括IaaS、DaaS服务内容,设计开发一个单一的可以面向不同业务种类的云计算服务门户,结合中国XXX企业的业务系统,通过云计算的技术手段提供一个数据整合,信息交换,服务可靠,弹性的云计算数据中心。通过技术手段可以实现同一数据中心平台,服务于所有用户,如企业内网系统和对外服务的公众服务系统。新一代数据中心将是一个能够高效利用能源和空间的数据中心,并支持企业或机构获得可持续发展的计算环境。高利用率、自动化、低功耗、自动化管理成为了国内新一代数据中心建设的关注点。其发展趋势呈现以下特征。数据集中。无论是出于IT成本过高、复杂性过大,还是资源利用率过低等原因,目前几乎所有类型的公司都在尝试将IT资源进行整合和集中,这其中当然也包括了数据中心的整合。集中化的数据更便于备份、冗余和控制。计算与存储虚拟化。虚拟化技术能够改善IT资源的再利用和提高灵活性,以适应不断变化的需求和工作量;同自动化技术以及服务级的、基于政策的管理一起使用,资源的效率将得到极大的改善;灵117 活性将成为根据需要自动调整的功能,服务将能够从整体上进行管理以保证高水平的弹性功能。绿色低碳。绿色数据中心在机械、照明、用电和计算机系统等方面的设计为的是最大程度提升能源利用效率和最小程度造成对环境的污染和影响。建设和运行一个绿色数据中心需要采用先进的技术和优秀的策略。运维管理自动化。在不需要大幅增长预算和人力的情况下,管理好数据中心资源的快速增长,是数据中心管理者共同面临的严峻挑战。虚拟化可在一定程度上控制这种增长,但虚拟化还会增加管理和自动化工具上的要求。实现IT管理流程自动化,是降低数据中心IT操作成本和复杂性的一个关键目标。自动化应用将呈现增长的势头。快速便捷部署。如何更加快速部署应用软件,为业务系统提供支持,提升行业/企业的竞争实力,也是目前数据中心建设中非常关注的问题。构建信息系统本身不是目的,目的是为业务提供支撑。在如今的环境下,为每一个应用单独开发业务应用系统的模式,显然已经不能够满足业务快速发展的需求,因此信息系统的自适应能力以及自动化的水平,是迫在眉睫的问题。安全与可信。安全性并不单指防火墙、IPS/IDS、入侵检测以及防病毒等安全防范措施。实际上,火灾、飓风和其他灾害能在任何时候袭击数据中心。在数据中心建设的初始阶段就应该构建可靠的灾难恢复方案,或建立异地的灾难备份中心,这是当前数据中心建设中需要重视的一大热点问题。117 云计算技术顺应了数据中心的发展趋势,利用云计算技术实现内部的IT支撑系统整合。运用云计算技术,可以有效提高IT资源的利用率、降低IT资源消耗、减少管理和建设环节、提升运营效率,实现数据集中和统一管理,并提升管理能力。总之,应用云计算技术将大大降低在IT支撑系统建设和维护方面的开支。数据中心“云”化是其发展的必然趋势。1.1中国XXX企业云数据中心建设需求分析1.1.1IT整体规划设计1、中国XXX企业现有的数据中心X86服务器已经进行虚拟化整合,由于后续灾备中心及桌面云建设带来的管理负担,本次需要用云计算的模式将现有数据中心迁移到云计算的统一管理之下,并在建立灾备数据中心和桌面云时用本次的云管理平台实现统一的管理,以适应不断添加和更新的业务系统,方便数据整合迁移,同时考虑扩展性、性能等因素来实现业务性能的提高。通过虚拟化的HA实现现有业务系统应用高可用,保证应用系统7×24小时正常工作。2、存储系统应考虑后期其他业务系统的升级及新业务上线需求,支持虚拟化方便数据迁移,同时考虑扩展性、性能等因素,数据的统一管理,通过虚拟化实现各应用系统创建、配置、克隆、共享、启动、迁移等;负载均衡、高可用、在线迁移等高级特性,可以充分保障用户业务的高可用性机连续性。除考虑传统的阵列以外,还可以考虑分布式集群存储系统。117 3、整体两地灾备中心规划,保重公司的业务平台不中断服务。1.1整体拓扑及规划分析整体规划拓扑图:根据系统现状,我们做如下规划:1.1.1基于X86服务器业务系统云化X86系统完全可以构建在虚拟化平台上,将现有物理服务器搭建成服务器池后,物理服务器之间就组建了高可用平台,任何虚拟服务器上出现宕机,可以瞬间切换到服务器池的其他设备上,这样不仅可以做到业务的连续性,也可以对所有应用进行统一管理和维护,同时如果有新增业务系统,用户只需新增物理服务器或虚拟服务器,非常方便高效。这样可以大大提高PC服务器的利用率,节省管理和运营成本。117 1.1.1统一存储规划由于目前系统存储都只为单一系统服务,磁盘阵列分布分散,同时架构不统一,有SAN,也有DAS,管理维护复杂。从未来近一两年内业务需要扩展和中国XXX企业现有网络考虑,可以采用分布式集群存储或者一套高端存储作为主存储,主要业务数据都存在高端存储上,进行统一管理,通过存储自带的复制软件可以进行简单的数据迁移,将系统原有数据进行迁移,迁移过程不影响其他系统的正常运行。同时现有存储可以作为系统应用级别不高的存储,做归档用,我们建议现有存储作为虚拟带库使用,可以更好的利用现有存储设备,同时也可以将备份做到更稳定更高效。1.1.2备份系统规划目前用户采用物理磁带库作为主要的备份介质,随着业务对备份系统的要求越来越高及核心存储设备的更换,所要求的备份时间越来越短,由于其先天性的一些不足,物理磁带库越来越不能胜任目前的备份任务,主要因素如下:(1)机械故障多,维修费用高。(2)备份失效率高。(3)数据备份/恢复复杂冗长。(4)安装复杂,不易搬迁。117 (5)不易于管理。服务费用高(6)总体拥有成本(TCO)过高。根据以上分析,我们建议构建好核心存储后,将原有SUN和IBM存储作为虚拟磁带库作为主要的备份设备。VTL技术是数据备份领域的里程碑,具备多项优势,如性能高、故障率低、可靠性高、成本投入低以及运营成本低等,使用广泛。同时,VTL也可以和现有磁带库集成,提高数据保护的整体安全性和性能,降低数据保护成本。VTL对于其它系统来说,与真实的、自动化的物理磁带库/机设备一样,区别仅在于数据是存储在磁盘上。与传统备份方式相比,VTL备份进程更为快捷,并且易于管理。1.1.1灾备中心规划系统目前没有容灾中心,根据需求规划在华盛建立灾备中心,以一套与主生产中心架构相同的设备搭建数据级容灾中心。服务器可以采用与主生产中心相同的配置,也可以略降低数量和配置,运行完全相同的业务系统。存储可以采用一个比主生产中心略低的中端存储,通过100M专网实时的将主生产中心的数据备份到容灾中心存储上,如果两个数据中心距离小于25公里,也可以通过光纤进行备份,以达到更好的实时性,保证在较低RTO和合理的RPO下完成数据恢复和117 业务切换。容灾软件可以采用第三方的,也可以采用存储厂商自带的容灾备份软件。117 第一章Citrix云计算简介Citrix公司云计算是按模块分层的设计思路来设计,可以支持并实现未来在线、灵活扩展的需求。并通过丰富的云计算管理平台实现智能、高效、弹性的云计算高级服务管理平台。Citrix是最早关注并致力于云计算相关技术研究与发展的公司之一,其最有名的公益性质的网站“cloud.com”关注并更新最新云计算技术,并根据新的云计算技术发展方向,逐淅完善自己的云计算管理平台功能。同时Citrix目前所有的软件全部是基于CitrixXenServer虚拟平台之上开发和认证的,确保从硬件到软件全系列产品的认证。同时Citrix目前虚拟化产品完全兼容Amazonwebservices的API及格式OVF(Amazon云计算平台也是基于xen虚拟化技术构建),可以实现无缝的兼容与迁移,可以吸引更多的用户不需任何修改就可以迁移动Citrix云计算平台和虚拟化平台之上。1.1云计算,云无处不在Citrix云计算管理器CitrixCloudPlatform作为Citrix的系统管理的旗舰产品提供业界最完整的云计算管理方案。它提供了一个单一的,集成的控制平台进行测试、部署、操作、监控、诊断和故障排除,来应对当今复杂的IT环境。它提供了一个简单,可扩展的解决方案,在云计算环境中运行Citrix堆栈,实现从应用到磁盘的全117 面云计算管理。它可以管理您的数据中心中的一切-从操作系统到数据库及应用层。Citrix云计算管理平台不仅仅提供了广泛的功能,它还是一个可扩展平台,当客户获得Citrix技术的全面管理的同时,它也有连接器和插件plug-ins与第三方系统集成。插件plug-ins可以管理第三方IT组件如Cisco和Juniper防火墙和NetApp存储,而连接器可以使Citrix云计算管理平台(CLOUDPLATFORM)与其他管理系统,如IBM的Tivoli,Ca的Unicenter和HP的OpenView共享信息。Citrix的云计算管理解决方案是建立在从底层到上次应用的所有方面,可为企业提供全面的解决方案。此外,Citrix也认为云计算是下一代以较低的成本实现更大的自动化趋势技术,Citrix也提供云计算方面的变革。这意味着:Ø云计算规划已经纳入数据中心整合策略,它可能是或可能不是完全采用服务器虚拟化技术。但是服务器虚拟化技术提供了一个简单提供抽象物理资源的方法,来应对扩展性和管理性的挑战。Ø云计算不应该只是一个仅提供计算机能力的平台,独立的业务内容,它还应该是业务驱动的、能够动态适应业务需求的平台。它也就要求必须是能够实现业务部署和监控集成。Ø云计算必须是能覆盖到企业的所有方面,从IT用户到业务用户到生产线。Ø云计算需要提供完整的,统一的和自动化的功能。它需要完117 整的覆盖整个生命周期,需要通过一个单一的工具,而不是通过多种的工具和接口来管理。在云计算环境中多控制台的解决方案往往不能保持互相之间协调,从而导致复杂的同步和协调问题。1.1云计算不仅仅是虚拟化在云计算平台中,服务器虚拟化既不是必要条件,也不是充分条件。虽然服务器虚拟化可以提供硬件整合,操作系统级隔离及通过模板简化操作系统部署,但它并没有提供一个完整的云计算解决方案。即使作为整合策略,服务器虚拟化在初始部署时带来优势,但运营一段时间后,会带来创建的挑战,如服务器的无序蔓延带来的挑战。云可以提供不相关的服务,如OS基础设施(IAAS)形式交付,以及运行平台(PAAS),如数据库(DBaaS)或中间件(MWaaS)。此外,可以也为测试提供量身定制的服务(TAAS)或提供软件即服务(SaaS)。服务器虚拟化是最适合提供的IaaS,但未能提供PaaS或DBaaS。多架构选择:Citrix提供了多种架构选择给云计算服务提供商来支持上述所有的服务类型,在虚拟和物理环境。人们可以在虚拟服务器上部署多层应用程序,可以部署预先创建的数据库和应用程序,而无论是物理的或者是虚拟的。117 1.1云计算平台物理架构拓朴从物理架构拓朴来讲,云计算平台主要分为三大部分,分别由云计算管理中心,云计算服务中心,云计算的存储中心组成。1.2云计算平台逻辑架构拓朴117 ’从逻辑架构拓朴图来看,云计算平台按功能可以分为五个大部分,分别包括存储云、服务器云/系统云、应用桌面云、云管理平台、云运营平台等五个大子云系统。1.1监控和管理一旦云任务已经委托,必须进行监控和管理。多年来,行业内已目睹了肤浅的服务水平监控和分散的单个功能组件管理。Citrix云计算管理平台遵循“从应用程序到磁盘”理念,从根本上改变这一点。其中Ø通过一个单一的面板监控所有组件Ø提供深度监控功能,减少解决问题时间,节约50%以上的时间。最大的体现“从应用程序到磁盘”管理工程系统。117 在云计算中,监控框架最终会扩展到数以千计的服务器,数据库和中间件作为监控目标。Citrix云计算管理平台提供把目标分组管理的能力,以实现更好的可管理性。新系统管理组功能,使管理员可以通过模板定义监控设置,遵循标准和云策略,同时也可以组织每一个目标多个层次,如业务和生命周期状态。Citrix云计算管理平台还内置的事件管理系统,可以管理例外。管理员可以审查,压制,升级,按需修复事件,同时还集成票据系统。Citrix云计算管理平台有能力定义合同约定的服务等级协议(SLA)的能力,管理应用程序所有者和云服务提供商之间的合同。管理员以及用户还可以定义管理政策,自动调整服务资源,以确保SLA的满足。另外,大多数工具只注重云计算基础设施管理,CitrixCloudPlatform还提供了用户体验的管理和业务交易管理。在已有技术的支持下,云计算管理平台还提供确保云中的应用性能领先的解决方案。在云计算平台中往往忽略上下文间的配置管理,在云中需要具有敏捷性和弹性能力(如VM迁移)来按需实时发现及同步快速的系统改变拓朴,传统的配置管理无法满足这种需求。CitrixCLOUDPLATFORM提供云环境中的优化配置管理能力,它可以监控大量的配置连续性,发现改变,测量漂移,发现配置错误,在单界面内提供系统拓朴。117 端到端的应用性能监控1.1计量、计费和优化共享服务和云带来一些其它额外的挑战。由于不同的租户共享同一个平台或基础设施,需要对他们各自所使用的资源进行计量,否则几个人就可能会消耗掉大部分云计算资源。此外,简单的自我服务部署可能会导致资源过度消耗。为了缓解这种情况,组织必须计量资源的使用和进行可选的扣款。虽然钱未必真正交易,但这可以提供一个成本的透明度。CitrixCLOUDPLATFORM提供了一个精密的和灵活的计量和计费机制,不像现在常规的仅仅基于计算机资源计量(如CPU、内存和存储),它还可以定义基于应用的、数据库的、中间件级别的计费模式,另外它还可以提供扩展计费模式来统计固定成本、配置成本、管理成本、人员成本、能耗成本或者这些内容的组合计费。云管理也需要不断优化资源,以确保服务水平是持久的。Citrix云计算管理平台提供丰富的功能,可以帮助资产的重新发现,重新评117 估的性能,重平衡云计算,微调配置过程。这种调节能力可以体现在操作系统、数据库和中间件层。117 第一章Citrix云计算平台各子系统功能详述本节将主要涉及云计算中心项目的主要子系统。1.1存储云子系统层存储云位于云计算中心的最底层,属于云计算中心的子系统,主要提供整个云计算平台的数据存储及处理,由通用的SAN存储设备构成。由于云存储系统对数据访问的速度要求较高,一般情况下,在存储云层的架设过程中会需要数据中心专用的高速交换机,以保证数据高速访问的需求。存储云支持FCP、OCFS/NFS、iSCSI等方式连接到服务器云计算子系统,提供灵活的可扩展的存储空间,由于采用开放标准协议方式连接,具有无线可扩展性,支持按需在线增加存储设备,按需在线增加到存储云子系统,方便于未来云计算平台的容量扩展。在云计算平台中,可以把整个存储云子系统当作一个存储子系统117 加入到一个云计算资源池中心。在未来云计算扩展中,如果按区域或功能划分多个独立的云计算资源池中心,存储云也可以灵活地划分成多个子存储云,分别分配给不同的云计算资源池中心。保证的不同的数据中心数据的安全性与隔离性。存储云中数据主要分为三个区:第一区-映像文件存放区主要用来保存云计算平台中的分配的虚拟机的映像数据文件,这些映像是在云计算平台的数据中心内是透明且可见的,以确保云计算平台中每个运行的云都具FailOver(失败切换)功能和按需在线迁移功能;第二区-功能服务器模板仓库主要用来集中保存功能服务器模板,用户可以通过云计算管理平台直接从模板库中方便选取功能模板,并在云计算平台中部署,部署117 后的云的映像文件放入第一区中;第三区-计算数据区主要用来进行实际应用数据存放,为实际云计算提供扩展存储功能,如做为操作系统的扩展存储文件系统,或数据库数据存放系统,或应用计算用数据区,构建应用HA共享数据区等等;整个存储云是为云计算平台提供数据可靠性服务的,所以其合理性划分及可靠性至关重要,所以在存储云的划分上可以采用多种措施实现其可靠性要求。首先是磁盘的划分,可以采用性能最好的RAID5+1的方式进行划分,保证其中任意一块磁盘的损坏都不会影响整个平台的运行及数据丢失,同时RAID5又保证数据在读写的时候以并行方式进行存取,从而保证最高性能。其次是链路备分,最可靠的方法是采用双链路方式进行连接,配备两个光纤存储交换机,通过服务器的两块HBA卡分别连接不同的交换机,同时通过设置MultiPath多路径方式,每个链路的失效,也不会中断通讯,从而保证了存储及数据的可靠性。117 在云计算平台中,存储云的加入是由云平台维护系统管理员进行的,完成对云计算平台中的数据中心划分后,通过Citrix公司云计算管理平台就可以加入存储云子系统到云计算平台中,选择标准的连接协议后,Citrix云计算平台会自动地发现存储,系统管理员选择自己需要的存储区域(已完成基本分区及文件系统的划分与格式化),加入到数据中心就变成云计算平台可用的存储云系统。1.1服务器云/操作系统云子系统层服务器云是整个云计算平台的最核心部分,所有云计算平台中的功能及子系统都是依赖于服务器云来实现的。它既包括硬件服务器和底层操作系统部分,同时又包括云计算平台中的虚拟机超级监督器功能,是运行虚拟系统/功能服务器系统的底层基础平台。服务器云主要由硬件服务器(工业标准服务器)和VirtualizationHypervisor及操作系统组成。通过Citrix云计算平台管理软件,实117 现所有服务器整合为一个统一的云计算服务器平台,抽象出统一的硬件资源,包括cpu资源池、memory资源池、network资源池、storage资源池,任意云都可以按需在统一资源池中获得硬件资源并运行。1.1云计算管理平台子系统云计算管理平台提供所有的管理功能,包括从裸机到虚拟机上的应用的端到端的整体管理功能。如下图所示:117 1.1.1CloudStack特性列表特性描述丰富的管理用户界面CloudStack提供了包含丰富特性、即装即用的用户界面,基于CloudStackAPI实现对云基础设施的管理。它完全基于AJAX,兼容主流浏览器,并可以非常容易的和现有门户相结合。自定义品牌的用户自助界面即装即用的用户界面使用标准的HTML构建,同时使用带有jQuery的CSS作为标桩的Javascript库。可以非常容易的定制,添加公司的徽标,使其满足您公司的整体风格及外观。安全的AJAX终端访问VNCAJAX客户端允许用户使用任何一种浏览器访问其虚拟机桌面,无需安装任何额外插件如JRE、ActiveX或Flash。强大的API易于构建、集成并使用基于CloudStack的API的应用,丰富的文档及可扩展性。CloudStackAPI还支持来自亚马逊及VMWare通用的云管理API。CloudStack支持通过API访问、通过公钥/私钥访问或者通过浏览器的cookies访问。安全单点登录通过安全单点登录,使用我们的管理用户界面整合您现有应用,给用户带来更好的体验。多角色支持117 用户界面包含三种权责明显的账户角色,内置通过API访问:·管理员:可管理整个云的物理和虚拟资源·域管理员:仅可管理域内该账户拥有的虚拟资源·用户:仅可管理分配给他们的虚拟资源按需虚拟数据中心托管提供给用户不限制数量的虚拟计算资源–按需按要求并按实际用量付费。动态负载管理通过预定义的负载均衡、数据安全的策略和条件,在已有的物理环境上完全自动分发计算资源、网络资源及存储资源。广泛的网络虚拟化能力支持纯软件的网络管理功能及VLAN。直接连接的IP使你更加容易集成虚拟网络架构,更好的满足您的需求。支持多协议标签交换(MPLS)CloudStack允许你将整个VLAN分配给特定账户,以实现在网络节点间支持MPLS。安全云部署确保整个云环境所有内存、CPU、网络和存储资源的可用性,同时实现不同账户的用户之间相互隔离。虚拟化无关CloudStack可以和业界主流的虚拟化软件灵活集成,包括VMWare、CitrixXenServer、KVM、CitrixXen云平台、OracleVM及Hyper-V。简单的模板创建流程CloudStack用户界面允许用户创建预定义的模板实现虚拟机快速部署。可以通过ISO或者云环境现有的虚拟机两种方式进行模板创建。丰富的模板和ISO管理功能用户和管理员都可以上传操作系统模板或者ISO。管理特性包括:是否允许该模板/ISO全局可用还是每个账户可用,这些模板是否需要跨Zone可用等。CloudStack会根据这些定义自动将模板/ISO分发到关联的服务器上。域及成员管理域支持允许将云资源分离,并将这些域的管理指派给其它管理员。快照管理为帮助减少数据丢失及实现灾难恢复,用户可以对磁盘进行特定的快照,或者按照一定的间隔进行数据的快照。用户还可以设置从现有快照创建新的快照的数量。广泛的服务管理管理员可以在整个云环境定义、测量、部署和管理服务内别(包括计算资源、网络资源)和磁盘大小。虚拟机同步及高可用特有的虚拟机同步技术持续监控机维护所有虚拟机的状况。从单个虚拟机的状态通知到自动确保虚拟机的持续运行。资源超量供应及限制用户可以通过配置云环境允许物理资源超量供应,以实现虚拟机分配的优化,进而在现有的虚拟化、存储及网络环境上实现资源平衡。CloudStack还提供了虚拟机虚拟机容量限制的管理,如特定账户可创建的虚拟机数量、公网IP的数量等。用量监测117 通过用量监测,可以提供实时的可见性,产生历史用量报表,并可通过CloudStack用量引擎收集的数据产生账单。警报和通知通过内置的系统监控进程,用户可以每分钟接收警报如达到物理资源的某一预设警报、检测到机器(虚拟机、物理机)失效的警报,这些都可以通过CloudStack的API或者SMTP来实现。虚拟路由器、防火墙及负载均衡器CloudStack支持和软件/硬件防火墙/负载均衡器的集成,为用户的云环境提供附加的安全性及扩展性,包括F5和NetScaler。多存储方案CloudStack支持多种存储类型,包括FC、iSCSI、NFS,任何一种存储都可以有多个mount点。用户可以使用通用硬件,自主选择其存储类型如Dell的EqualLogic或NetApp实现企业级的解决方案。存储分层及堆叠作为CloudStack能力的一部分,通过多种存储整合,用户可以指定特定的存储用于虚拟机的部署。比如用户可以指定对磁盘不敏感的应用使用普通存储,而对于磁盘敏感的应用如数据库,则可以分配高速存储。块设备卷CloudStack支持在NAS或者本地磁盘(包括FC、iSCSI)上创建块设备卷,并可直接连接到虚拟机或者从虚拟机断开。广泛的虚拟机操作系统支持依赖不同的虚拟化,CloudStack支持广泛的操作系统,包括Windows®,Linux®及不同版本的BSD®。事件/审计日志所有通过CloudStack的用户界面或者API的用户交互都将以事件的形式保留。每个事件包括事件类型、严重级别、描述、资源所有者、行为的发起人、事件出现的时间等。用户数据支持CloudStack支持当用户部署虚拟机时允许其提交任何类型的二进制用户数据。用户可以灵活的使用经过认证的并属于他的操作系统模板来创建每个虚拟机。GuestOS偏好CloudStack允许管理员标记物理主机优先安装何种操作系统,以获得目前硬件和操作系统的许可模式的好处。比如Windows操作系统尽可能安装在所有标记为Windows优先的主机上。使用在线迁移实现主机维护CloudStack将标记为维护模式的主机上的虚拟机在线迁移至别的主机,并阻止更多服务分发到该主机上,实现虚拟机不断线的情况下的升级或硬件维护。灵活的适配框架CloudStack从底层支持不同虚拟化、存储、网络及认证方案的整合。基于这种灵活性,CloudStack包含了适配框架,允许用户简单快捷的自定义其云环境,以充分满足其业务需求。GuestOS随机密码用户可以使用“随机密码”特性改善其操作系统模板,在创建虚拟机是将自动产生随机密码,最终用户可以安全登录并改变其密码。“随机密码”特性支持Windows和Linux平台。117 第二存储整合OpenStackSwift 第二存储(存放模板和快照)可以使用OpenStackSwift,这是在NFS之外的又一选择。项目通过预定义的组或者“项目”,用户可相互协作、共享资源。当用户创建一个项目时,该项目下的所有用量自动成为拥有该项目的账户的属性。集群LVM支持从3.0开始,CloudStack可以利用集群化的LVM存储配置。 NetScaler支持CloudStack支持MPX、VPX和SDX设备。用户可以设置4层负载均衡规则。支持的协议包括:HTTP、TCP及UDP;机制:负载最少及轮询;会话连续性;基于源IP,基于缓存。网络即服务管理员可以针对不同的网络行为设定不同网络产品,比如基本类型网络产品加上CloudStack虚拟路由器提供网络服务;使用物理设备如NetScaler和JuniperSRX提供高性能网络。用户可以在部署虚拟机的时候选择不同的网络产品,还可以将虚拟机从一种网络移植到另外一种网络。LDAP集成CloudStack通过内置的认证适配器支持LDAP认证方式。通知及容量阀值管理员可可以设置通知阀值,当资源池资源使用超过该阀值时,管理员可以接到警报。容量阀值可以阻止CloudStack在即将超容的资源池上分配更多资源。 1.1.1Citrix云计算管理工具作为Citrix全局整体云计算管理运营计划的一部分,CitrixCloudPlatform提供了一种高度集成,经济有效的云计算生命周期管理解决方案。通过单一的Web界面提供广泛的管理功能,包括资源池管理,网络管理,服务产品管理,资源监控,账户管理,账单管理,计费管理,大大降低云计算环境管理的复杂性及成本。1.1.2计算资源复用在将服务器硬件资源虚拟化后,其CPU、内存等资源为多台虚拟机共享使用,117 在应用系统虚拟机创建时需要指派定量的CPU和存储资源,理论上多台虚拟机的CPU和内存分配资源综合等于物理服务器的资源配置。但在实际的运行环境中,各应用系统不会将分配给自己的CPU、内存资源用到100%,因此可能依然存在一定的资源浪费。为了解决此问题,本方案的云管理系统提供CPU和内存的超量配置功能,以物理服务器的CPU、内存配置为基础单位,在此基础上进行倍率增加,这样云管理系统会认为该物理设备可以分配更多的资源,从而也就可以建立更多的虚拟机。当某台虚拟机运行所需实际资源不足时则可以利用本平台的负载迁移功能进行整体迁移。1.1.1个性化网络服务的提供作为整体云平台的管理系统,应用网络也是其重要组成部分之一。在传统数据中心中,应用服务器的网络安全、集群负载处理等需要专门的设备来提供,而在虚拟环境如果没有有效措施,则在虚拟化服务器内部的多台虚拟机之间的网络117 则成了完全透明无保障的环境,为了解决此问题需要在虚拟化服务器系统内部进行适当的隔离、策略定制。基于以上分析,本方案的云管理平台为了解决以上问题,提供了可针对掌握不同资源的不同用户的差异化网络管理方案。每一个掌握有资源的用户,均可建立自己的独立网络环境,并由云管理工具提供诸如防火墙、地址映射、负载均衡等网络管理功能,这样每个用户就可以针对自己的环境进行针对性配置,以保障应用系统的访问安全、高效。1.1.1多级别用户管理在云计算环境中,使用少量的虚拟化服务器取代了大量的物理机,如何有效对资源进行分配和管理将成为考验每位IT系统管理人员能力的基础指标。而在超大规模环境下,IT管理人员往往只进行设备管理,应用系统对于CPU、内存、磁盘等资源的需求往往只是遵照前端业务人员提供的信息,而随着业务数量、类型的增加,管理工作会变的异常复杂、耗时。117 为了解决此问题,本方案提供的云管理系统提出了用户分级管理模式,特权管理员可以管理所有的资源可以直接建立虚拟机直接分配给相关应用。同时管理人员还可以将一定量的CPU、内存、磁盘空间、VLan数量的可量化资源分配给某一个team的管理人员,而该team的管理人员又可以将自己所掌握的资源分配到更低一级用户。这样资源逐层分配,最终到了最熟悉应用环境部署的人员手中,既减轻了特权管理员的工作量,同时也实现了对资源的最佳配置、最佳利用。最终达到:云平台由运维中心管理,各应用模块及接入单位自己管理维护自己的小云(虚拟机系统)。1.1.1快速部署传统数据中心中经过多年的实践,为了实现应用系统的快速部署多采用镜像分发模式,针对每个应用提供一整套镜像,每个应用部署时需要经过批量的分发网络配置-镜像分发-系统空间微调-网络分配等一系列流程,虽然相比逐台安117 装、配置缩短了部署时间,但在大规模环境下的部署和变更仍然是一个很大的工作量。为了解决此问题,云管理平台从多个角度入手,提供了整体系统快速部署的解决方案。n首先采用系统模板技术,为每个应用制作了统一的操作系统,一旦应用需要部署直接选择相应模板即可。n其次在系统部署过程中提供了友好的导航界面,只需点几下鼠标,不同的CPU、内存、数据磁盘、应用网络便迅速的匹配到所要建立的虚拟机之上。n另外,在系统内部网络无法连通情况下,云管理平台提供了终端显示功能,有了终端显示功能就如为虚拟机接入了显示器和键盘,可以在排出网络环境的条件下进行系统调试、设置。注:通常情况下,每台虚拟机从向导配置到可用的时间周期不超过1分钟。1.1.1混合部署,统一管理117 鉴于一些关键的应用如大型数据库,单台虚拟机甚至物理服务器都无法满足其对计算资源的需求,同时考虑到系统的性能等的要求,本案采用将这些应用部署在物理机组成的集群上;这些物理机也是整个云计算不可分割的一部分,可以使用云管理平台的物理机管理功能实现对其的统一管理及监控。如下图所示:1.1.1资源监控面对大规模系统,如何有效管理需要多种途径提供依据,其中最重要的依据便是来自于系统整体资源的监控。当系统利用云计算技术进行部署以后,原有的监控手段已经无法准确体现资源的使用情况,因此本方案中的云管理平台针对实际情况开发了自有的具有针对性的监控模块。117 云管理平台的资源监控包括了CPU、内存、网络、存储、IP等方方面面的监控,一旦管理代理被部署到云计算服务器上,便自动收集服务器的可用性及性能信息,并和预设的临界值进行比较,及时通知管理员潜在的问题,使得管理员可以掌握峰值,并灵活的根据需要调整临界值,在120多个收集的参数中,包含某些关键的性能参数:CPU利用率,内存使用率,磁盘I/O,关键进程等,使管理员可以自定义监控服务器上的应用程序,同时还可以监控应用程序的日志,特殊程序的计算资源(CPU,内存等),应用程序文件及目录大小,增长率等。1.1.1虚拟化技术无关性云计算环境中服务器虚拟化是必备条件之一,目前技术领先、产品成熟的虚拟化包括VMWare、CitirxXenServer、OracleVM、KVM等,由于各自虚拟化采用的架构不一,且为了保障自己市场的排它性,各虚拟化产品间的交互性、兼容性多多少少都存在一定问题,一旦一个采用某种虚拟化技术的平台定形后续很难再去更改,即使将来该技术会有这样那样的问题。117 为了解决此问题,被方案的云管理平台采用了虚拟化无关性理念进行开发,可以同时接入采用多种虚拟化技术的系统,并进行统一管理调度,为用户构建系统平台提供了更多的选择,且为将来的产品升级、技术更新预留了更多的可控空间。1.1.1业务可持续性保障业务持续性保障是数据中心建设需要提供的有效保障之一,特别是在利用云计算技术构建基础平台后,每台虚拟化服务器都承载着数台虚拟机且会涉及到多个应用,一旦系统发生负载能力不足、硬件损坏等故障,将直接对大量的应用造成影响,因此如何保障业务的可持续性将成为云计算平台选型的基础考量指标质之一。本方案采用的云管理系统从多个方面对业务可持续性进行了考虑和涉及,现已应用在多个大型企事业单位:n应对虚拟化服务器资源的不足如果虚拟化服务器资源不足是由于某台应用虚拟机的负载升高而引起,则云管理子系统提供了负载阀值监控功能,一旦某台虚拟化服务器的负载达到了阀值,则会启动在线迁移服务,将影响负载到虚拟机迁移到一台合适的虚拟化服务中。如果资源不足发生在整体虚拟化集群,云管理子系统由于支持虚拟化服务器117 的在线扩容,因此很容易通过新增服务器的模式提高整体系统的负载支撑能力。n应对虚拟化服务器硬件故障一旦虚拟化服务器硬件发生故障,云管理子系统将对其承载的虚拟机进行关机操作,同时配合后端的共享存储系统在其余健康状况良好的虚拟化服务器中即刻启动相应的虚拟机镜像,将虚拟机的服务中断时间缩到最小,以保障应用业务的可连续性。1.1.1资源池管理云计算的第一步是将硬件统一为资源池进行统一的管理及调度,为了帮助系统管理员快速部署服务器,Citrix云计算平台通过向导方式将用于云计算的主机添加到资源池,不同的虚拟化可以视为一个资资源池,目前CloudStack支持主流的服务器虚拟化,包括XenServer,ESX,KVM,Hyper-v以及OracleVM,如下图所示:117 1.1.1网络管理网络是云计算环境最重要的环节,包括网络隔离,防火墙,负载均衡,虚拟路由,服务质量等方方面面;通过灵活的网络及网络服务配置,可以做到针对单位,部门甚至个人提供不同的网络服务,满足现代企业复杂的网络需求。117 1.1云运营管理平台-CloudPortalBusinessManagerCitrixCloudPortalBusinessManager是一个业务/运营支持系统(B/OSS)平台,利用该平台,服务提供商能够通过基于CloudStack平台构建的基础设施即服务(IaaS)云实现市场销售。CloudPortalBusinessManager是一个企业级运营支持平台,与CloudStack相集成。CloudPortalBusinessManager包括帐户管理、价格与账单、CRM和报告的标准模块和组件,这些模块和组件可以快速实现运营商、企业及Web2.0等的公有云计算。CloudPortalBusinessManager包含如下主要功能及组件:117 1.1.1产品管理● 产品经理可以在所有目录中重用同一产品组合。● 服务提供商可以在创建渠道时创建目录。● 运营管理员可以查看与其网络连接的所有VM。● 运营管理员可以查看其VM所连接的网络。● 服务提供商可以定义市场活动,为用户提供折扣而不是在指定时间段内免费使用。● 服务提供商可以指定能够注册指定市场活动(促销)的帐户数。● 服务提供商可以创建自定义渠道,以展示基于地理位置的销售渠道。● 服务提供商可以允许匿名用户查看产品目录。1.1.2帐户管理● 服务提供商可以阻止用户从列入黑名单的域进行注册。● 服务提供商可以向任意电子邮件地址发送测试电子邮件(用以测试电子邮件模板)。● 服务提供商可以施加限制,只允许电子邮件地址在特定域中的用户进行注册。● 服务提供商可以通过相应的支付网关使用多种货币收取零售客户的费用。● 服务提供商可以要求在激活帐户前存入定金。● 服务提供商可以在CentOS6.0上运行CloudPortalBusinessManager。● 服务提供商可以提供用来启用GoogleAnalytics的数据。● 服务提供商可以在用户多次登录失败后自动锁定该用户,以保护用户免受暴力破解攻击。● 服务提供商可以根据设备诈骗控制服务ThreatMetrix检测欺诈或可疑行为,从而最大程度降低被骗可能性。● 服务提供商可以预先授权订购,从而最大程度降低被骗可能性。● 客户可以相对简单而又高效地安装及配置产品。● 服务提供商可以检测帐户用户的电话类型,阻止某类电话进行注册。● 服务提供商可以配置系统以管理每个客户的多个地址。1.1.3自定义●运营管理员可以编辑用于所有电子邮件的模板。使用情况与账单● 帐户所有者可以在“使用情况与账单”中查看使用费的费率。● 服务提供商可以对已停止的VM收取费用。● 服务提供商可以用多个周期频率定义付款方式。● 服务提供商可以在名言上为客户(或客户类型)开立账单。117 1.1.1客户功能● 新用户可以设置自己的密码。● 用户可以管理次要电子邮件地址。● 用户只有在通过了二次身份验证之后才能访问其API密钥,从而保证这些凭据的安全。● 用户可以通过角色类型管理其SSH密钥对。● 默认情况下,用户可以使用公司地址作为账单/信用卡地址。● 用户可以选择自己的首选语言。● 注册用户可以获得特定于其渠道的促销。● 用户仅在具有相应角色(角色类型)时才能提交故障票据。● 在具有基本网络连接的区域中启动VM时,用户可以管理和选择“安全组”。1.1.2帐户管理功能● 支持客户自行注册● 为服务提供商用户提供辅助注册,实现手动创建客户帐户● 查看和修改帐户信息● 用户可创建个人资料● 登录、注销和密码重置功能1.1.3产品、目录和价格管理功能● 创建及管理多个产品目录和产品组合● 创建不同的账单方案,汇集固定使用费计量、包含的使用情况级别套餐、一次性设置费、定期订购续订费和年费● 在不同目录中设置不同的价格● 支持渠道目录相关性,启用基于合作伙伴的销售渠道● 对基于固定使用量的账单适用的使用费率表●订购管理1.1.4账单功能● 按账单周期存储客户的原始费用与定价后的费用信息● 中间引擎-一种专用服务器组件,用于将来自CloudStack的原始使用数据转换为能够定价并转换为货币价值的商业数据117 ● 基于订购的账单模型和使用费账单模型● “税额”模块● 定期账单运行生成客户发票● 通过帐户信用额或信用卡退款(收手续费)来退款● 通过SecureGateway使用信用卡处理付款● 客户能够查看分期费用和信用余额、按账单周期查看发票、为特定发票付款以及更新支付卡详细信息1.1.1客户关系管理功能● 管理客户帐户信息● 查看、提交故障票据以及为故障票据添加备注● 代表客户对客户帐户执行操作,如填写故障票据或重置忘记的密码。● 关于客户活动和使用情况的报告1.1.2资源使用情况监控功能● 客户能够分配和管理预算并在接近金额限制时收到警报● 客户、客户的用户以及服务提供商人员能够查看客户资源使用情况● 醒目的控制板仪表显示当前的使用量总计1.1.3报告功能● 新客户注册报告● 按迄今为止的费用总额排名靠前的客户● 按产品报告的每月使用情况将VM、网络字节等使用情况进行对比● 按产品组合报告的每月使用情况将不同产品组合的客户订购使用情况级别进行对比● 将报告导出为CSV、PDF、JPG或电子邮件● 按日期过滤1.1.4用户配置功能● 为服务提供商组织或客户帐户中的用户创建登录信息● 用于分配权限的安全角色类型,以确保用户能够访问适当的资源和数据● 存储及修改联系人详细信息和个人头像117 1.1.1管理员帐户CloudPortalBusinessManager附带以下内置管理帐户功能:● Root用户是一组安全权限,为CloudPortalBusinessManager的初始用户提供了最大的灵活性。服务提供商的其他用户必须由Root用户创建或者由Root用户创建的用户来创建。● 门户用户并非真实的人员。CloudPortalBusinessManager使用该用户进行内部操作。您会在通知和日志中看到提及此用户。● 服务帐户包含服务提供商自身的用户和信息。1.1.2门户管理功能● 控制板概要介绍了基础结构资源使用情况、服务运行状况、客户活动和通知。● 通过配置属性,授权用户可以修改CloudPortalBusinessManager模块行为的方式,这些模块包括报告、账单、付款拖欠处理、警报电子邮件目的地、自动发送电子邮件触发器,等等。● 维护期间暂停批处理作业的能力。1.1.3内容和消息传递功能● 由与使用情况和费用等级、帐户状态、客户付款失败及服务运行状况相关的事件所触发的警报和通知● 授权用户能够发布事件更新,如计划的维护、中断和问题● 适用于出站电子邮件的可自定义模板●基本国际化框架1.1.4安全功能CloudPortalBusinessManager提供了各种安全机制,以确保只有经过授权的人员才能够访问数据。● 使用每个客户的支付网关ID与支付网关之间安全地交换数据。所有信用卡信息均由网关提供商存储,而非CloudPortalBusinessManager数据库。● 使用CAPTCHA验证响应测试来确保新帐户请求是由真人提交的。● 对CloudPortalBusinessManager数据库中的所有敏感数据(如电子邮件地址和密码)应用加密。这些值将使用高级加密标准中的AES-128标准加密。● 还可以使用AES-128加密cloud.properties配置文件中的值(如数据库密码)。117 ● 加密密钥存储在属性文件中,而该属性文件也可进行加密。1.1.1可靠性功能● 能够运行多个CloudPortalBusinessManager服务器实例● 与负载平衡器结合来管理系统压力● MySQL数据库使用InnoDB存储引擎,以获得更好的数据完整性和可靠性1.1.2自定义功能● 针对UX进行组件化和功能自定义● 使用XML通过HTTP(S)支持API● 可通过修改电子邮件模板来自定义自动生成的电子邮件● 可将服务条款链接配置为指向您自己组织的服务条款1.1.3集成● 与CloudStack完全集成。在CloudPortalBusinessManager用户界面中提供CloudStack中的通知和使用情况数据。可快速访问完整的CloudStack基础结构管理用户界面● Salesforce.com服务云集成可提供故障票据生成功能● CyberSource支付网关集成可实现财务事务处理● 支持单点登录Liferay企业门户平台1.2CloudPortal功能详解1.2.1控制板控制板提供一个因登录用户而异的概要视图。首次设置CloudPortalBusinessManager安装时,将根据业务需要为公司内每个用户自定义包含在控制板内的小工具和显示。例如,运营管理员可117 能对与系统运行状况相关的显示最感兴趣,而财务管理员可能更愿意查看关于客户注册级别和使用情况的报告。以下显示的是Root用户的控制板:每位用户(无论角色如何)都有一个控制板。其内容因登录用户而异。例如:● 客户帐户的主用户可以看到使用此客户帐户的用户。● 客户可以查看“费用与预算”报告和“费用(按类别)”报告。● 服务提供商的Root用户或运营管理员可以查看关于新注册的客户和重要客户的报告。● 在“容量概览”中,可以查看云中的资源使用量。● 在“客户概览”中,查看关于客户活动的统计图。● 在“服务运行状况”中,快速查看云基础结构的状态的概要。● 在“通知”中,查看关于云中事件的最新警报的概要列表。117 1.1.1容量概览在“容量概览”中,可以查看云中的资源使用量。使用下拉列表将显示更改为不同的区域和提供点。资源用尽或消耗后,水平状态栏会改变颜色。绿色表示该特定资源非常充足。琥珀色表示资源即将用尽。资源的状态栏为红色表示该资源已达到临界极限。1.1.2服务运行状况门户的状态可以通过称为“运行状况”的整体评估来概括。运行状况的状态以手动方式设置。客户用户以及您的组织内具备所需权限的用户都可以看到此信息。通过服务运行状况可以使内部人员和客户快速了解系统的运行状况。多数用户都可以查看服务运行状况。如果具备“运营沟通”权限,则可以设置服务运行状况。117 1.1.1定期维护如果预期需要使某个区域脱机进行必要的维护,可以计划一个维护时限。客户用户以及您的组织内具备所需权限的用户都可以看到维护时限计划。这样,内部人员与客户便可以了解何时服务可能会中断以及服务中的改进。如果您具备“运营沟通”权限,则可以设置定期维护。117 1.1.1通知CloudPortalBusinessManager提供了各种有关日常事件以及需注意问题的通知。通知会显示在用户界面中,也会发送到您指定的任何电子邮件地址。这里我们不打算介绍每个可能的通知,因为数量众多,而且这些通知都自带描述性文本。通知有两个来源:● CloudPortalBusinessManager事件和警报,例如创建新帐户。● 从底层基础结构传递过来的CloudStack事件和警报。CloudPortalBusinessManager服务提供商的大多数用户都至少可以查看其中的部分通知。显示的通知因登录身份而异。例如,具有“运营沟通”权限的用户将看到有关系统运行状况的通知,而具有“帐户管理”权限的用户则会看到与客户活动有关的通知。117 1.1.1客户帐户帐户是您将向其发送账单的实体。每个客户通常有一个帐户,而无论该客户是个人还是公司。帐户用于跟踪每个客户的活动、对客户组织中的所有用户进行分组、在报告中方便地对比各个客户以及开立账单和记账。可以通过以下两种方式之一创建帐户。只要客户完成门户中的自助配置页面,CloudPortalBusinessManager就会自动创建一个帐户;请参阅注册CloudPortalBusinessManager。您也可以手动创建帐户;例如,如果您的销售团队已与一家感兴趣的公司洽谈过,并开发了一个新的CloudPortalBusinessManager客户。创建帐户并不意味着客户已经过评估或已核实其付款详情。这些步骤在首次付款时进行,例如客户通过启动虚拟机首次使用您的CloudStack117 基础结构时。此时,系统会提示客户提供付款详情(除非客户具有免费试用或后付费帐户),CloudPortalBusinessManager将验证支付卡是否有效。您可以发送一封确认电子邮件,或者如果遇到任何问题,也可以发送一封要求提供更多详情(例如另一张信用卡)的电子邮件。您甚至可能希望与新客户电话联系。下图所示为“帐户”选项卡。可添加和编辑帐户、管理帐户、删除帐户、更改帐户状态等,包括试用帐户、零售帐户和公司帐户。1.1.1客户帐户生命周期如果某个客户无法为发票付款,您可以采取一系列措施,逐步限制客户的117 权限,以保护贵组织免受经济损失。可以通过自动或手动方式,在从“活动”到“已终止”等各种状态之间更改客户帐户的状态,但不必一定按照下面所示的顺序更改。在帐户到达最终的“已终止”状态后,客户将无法再与CloudPortalBusinessManager交互,但会保留帐户数据。状态说明新建帐户刚刚创建,用户尚未将其激活。活动可以使用。客户能够登录、创建用户、启动及停止VM、分配IP地址、存储、网络等资源。已受限只有帐户所有者能够登录。现有服务继续运行,客户能够根据需要关闭服务,但客户无法启动任何新服务。已暂停所有服务均已关闭,无法重新启动。只有帐户所有者能够登录。客户无法启动任何新服务,但能够查看和修改财务信息;例如,提供新的信用卡卡号。已终止客户关系已终止。帐户仍存在,但已禁用,客户无法再使用该帐户。所有服务均已关闭并删除。同时删除了该帐户的所有用户。此客户的所有域也已从云中删除。但不会将该帐户从CloudPortalBusinessManager中删除。帐户数据仍保留在CloudPortalBusinessManager数据库中。117 1.1.1管理客户帐户服务提供商用户可以管理其客户帐户。可以代表客户执行许多操作。相应地,客户自身也可以拥有自己的用户。您也可以管理客户帐户的用户。是否可以执行下面列出的所有操作,取决于服务提供商用户所具有的权限(帐户创建,帐户管理等)。管理员(如Root用户)可以查看和使用特定的帐户类型,也可以按照帐户所处的状态(“新建”、“活动”、“已受限”等)来查看帐户。在下图中,管理员可以随时通过单击“首页”选项卡来重新使用您的帐户(Root用户)。您可以使用这种方式在用户的帐户和您自己的帐户之间切换。下面是Root用户身份登录时的客户控制板。117 管理员可以对客户账户进行如下操作:为客户退款到信用卡查看客户的帐单历史记录更改客户的状态(“活动”、“已受限”、“已暂停”或“已终止”)编辑客户的帐户详情设置客户的帐户限制查看客户的状态更改历史记录查看客户的待定更改使用客户的控制板管理客户的门户资源为客户启动虚拟机管理客户的预算和费用警报117 查看客户帐户的服务运行状况管理客户帐户的用户角色类型删除客户1.1.1帐户类型帐户类型反映已经与客户达成一致的付款安排。除此之外,根据帐户类型的不同,注册过程的某些部分也会有所变化。系统帐户类型是服务提供商的帐户类型,可在安装过程中自定义,除了此帐户类型,CloudPortalBusinessManager还提供了以下三种帐户类型。具体如下:● 零售帐户:此帐户类型会定期向存档的信用卡开立账单。● 公司帐户:这些帐户将分配给具有既定信用额的公司。此帐户类型需要额外处理,因此需要更多的时间来激活。● 试用帐户:此类型为试用帐户类型。注:系统帐户类型是CloudPortalBusinessManager中用于表示服务运营商的帐户类型,因此,不可自定义。其属性为只读属性,无法编辑。117 1.1.1将电子邮件域列入黑名单您可将可疑或者不信任的电子邮件域列入黑名单。用户如果尝试使用列入黑名单的电子邮件域进行注册,其注册过程会中止,并附有一条消息“您的电子邮件域不受支持,请与技术支持人员联系。”。以下情况下会强制执行列入黑名单的电子邮件域:● 当用户尝试使用列入黑名单的电子邮件域从“注册”页面注册时。● 当Root用户或运营管理员尝试用列入黑名单的电子邮件域注册用户时。● 当Root用户、运营管理员或常规用户尝试将现有电子邮件域编辑成列入黑名单的电子邮件域时。您还可以将已存在于CPBM中的电子邮件域列入黑名单。如果将现有电子邮件域列入黑名单,已117 使用该域注册的用户不会受到影响。不过,在将域列入到黑名单之后,如果用户尝试使用该域注册,其注册会受到阻止。1.1.1处理失败的登录尝试CloudPortalBusinessManager具有一项帐户锁定功能,可阻止未经授权或无效的访问。此功能可对无效的登录尝试进行双重处理:阈值1:如果客户输入的密码不正确,CPBM将再次显示登录页面。此阈值由failed.login.captcha.threshold属性控制。此属性确定在允许客户登录失败多少次以后,登录进程要求通过CAPTCHA验证。客户超出此阈值所指示的登录尝试次数后,每次再尝试登录时,都会要求客户通过CAPTCHA验证。如果客户未能通过CAPTCHA验证,则不会继续登录。注:如果客户未能通过CAPTCHA验证,失败的登录计数不再增加。此属性的默认值为两次。如果您具有帐户管理权限,可在CPBM阈值2:此阈值由failed.login.lock.threshold属性控制。此属性确定在经过多少次失败登录后锁定客户帐户。当客户超出此属性指出的登录尝试次数后,他们的帐户将被锁定。此后,他们必须重置密码才能解除对用户帐户的锁定。此属性的默认值为三次。如果您具有帐户管理权限,可在CPBM用户界面中配置此属性。117 1.1.1处理付款失败CloudPortalBusinessManager使用一项称为自动付款的功能,即当发票到约定的付款时间时,系统自动从客户信用卡中扣除费用。但是,如果当发票到约定的付款时间时,CloudPortalBusinessManager无法自动从信用卡中扣除应付金额,可能会出现付款失败。CloudPortalBusinessManager中如何处理付款失败付款失败阈值决定了CloudPortalBusinessManager在执行进一步操作之前尝试收取付款的次数。默认值设置为三次(每天一次,尝试三天)。超出此阈值后,CloudPortalBusinessManager开始对拖欠客户发出警报,并将限制、暂停或终止他们的帐户。下面的表格显示当超出分期付款失败阈值时,CloudPortalBusinessManager采取的操作。1.1.2CRM和故障票据BusinessManager具有可帮助您管理客户关系的功能。您可以借用任何客户的身份,查看客户帐户的主用户所能看到的同一用户界面。在以下情况下此操作非常有用:需要实时跟踪客户的使用情况时;将迄今为止产生的费用与客户设置的预算限额进行比较时;执行其他操作时。实际上,能够以客户身份登录对于代表客户执行操作也非常有用,117 例如重置密码或填写故障票据。CloudPortalBusinessManager与Salesforce.com的ServiceCloud相集成。此组件用于记录客户提出的技术支持请求(故障票据)。通过CloudPortalBusinessManager故障票据记录用户界面,可以查看和提交存储在Salesforce中的故障票据。在CloudPortalBusinessManager和Salesforce中均可查看在其中任一位置创建的故障票据。查看和修改故障票据客户用户可以查看自己的故障票据。如果具有“技术支持票据管理”权限,则可以通过“支持”选项卡的“票据”屏幕查看客户的故障票据。如果还具有“帐户创建”或“帐户管理”权限,则可以通过导航到客户的控制板访问客户的“票据”屏幕来查看故障票据。117 1.1.1产品管理产品是客户可以通过门户购买的项目。每种产品都有名称、价格、度量单位(如小时或字节)和类型。CloudPortalBusinessManager中的产品类型可以根据您的业务需求进行定制。一些常见的产品类型包括模板、VM和存储容量。首次设置安装的CloudPortalBusinessManager时,将在CloudPortalBusinessManager配置中设置与您的业务需求相关的产品类型。这些内置的设置会影响“产品”屏幕中显示的选项。可以在CloudPortalBusinessManager中添加三种类型的产品类型●运行的VM●ISO组●模板组您只能添加和编辑以上列出的产品类型。安装CloudPortalBusinessManager时,还会默认添加一些其他服务类型的产品。服务产品类型包括虚拟机管理程序、IP地址、负载平衡器策略、端口转发规则等等。117 产品价格门户中的每一种产品都有对应于支持的所有货币的关联价格。如果为产品设置了未来的价格,该价格将从规划的生效日期开始生效。添加产品时,该产品自动在未来的费率表中列出。但在每种受支持的货币中,产品的默认价格均设置为零。可以通过编辑未来的费率表来编辑产品的价格。未设置默认价格的产品对于尚未设置未来价格的产品,可以使用“规划”链接或者从如下所示的“产品价格”选项卡设置价格。例如,产品Product1未设置价格。可以编辑此产品以受支持的每种货币表示的收费标准。117 添加新产品root用户或者运营管理员可以通过向导的方式添加新的产品,包括设置服务类型(服务”默认为CloudStack。默认的“类型”为IaaS,表示其为基于CloudStack构建的服务云形式的基础结构)、产品类别、服务方案等。如下图所示:117 1.1.1规划产品收费标准您可以规划一个费率表,用来确定门户中每个产品的收费标准。可以使用门户所支持的各种不同货币为产品制定不同价格。还可以一个设置规划日期。该日期决定了您希望收费标准生效的未来日期。在为未来费率表设定的日期到来之前,仍然实行当前的费率表。还可以进行以下操作:● 查看规划的收费标准● 编辑规划的收费标准● 删除规划的收费标准● 编辑规划的日期● 删除规划的日期117 1.1.1渠道与目录渠道指代市场细分,您(作为服务提供商)可以据此向所辖市场进行销售。渠道可以指代纵向市场,例如教育行业、政府部门和工业领域的采购商;还可以指代经销商、合作伙伴以及各地理区域(例如亚太地区、欧洲地区和中东地区)。渠道与客户之间的关联渠道不但控制客户有权访问的门户资源,而且还控制客户能够购买的产品和产品组合。可以为您注册的每位客户分配一个渠道。请参阅添加客户帐户。为客户分配渠道后,您和客户都将无法更改该渠道。分配给客户的渠道称为该客户的源渠道。渠道与目录之间的关联每个渠道都对应一个目录,用于列出该渠道中销售的产品和产品组合。目录是产品组合的逻辑分组。可以向目录中添加任意数量的产品组合。但是,只能添加之前已发布的产品组合。有关发布产品组合的详细信息,请参阅发布产品组合。渠道与支持的货币一个渠道可以支持多种货币。对于每个渠道,此版本的CloudPortalBusinessManager最多可以支持六种货币。注:在CloudPortalBusinessManager的安装和配置期间,必须激活货117 币列表。作为服务提供商,您可以选择不同的渠道支持不同的货币。默认情况下,目录将继承产品或产品组合的默认价格,以此渠道支持的货币为单位。但是,您可以选择在某个渠道中替换此价格,因此,特定目录中将具有特定的价格。1.1.1产品组合产品组合是一组计划作为一个产品单位来购买的一个或多个相关产品。编组目录时,需将产品组合编入目录中。如果不需要将相关产品组合在一起,可以为每个产品创建一个产品组合。每个产品组合都有一个名称、账单方案、套餐清单及关联的价格。账单方案可以包含一个或多个收费标准,如一次性安装费加上月度订购续订费。产品组合价格117 门户中的每一种产品组合都有对应于支持的所有货币的关联价格。如果为产品组合设置了未来的价格,该价格将从规划的生效日期开始生效。添加产品组合时,该组合自动在未来的费率表中列出。但在每种受支持的货币中,产品组合的默认价格均设置为零。可以通过编辑未来的费率表来编辑产品组合的价格。1.1.1市场活动和促销市场活动是您在CloudPortalBusinessManager中创建的一项营销计划,用于将新产品介绍给在市场活动期间注册的客户、扩大客户群或通过为客户提供更多优惠来留住客户。对于在市场活动期间注册的试用用户,将为他们提供一个促销代码,他们将使用该代码注册。试用用户必须提供该代码。将会为这些客户分配一个试用帐户类型,他们可以在注册页面提供的框中输入该促销代码,进行注册。117 对于在市场活动期间注册的非试用用户(“零售”用户和“公司”用户),他们也可以报名参加正在进行的市场活动和促销。不过,对于非试用用户,促销代码并非必填字段,如注册部分所述。注:默认情况下,试用用户可享受全额折扣(100%),而非试用用户享受的优惠折扣由管理员设置的规则来控制,本部分在下文中有更详细的介绍。试用期到期时,帐户所有者会收到一封电子邮件通知。帐户的资源(如运行VM、模板、快照、存储等)将被停止。经过一段时间(可配置此时间段)后,这些资源会释放到系统中。1.1.1管理CloudPortalBusinessManager允许您执行多项管理任务。为您提供了一个专用的“管理”模块,您可以在其中设置各种参数,管理帐户、账单、117 技术支持功能、批处理作业,添加服务提供商用户以及自定义电子邮件模板,此外还有许多其他功能。包括:配置帐户管理参数配置帐户配置参数配置账单参数配置用于客户关系管理的电子邮件地址配置技术支持联系人详细信息配置与第三方的集成配置服务器参数配置费用管理配置角色类型权限添加和编辑服务提供商用户角色类型查看批处理作业的状态查看和编辑帐户类型参数自定义电子邮件模板如下图所示:117 1.1.1角色类型角色类型是一组使用“管理员”或“经理”之类的名称保存的权限。门户的每位用户(包括您本人)都分配有一个角色类型。角色类型是在将用户添加到门户时分配的。角色类型有助于保存常用的权限集合,以便通过一个步骤即可轻松地将这些权限授予用户。与为每个用户分别设置单项权限相比,这种做法更简单,也更不容易出错。角色类型还能确保为职责和需求相当的多个用户授予相同的权限。例如,您可能想为“销售”角色类型授予“创建客户帐户”权限,但不为“技术支持”角色类型授予此权限。CloudPortalBusinessManager中的预定义角色类型CloudPortalBusinessManager附带一组预定义的角色类型。您无法添加或删除角色类型。如果具有“创建/管理角色类型”权限,则可选择使117 用每个角色类型名称所授予的权限。以下为CloudPortalBusinessManager中的角色类型。CloudPortalBusinessManager用户界面(下面所示的屏幕快照)只含有很少的关于预定义角色类型、角色名称及其说明的信息,管理员可以自定义角色类型,包括:服务提供商角色类型● Root● 运营管理员● 财务管理员●销售支持● 技术支持● 产品经理客户角色类型● 主用户● 账单管理员● 用户● 超级用户117 1.1.1查看批处理作业运行状态CloudPortalBusinessManager使用多个批处理作业执行其常规流程,如跟踪使用情况及生成发票。这些作业计划在特定时间运行,并以设定的间隔重复。在CloudPortalBusinessManager中,批处理作业以JavaBean的形式实现,使用Spring2平台运行。117 作业类型包含:使用情况复制、使用情况处理、增加、付款运行、填写账单、生成发票、金额限制、日常定制、试用到期日期、账户暂停等。CloudPortal使用多个批处理作业执行其常规流程,如跟踪使用情况及生成发票。这些作业计划在特定时间运行,并以设定的间隔重复。1.1.1集成CloudPortalBusinessManager安装集成了电话验证、欺诈控制和地理定位、支付网关、故障票据生成以及单点登录等第三方功能。以下是其中的几个集成:● 与CloudStack完全集成。CloudStack的通知和使用情况数据在CloudPortal用户界面中提供。可快速访问完整的CloudStack117 基础结构管理用户界面。● Salesforce.com服务云集成可提供故障票据生成功能● Authorize.net、CyberSource支付网关集成以实现财务事务处理● 支持单点登录Liferay企业门户平台可以进行如下操作:配置支付网关LDAP服务器参数到CloudStack的连接站点流量分析参数Salesforce参数地理定位和欺诈控制参数电话验证参数配置费用管理117 1.1.1自定义CloudPortalBusinessManager为管理员用户提供了多个控件,用于自定义门户功能以满足各自组织的需求。下面汇总了可进行自定义的各种功能和特性:自定义内容模板自定义服务提供商标志和图标设置服务条款和条件自定义控制板自定义电子邮件别名1.1.2账单CloudPortalBusinessManager可自动为您跟踪客户使用的资源、计算欠款金额以及处理发票开立和付款。每个账单周期都会生成一次发票。发票开立每天都运行,为前一天结束账单周期的所有帐户开立发票。对于CloudPortalBusinessManager中有付款信息记录的自动付款帐户,将通过支付网关(例如CyberSource),使用客户提供的信用卡详细信息收取付款。所有信用卡详情均由网关提供商存储,而非CloudPortalBusinessManager。1.1.3客户帐户默认情况下,CloudPortalBusinessManager中有三种类型的帐户。服117 务提供商自己的帐户具有特殊的“系统”帐户类型。此类型帐户无需开立账单。当客户在您的门户中使用自助注册时,他们可以选择三种帐户类型中的一种。当您通过CloudPortalBusinessManager用户界面注册客户时,您也可以分配这些帐户类型中的任一类型。在每个账单周期结束时,将在客户信用卡中收取以下各项费用。将要收费的确切项目由客户所订购产品组合的套餐和费率表来决定。例如,某些产品组合需要月费,而另外一些产品组合则不需要月费。● 即将到来的账单周期的全额订购续订费。● 当前账单周期内超出客户订购所含数量的资源使用量。此使用量按照适用的使用费率表中的费率收费。有关费率表的详细信息,请参阅产品管理。● 原始订购周年日恰好位于当前账单周期中的年费续订。● 在当前账单期间当中开始的订购的定期分摊费用● 一次性设置费● 年费1.1.1价格计算CloudPortalBusinessManager计算应付金额时会参考每个目录项的存储价格和目录的使用费率表。● 每个单项产品都设置有使用量的单价,称为“使用费率”117 ● 将产品划分到产品组合中时,每个产品的一些使用量可计入其中,构成产品组合的总订购费。这部分使用量不计入使用费率。计算每张发票的费用时,CloudPortalBusinessManager会考虑到这一点。● 每个产品组合都有一个或多个关联费用。简单的账单由每月要收取的单笔费用组成。但每个产品组合都可以有其他费用,这些费用可能是每月或每年发生,也可能只在客户首次订购该产品组合时发生一次。1.1.1订购处理以下步骤概述了产品组合订购账单的处理方式。1客户选择一个产品组合,然后完成整个订购向导。例如,客户可能会启动VM。2如果订购有月费,则会在必要时分摊到当月,以便与客户的现有账单周期保持同步。如果客户之前进行过采购,该客户可能已经有一个生效的订购续订日期;例如,每月15日。对于在当月任何其他日期产生的新订购,会将部分金额加到下一张发票(如果为年度订购,则为全部金额)。从那时起,新订购将在向客户其他订购收取费用的同一天全额收取其定期续订费。3CloudPortalBusinessManager开始跟踪客户对订购中套餐的使用情况。超出所含数量的使用量将导致在客户当前账单周期的总额上增加附加费用。4在续订日期生成发票,并向存档的信用卡收取总使用量的费用。117 1客户或服务提供商代表可随时取消其中一项客户订购。终止订购时,不再分摊月费。1.1.1查看付款活动付款活动显示某个特定客户在一段时间内所支付的费用。如果想了解关于比较客户在您的整个服务期间所花费用的概述,请参阅报告。客户帐户的主用户和账单管理员用户能够看到帐户的“付款活动”。如果您具有财务创建/管理权限,则可查看任何客户的付款活动。1.1.2设置信用卡详细信息首次注册门户时,客户应提供信用卡号和其他付款详细信息。以后如果出现以下情况,您需要更改付款详细信息:● 客户的信用卡被授权网关拒绝,因此提供了一个新卡号。● 客户的账单地址发生变化。客户帐户的主用户和账单管理员用户能够修改自己的付款详细信息。如果您具有财务创建/管理权限,则可修改自己的付款详细信息。1.1.3报告CloudPortalBusinessManager的报告可以提供图形显示,可用来大致了解当前的服务情况。可以在运行报告前提供开始和结束日期,将报告范围限定在特定时段。有多种导出格式可供您使用,包括117 PNG、JPEG、PDF和SVG矢量格式。下图显示了可以生成的不同种类的报告。新注册客户客户等级117 产品使用情况产品组合使用情况自定义报告首次安装时,CloudPortalBusinessManager会提供一组内置报告。借117 助于CloudPortalProfessionalServices,您可以添加自定义报告,以满足您的特定报告要求。自定义报告通过CloudPortalBusinessManager用户界面以特别报告的形式生成,并可以接受输入参数。1.1.1自助注册每当您在门户中完成自助配置页面时,CloudPortalBusinessManager都会创建一个帐户:1.1.2非管理员(客户)功能非管理员(客户)登录门户后如下图所示:117 在这里可以执行如下操作:管理角色类型管理资源启动虚拟机管理预算和费用警报查看您的使用情况与账单查看您的服务运行状况提交、查看、修改和关闭您的故障票据1.1.1.1管理角色类型角色类型是一组使用“管理员”或“经理”之类的名称保存的权限。门户的每位用户(包括您本人)都分配有一个角色类型。角色类型是在将用户添加到门户时分配的。角色类型有助于保存常用的权限集合,以便通过一个步骤即可轻松地将这117 些权限授予用户。与为每个用户分别设置单项权限相比,这种做法更简单,也更不容易出错。角色类型还能确保为职责和需求相当的多个用户授予相同的权限。CloudPortalBusinessManager中的预定义角色类型CloudPortalBusinessManager附带一组预定义的角色类型。您无法添加或删除角色类型。如果具有所需权限,您可以管理用户的角色类型。以下为CloudPortalBusinessManager中的角色类型。● 主用户● 账单管理员●用户●超级用户注:如果具有所需权限,您可以管理您的角色类型,也可以管理其他用户的角色类型。例如,假如您是主用户,并且具有管理您帐户中的用户角色类型的权限。要管理您的角色类型,请使用您的凭据登录进行下列的管理:向客户账户添加用户编辑用户账户申请转换账户类型编辑公司设置编辑账单地址和信用卡详细信息设置通知选项查看API凭据设置SSH秘钥对管理预算和费用警报117 了解账单查看服务运行状态管理资源1.1.1.1管理资源服务提供商为您分配了许多资源,您可以在安装中对这些资源进行管理。可以添加、编辑和删除VM、模板、卷、IP地址和ISO。可以手动创建快照,或安排定期创建快照。以下部分介绍了如何有效管理您的资源。● 实例:这是用来描述虚拟机的另一个术语。您可以看到有关您的所有VM的信息,以及有关您可以在此处执行的添加、编辑、重新启动和销毁VM等大量其他操作的信息。● 卷:卷是您创建的或已存在于安装中的存储元素。请参阅卷。● 快照:快照是某个时间点的系统配置。快照很有用,它展示了在创建快照时的虚拟机配置。快照包括文件、内存状态以及虚拟机设置。您可以创建虚拟机快照,并可在以后需要时还原到这些快照。● IP地址:您的VM具有关联IP地址。您可以管理VM的IP地址以及相关功能,如端口转发、VPN和负载平衡● 模板:模板是随操作系统、应用程序和数据一起加载的虚拟机映像。模板可使虚拟机的配置保持一致。可以从可用模板列表中为要创建的虚拟机选择一个模板。也可以创建一个新的虚拟机。● ISO:ISO映像是与现有文件系统完全相同的副本。● 网络:可以指定您的虚拟机所属于的网络、添加新网络并查看现117 有网络的详细信息。117 第一章中国XXX企业云数据中心设计方法1.1服务器整合估算方法在本中国XXX企业云数据中心的规划构建中,在初期我们将利用虚拟化技术按照1:8的整合比例(考虑到未来环境增长和高可用需要,实际整合比可以更高或降低,但需要进行现场环境数据评估),将多台四路/两路服务器组成集群,构建高可用动态资源池环境,作为数据中心各应用的整体运算资源。需要指出的是,完整的云计算平台环境应该包括提供虚拟化环境下的备份、高可用、资源动态分配、动态电源管理以及维护管理能力。初期保守估算,1台四路服务器按照1:8的整合比例能够满足至少8个应用虚拟机的部署需求,如果虚拟化集群内部署多台四路服务器即可满足更多的应用虚拟机部署需要,未来可以根据负载的实际情况调整服务器整合比例以获得更好的投资收益,也可通过增加集群结点的方式,在线增加资源池的容量以平滑地支持更大规模的应用机集群。在Citrix的云计算基础架构内,区(Zone)、提供点(POD)和集群(Cluster)是灵活管理资源的逻辑抽象,可以分组为层次结构,用于对可用的CPU和内存资源按层次结构进行分区。每台独立主机(Host)隶属于一个集群,每个集群隶属于一个提供点(POD),117 每个提供点隶属于一个区(Zone)。逻辑结构如下图所示:为了方便的进行对资源池资源的合理利用与有效控制,在Citrix云计算里引入了灵活的多用户/租户管理机制和分层机制,如下图所示:117 整个云计算平台从根(ROOT)域(Domain)开始,可以创建不限层级的子域并可为每个子域指定管理员管理本域的资源及用户;每个子域可以包含多个账户(Account),每个账户可包含一个或多个最终用户(User),管理员可针对域、子域、账户或用户进行资源限制,每个用户可以通过统一的CloudPlatform平台提供的自助服务向导在自身的资源范围内创建自己所需要的虚拟机,极大减少IT部门的负担。例如,假定一台主机拥有多个虚拟机。A部门使用其中的三个虚拟机,B部门使用两个虚拟机。由于A部门的数据分析需要更多的CPU和内存,管理员为每组创建了一个子域。管理员将A部门和B部门的CPU份额分别设置为高和正常,以便A部门的用户可以运行自动测试。CPU和内存资源较少的第二个子域足以满足B不部门工作人员的较低负载要求。只要A部门未完全利用所分配到的资源,B部门就可以使用这些可用资源。如下图所示:117 以下数据估算是根据通用应用的统计情况进行的估算,考虑到实际服务器容量的整合规划,还是需要综合考虑中国XXX企业数据中心内实际应用对于内存和CPU的峰值估算使用情况;因此我们仍建议在实际部署中利用本次项目中配置的CapacityIQ软件对现有应用业务的使用情况进行统计和分析后再进入后续的大规模应用虚拟机部署。1.1.1单台服务器运算能力以1台X86四路服务器,无论机架还是刀片,按照每台四路服务器1:8的虚拟机整合比,即预估可为8台单核4路32G内存的应用服务器虚拟机提供整体资源池环境。假设在项目中采用的四路服务器配置了四颗8核的英特尔®至强®E7系列4820处理器,下面对配置4颗英特尔®至强®E7系列4820处理器的单服务器作为XenServer服务器的CPU处理能力计算:硬件描述CPU插槽4路每CPU核心8核CPU每颗核心主频MHz2,000117 每CPU总主频MHz16,000每台服务器总CPU主频MHz64,000每台服务器最大CPU使用率70%每台服务器CPU有效主频MHz44,800单服务器作为XenServer服务器内存计算:硬件描述每台服务器物理内存MB512GB每台服务器最大内存使用率75%每台服务器有效内存MB384GB说明:l每台服务器的运算能力按照峰值而非平均值进行估算,确保可以支持虚拟机应用同时运行的最高值。lCPU和内存的估算需要预留20%的空间用于突发的运算能力过量。l内存超用可以按照50%的比例进行估算,参考整合的应用全部以WindowsServer2003服务器操作系统进行核算。117 1.1.1集群环境整合运算能力假设8台上述的四路服务器构成的XenServer虚拟化集群,对64台虚拟机应用进行计算资源规划,举例如下:属性说明总的虚拟机应用64集群内XenServer服务器节点数8用于集群切换的备用XenServer服务器1(允许1台物理XS资源节点失效)集群内可用的XenServer服务器节点资源7l按照上述集群环境规划,虚拟化数据中心可以支持的平均每个应用的CPU峰值需求应该小于7(集群内有效XenServer主机数)x44800(每台XenServer服务器的有效CPU)/64(总虚拟机数)=4900MHz(通常情况下一般应用的物理主机平均CPU峰值不会超过2000MHz,就目前估算量4900MHz应该完全满足需求;按照峰值2000MHz计算的话目前规划的环境从运算资源上理论上可以满足4900/2000»2.5倍的未来峰值负载或主机数量增长);117 l另一种算法依据CitrixCloudPlatformCPU调度超用技术整合比考量,例如超用50%CPU资源,例如1个虚拟机vCPU需要2000MHz资源则实际分配1000MHz即可,2个虚拟机vCPU择需要2000MHz分配,那么在现有物理主机资源集群上可以超量配置7*44800/1000»314台单vCPU虚拟机,或157台双vCPU虚拟机,或78台4vCPU虚拟机。l按照上述集群环境规划,可以支持的平均每个应用的物理内存峰值使用量应该小于7(集群内有效XenServer主机数)x384GB(每台XenServer服务器的有效物理内存)/32=42GB(通常情况下一般应用的物理主机平均内存使用峰值范围为2000M~4000MB,目前配置的内存满足目前和和理论上未来应用负载和数量扩容42GB/4GB»10个虚拟机的需求。)另外考虑到生产应用数据库较多,而且影响RDBMS数据库的主要性能是随机读取,排序等与内存SGA区有关;其性能与内存大小非常敏感,因此这里推荐的内存越高越好,因此每台服务器配置为512GB内存。l实际根据CapactiyPlanner的估算,很有可能整合更多的应用或者通过节省XenServer服务器,提供更高的可用性。l目前估算的负载均衡集群环境的预留HA备用XenServer服务器,允许在一台XenServer服务器出现故障时接管该主机上运行的虚拟机应用的切换使用。117 l本次云计算环境预估配置的资源,可以满足虚拟机环境资源突发时的资源溢出要求。1.1虚拟化网络架构根据CitrixXenServer及CloudPlatform最佳实践,网络架构应该满足如下要求:lCloudPlatform管理网络(HA心跳互联网络),在线迁移网络,虚拟机对外提供服务的网络应该各自独立。l对于每一个虚拟交换机vSwitch应该配置至少两个上行链路物理网络端口。l对于多网口的冗余配置应该遵循配置在不同PCI插槽间的物理网卡口之间。l对于物理交换网络也应该相应的进行冗余设置,避免单点故障。l建议采用千兆以太网交换网络,避免网络瓶颈。l对于吞吐量和高并发网络带宽使用要求的,可以考虑采用10GbE,不过采用万兆网络在适配器和交换机上的投入成本也会相应增加。简单的方法是通过在虚拟机网络vSwitch上通过对多块1GbE端口捆绑负载均衡实现。每台XenServer服务器规划的虚拟交换机配置如下:虚拟交换机功能说明物理网口数117 0管理控制台,HA心跳互联网络在线迁移网络21虚拟机应用服务网络4(机架服务器)说明:l所选用的网卡必须在XenServer服务器的网络I/O设备兼容列表里 。l对于虚拟交换机的双端口冗余,可以在XenServer操作系统级别实现NICTeaming。l对于虚拟机应用的网络,为了确保虚拟机在执行了迁移到另一物理主机保持其原有的VLAN状态,建议根据实际需要在虚拟交换机端口启用802.1q的VLAN标记(VST)方式;采用此方式可以确保迁移主机可以保留原有的网络配置如网关等,并且建议在网络设置中启用通知物理交换机功能,该功能可以确保迁移主机通过反向ARP通知物理交换机虚拟机端口的更改,确保新的用户会话可以被正确建立。117 XenServer主机网络连接配置示意图:管理控制台及集群心跳、互联网络、在线迁移网络v虚拟机网络1虚拟机网络NVLANXVLANYVLANZ物理交换机1物理交换机2网卡1端口0网卡2端口0网卡1端口1网卡2端口1网卡1端口2网卡2端口21.1虚拟化存储架构考虑采用本地存储将无法形成整个虚拟化集群资源池,因此无法有效的使用云计算环境的高可用,灵活配置等功能;本方案将建议购置或利用现有的存储交换网络SAN网络,并新增磁盘阵列作为共享SAN存储,并做好相应的设备(SANHBA卡、交换机等)布线、空间、场地布局等相应的规划。共享存储阵列主要依据以下两部分进行设计:1.1.1存储空间规划共享数据存储(PrimaryStorage)用于存放虚拟机的镜像文件,其容量规划的公式如下所示:nLUN容量=(Zx(X+Y)*1.25)117 oZ=每LUN上驻留的虚拟机数量oY=虚拟磁盘文件容量oX=内存大小n示例:o假设单一虚拟机文件需要50GB,4GB内存,每LUN驻留20个虚拟机,则LUN容量=(20x(4+50)*1.25)=1350GB第二存储(SencondaryStorage)用于存放每个数据中心(可对应到一个Zone)的操作系统模板,操作系统的安装镜像及操作系统快照,其容量规划的公式如下:LUN容量=Ux[(TxLt)+(IxLi)+(SxLs)]其中:U=云平台用户数T=模板数量;Lt=模板大小I=操作系统安装镜像数量;Li=镜像大小S=快照数量;Ls=快照大小上面假设云平台的每个用户可以自行存放的模板数量、操作系统安装镜像数量及快照数量都相同。117 此外,由于初期设计始终无法满足未来业务变化对于系统容量的需求,CloudPlatform可以支持多个PrimaryStorage和SencondaryStorage,管理员可以在需要的时候通过云管理平台在线添加多个LUN。1.1.1存储性能和可靠性在设计存储架构时应该充分考虑到冗余和性能,因此存储架构的选择根据中国XXX企业云数据中心整体应用对存储的IOPS和吞吐量的需求进行规划,涉及到端到端的主机适配器选择、控制器和端口数量选择以及磁盘数量和RAID方式选择等。每台XenServer服务器到存储的连接示意如下:说明117 l确保每个XenServer内虚拟机并发IO队列长度与HBA适配卡设置保持一致。l底层LUN的需求根据实际虚拟机应用对存储IOPS的实际需求进行规划。l根据应用的需要设置LUN的RAID结构,如对于随机读写的数据库如Oracle、SQL数据库,建议在LUN级别采用RAID10结构,对于数据库日志通常为连续写或恢复时连续读,建议在LUN级别采用RAID5结构。l对于IO密集型的应用尽量采用单独的存储,避免在存储端与其他应用产生IO竞用。l多个虚拟机共用一个数据存储或者多个主机共享一个数据存储,可以启用存储队列QoS确保核心应用的延时在可控范围和对数据存储读写的优先级。l通常情况下1~2TB的LUN大小具有较好的性能和可管理性。l磁盘阵列的选择应该满足整个虚拟化环境最大IOPS的吞吐量需求,并配置足够的存储处理器、缓存和端口数。l对于双活ALUA磁盘阵列(非双活磁盘阵列),为了防止链路抖动,对于每个LUN在同一时间配置只有一个XenServer服务器通过一个存储处理器进行访问,这就需要在多路径策略选择时设置为MRU(最近使用策略),该策略可以保证只有在某个路径故障时才启用另一个存储处理器连接LUN。117 1.1.1存储选型磁盘阵列可以参考如下配置:属性说明厂商和型号依据用户实际存储用量和IOPS需求进行采购类型A/PA/AALUA多路径策略MRU最近使用策略最小/最大交换机端口速率8GbE属性说明存储类型FCSAN磁盘类型FC15Krpm300G存储控制器2(A/PALUA)8GbLUN磁盘大小2TB(通用设置,对于不同类型117 的应用需求有所变更)RAID格式7+1RAID52+2RAID10存储全局热备盘至少1块以上存储交换机每服务器需要的交换端口数存储所需的端口数2(冗余设计)2至少2个XenServer服务器主机HBA卡8Gb说明:l所选用的IPSAN/SAN存储设备(IPSANHBA卡、磁盘阵列)必须在XenServer服务器的IO和SAN磁盘阵列兼容列表里,请参考Citrix的官方网站来确认选用设备是否满足要求。1.1负载均衡高可用环境构建CloudPlatform针对中国XXX企业数据中心云计算基础架构的构建,充分考虑提高所有Citrix云计算环境的可用性设计,利用SAN网络和磁盘阵列构建共享存储及Citrix高可用集群环境;在网络层117 面和存储层面分别利用了CitrixXenServer内置的网络冗余和存储多路径控制确保高可用;在服务器高可用性上,XenServer企业增强版内置的HA和在线等功能可以应对本地站点多种虚拟机应用计划内和计划外意外停机的问题。CitrixHA提供了简单易用、高效、高可用的虚拟机应用运行环境。在物理机发生故障时,可以被集群中的其他物理节点侦测到并且自动在备用物理机或其他有空闲资源的物理机启动故障节点在线的虚拟机,启动模式可以是自动或手动。此外,如果虚拟机操作系统故障也可以被CitrixHA侦测到并尝试重启该虚拟机,最大限度保持虚拟机应用的可用性。利用CitrixDRS动态资源调配可以收集各物理主机和虚拟机资源(CPU、内存等)使用情况,并且提供虚拟机最佳放置策略,可以自动或手动进行虚拟机的在线迁移功能满足最佳负载平衡需求。利用DRS建立资源池,可以最大限度的保证国家税务局信息中心虚拟117 化环境的核心应用,例如针对办公系统的SQL数据库设置高优先级别,确保其在资源池中CPU、内存等资源的配比保持最优。同时,可以构建DRSHA集群在确保负载平衡的同时满足高可用的要求。对于需要对虚拟机所在物理机运行环境进行升级维护时,可以通过CloudPlatform内置的“将主机进入维护模式”功能,在线将该物理机运行的虚拟机通过网络迁移到其他物理主机,并且确保迁移过程中对虚拟机应用没有影响;迁移后所有与客户端的会话连接不会中断。建议在中国XXX企业数据中心的云计算基础架构中综合采用Citrix在线迁移,DRS和HA技术,确保所有运行虚拟机均得到同样的高可用运行环境保护,提高整体的应用SLA。117 1.1资源池规划设计原则通过资源池可以委派对主机(或群集)资源的控制权,在使用资源池划分群集内的所有资源时,其优势非常明显。可以创建多个资源池作为主机或群集的直接子级,并对它们进行配置。然后便可向其他个人或组织委派对资源池的控制权。使用资源池具有下列优点:§灵活的层次结构组织§根据需要添加、移除或重组资源池,或者更改资源分配。o资源池之间相互隔离,资源池内部相互共享,系统管理员可向部门级管理员提供一个资源池。某部门资源池内部的资源分配变化不会对其他不相关的资源池造成不公平的影响。§访问控制和委派o系统管理员使资源池可供部门级管理员使用后,该管理员可以在当前的份额、预留和限制设置向该资源池授予的资源范围内进行所有的虚拟机创建和管理操作。委派通常结合权限设置一起执行。§资源与硬件的分离o如果使用的是已启用DRS的群集,则所有主机的资源始终会分配给群集。这意味着管理员可以独立于117 提供资源的实际主机来进行资源管理。如果将三台2GB主机替换为两台3GB主机,则无需对资源分配进行更改。这一分离实现了聚合计算能力而非单个个主机。§管理运行多层服务的各组虚拟机o为资源池中的多层服务进行虚拟机分组。无需对每个虚拟机进行资源设置,而是可以通过更改该组虚拟机所属资源池的设置来控制对这些虚拟机的总体资源分配。虚拟化整合平台资源池分配资源的示意图如下:如图所示,资源池内部是计算资源和内存资源、Datastore提供存117 储资源、端口组提供网络资源,首先可将多个服务器构建集群,形成一个大资源池,从中可以分配不同的资源池以对应不同部门的用户群,通过设定资源池的预留、限制和共享值来实现资源池的资源划分、资源隔离以及资源的过载,提高整个系统的利用率。Datastore代表存储资源,可以对多个业务系统划分多个Datastore,但是从存储资源利用的角度出发,初期也可以考虑多个业务系统共享一个Datastore的方式。1.1云计算平台的管理CloudPlatform/Portal提供有统一的基于Web的图形界面集中管理软件,一个控制台可以同时支持5000台物理主机,50000台虚拟机的管理,因此部署一台Cloud管理控制台即可以完成各级数据中心所有虚拟机的日常管理工作,包括各虚拟机控制管理、CPU内存管理、用户管理、存储管理、网络管理、日志收集、性能分析、故障诊断、权限管理、在线维护等功能模块。CloudPlatform/Portal控制台具有用户验证功能,只有特定的用户才能进行管理,并能设定不同级别的用户权限以便于实现分级管理;提供安全的远程监控和管理模式;虚拟机故障能实现自动报警功能;能够提供物理服务器或虚拟机的CPU、网络、磁盘使用率等指标的实时数据统计。117 1.1部署体系结构示例及注意事项下图所示为一个部署示例。在此图中,可以看到涉及的硬件组件以及每个软件组件的运行位置。Internet和防火墙显示了用户可以获取软件的位置。系统管理员可以直接登录运行CloudStack和CloudPortal的服务器。提供点是CloudStack管理服务器所管理的计算资源所在的位置。CloudStack管理服务器的安装、设置和使用、网络、CloudStack存储以及提供点在CloudStack部分进行介绍。在总数据量、流量、帐户等方面,CloudPortal所遵从的限制条件和约束与CloudStack相同。请查阅CloudStack文档,了解有关系统限制条件的信息。这对实现设计的可靠性至关重要。以下是几点关于实现可靠性的最佳做法的建议:● 如果有足够数量的计算机,可以通过在多个计算机上运行多个冗余CloudPortal实例来提高可靠性。任何一个实例出现故障,都不太可能对大部分客户产生影响。● 实施稳健的数据库备份策略。● 使用网络监视应用程序监控CloudPortal整体设置。117 1.1云管理平台部署位置CloudPlatform/Portal可以部署在物理主机上,也完全可以统一部署在虚拟机中;考虑到本案中使用一套管理平台管理中国XXX企业所有数据中心,使用4台独立的物理服务器/虚拟机部署管理集群。CloudPlatform/Portal仅用于运行和管理,因此即便CloudPlatform/Portal出现故障,各物理主机仍然可以保持配置好的集群节点状态等,因此不会因为和管理平台通信丢失而造成集群切换等问题。但如果管理平台故障后,仍然可能造成监控和管理上的短时间停顿,因此在本项目我们将管理平台配置成双节点高可用117 集群,还可以根据将来税务业务发展的需要动态在线增加集群节点,每个管理节点都处于active-active状态,并利用管理平台内置的负载均衡或者第三方的负载均衡设备协同工作。117'