内容中心阿里云国际版什么是云架构以及如何构建?

阿里云国际版什么是云架构以及如何构建?

2022-04-07 16:49:54

网站云架构最佳实践

本文介绍了云技术给传统企业带来的技术挑战,并深入讲解了云架构的最佳实践。

云计算作为信息技术领域的一种创新应用模式,自诞生之日起就备受关注。云计算凭借低成本、弹性、易用、高可靠性、按需服务等特点,被视为下一代信息技术变革的核心。云计算已被众多企业积极拥抱,正在改变互联网、游戏、物联网等新兴行业。然而,大多数企业用户往往受到传统 IT 技术架构的限制,缺乏迁移到云的动力和技术专长。

传统IT架构的技术特点和问题

通常,企业中最重要的元素是能够满足实时事务和分析需求的数据库管理系统。传统的单机数据库采用“纵向扩展”的方式,通常只支持几TB数据的存储和处理,远远不能满足实际需求。

基于联机事务处理 (OLTP) 集群的系统正逐渐成为实现更高性能和更大数据存储容量的默认方法。如图1所示,Oracle RAC等常见的企业数据库集群通常采用Share-Everything(共享磁盘)模式。数据库服务器共享资源,例如磁盘和缓存。

当性能达不到要求时,需要对数据库服务器(通常是小型机)进行CPU、内存、磁盘等方面的升级,以提高单节点数据库的服务性能。此外,通过实现并行多节点和服务器负载平衡,可以增加数据库服务器节点的数量以提高性能和整体系统可用性。但是,当数据库服务器节点数量增加时,节点之间的通信成为瓶颈,各个节点的数据访问控制将服从于事务处理的一致性要求。实际案例研究表明,具有四个以上节点的 RAC 非常罕见。

此外,根据摩尔定律,处理器性能每18个月翻一番,而DRAM性能每10年翻一番,造成处理器性能和内存性能之间的差距。虽然处理器性能在快速提升,但由于磁盘的物理限制,磁盘存储性能提升缓慢。机械转速、磁臂寻道时间等因素限制了硬盘的IOPS性能。在过去的 10 年里,硬盘性能的提升基本为零;HDD 磁盘转速一直停留在 7,200-15,000 RPM 之间。基于 HDD 的磁盘阵列存储正日益成为集中式存储架构的性能瓶颈。

因此,IoE 的集中式存储(Share-Everything)方法成本高,并且在性能、容量和可扩展性方面存在限制。互联网带来的高并发和大数据处理需求,x86和开源数据库技术的快速发展,以及NoSQL、Hadoop等分布式系统技术的日益成熟,推动了从集中式纵向扩展系统架构向分布式横向扩展架构。

网络化 IT 的技术挑战及对策

Gartner 的 IT 专家将网络规模 IT 列为 2015 年十大 IT 趋势之一,这将在未来三年内对该行业产生重大影响。据预测,越来越多的公司将通过构建类似于 Amazon、Google 和 Facebook 的应用程序和架构来采用 Web 规模的 IT。这将使 Web 规模的 IT 成为商业硬件平台,将新的开发模式、云优化方法和软件定义方法引入现有基础架构。DevOps 等开发-运营协作模型是开发 Web 规模 IT 的第一步。尽管 Web 规模的 IT 具有潜在的好处,但传统的 IT 系统仍然面临以下几个方面的技术限制。

■ 性能
用户体验是影响转化率的重要因素。据统计,如果一个网站在四秒内无法加载,大约有 60% 的客户会流失。糟糕的用户体验会导致客户放弃服务或购买竞争对手的服务。因此,通过确保高并发访问场景的低延迟响应来制定改善用户体验的解决方案至关重要。

■ 可扩展性
互联网/移动互联网用户的访问行为是动态的。热点的流量可能会激增超过平均流量的 10 倍。制定一个能够快速响应突发流量的资源开销要求并提供无差别用户体验的解决方案至关重要。

■ 容错性和最大可用性
Internet 部署在分布式计算架构上,基于大量x86 服务器和通用网络设备。尽管这些设备被设计成可靠的,但由于设备数量众多,故障的可能性很高。除了机械故障外,软件开发中也会出现bug。
当硬件出现故障时,我们应该如何自动化处理?
我们应该如何进行系统的损害控制?
我们应该如何根据独立服务器的 QPS 和并发限制到服务器和客户端的流量,以实现动态的流量分配?
我们如何识别服务之间的链依赖风险和系统的重要功能点依赖关系?
我们如何评估最大可能的风险点,检测分布式系统的最大可用性故障,隔离故障模块,并对未完成的事务实施回滚?
在通过优雅降级牺牲非关键特性后,我们如何确保核心功能可用?

■ 容量管理
随着业务的扩展,系统性能不可避免地会遇到瓶颈。如何进行更科学的容量评估和扩容,自动计算前端请求与后端服务器数量的对应关系,预测软硬件容量需求?

■ 面向服务
我们如何将业务逻辑功能抽象为原子服务来封装和组装服务,并在分布式系统环境中部署服务,增加业务灵活性?我们如何从业务角度阐明这些服务之间的关系?如何在大规模分布式系统中追踪并呈现单个服务调用链,及时发现服务调用异常?

■ 成本
随着系统演进性能指标的不断变化,我们如何才能确保以最低成本满足特定的访问流量要求?

■ 自动化运维管理
不断演进的大型系统需要持续维护、快速迭代和优化。我们如何处理数千甚至数万台服务器进行运维?我们如何使用自动化工具和流程来管理大型硬件和软件集群并快速部署、升级、扩展和维护系统?

上一篇
速度、可靠性和全球影响力:阿里云国际如何选择合适的 CDN
下一篇
87cloud案例分析:阿里云国际服务器如何支持在线教育
立即咨询 享受更轻松快捷的上云服务
联系我们
联系我们
Skype:87Cloud Alibaba
E-mail:the87cloud@outlook.com
最新活动
合作流程
解决方案
代理合作
关于我们
87Cloud Alibaba
the87cloud@outlook.com
阿里云国际
最新优惠
立即加入
电报交谈
Skype
企业邮箱
返回首页
回到顶部