关键字: [Amazon Web Services re:Invent 2023, Well-Architected Tool, Well Architected Framework, Well Architected Tool, Well Architected Best Practices, Well Architected Pillars, Well Architected Reviews]

本文字数: 2100, 阅读完需: 10 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV11K411b77a

导读

组织经常询问如何在其组织中扩展架构良好的实践。在本论坛中,探索如何使用亚马逊云科技良好架构框架,优化工作负载和流程。了解如何建立基于亚马逊云科技良好架构最佳实践的管理和治理实践。了解如何将亚马逊云科技良好架构的框架用作改进机制,以使用此方法增强其工作负载健康和组织流程的组织为例。

演讲精华

以下是小编为您整理的本次演讲的精华,共1800字,阅读时间大约是9分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

亚马逊云科技提供了良好的架构框架,这套框架包含了一系列最佳实践和指导原则,旨在帮助企业构建安全、高性能、弹性且高效的云端基础设施。这使得组织能够根据诸如安全性、成本优化、性能、可靠性、运营卓越度和可持续性等关键指标,持续评估和改进其工作负载的健康状况。为了深入了解此架构框架的历史和发展,演讲者指出,该框架最初于2012年以一份白皮书形式发布,主要关注四个支柱——安全性、成本优化、性能和可靠性。这些原则源于亚马逊云科技多年来的内部经验教训以及与客户的直接合作经验。例如,演讲者提到,在2012年曾发生过一次服务中断事件,影响了某些客户的应用程序。经过调查,亚马逊云科技团队发现,那些具有适当冗余和解耦设计的客户系统能够应对这次事件。这证明了分享这些架构最佳实践的必要性,进而促成了初始架构良好框架白皮书的发布。随着时间的推移,该框架不断扩展,基于更多的客户反馈和新出现的新兴最佳实践。2016年,加入了运营卓越度支柱,以涵盖管理工作负载的人和技术流程,而不仅仅是技术架构。2018年,推出了架构良好工具,这是亚马逊云科技管理控制台的一部分,为客户提供了系统化方法来检查其工作负载是否满足框架标准,并记录了他们的架构决策和权衡。这一工具的推出得到了一个重要反馈的支持,即需要追踪决策原因。演讲者表示,如果没有这个工具,将来出现问题时,很难找到几年前做出某些决策的原因。工具中添加的备注和注释功能有助于保存这种知识体系。自该工具问世以来已过去五年,它一直在不断完善,增加了如查看整个工作负载组合的集成风险等功能,这些都是基于客户直接反馈进行的改进。

The first functional requirement was to increase the character limit for notes, increasing it from 1,000 characters to 5,000 characters. This may seem insignificant, but it demonstrates the importance of maintaining architectural background and design principles. In 2021, sustainability pillars were added to the framework, as environmental responsibility became increasingly important for many organizations. This provides guidance on how to build workloads optimized for energy efficiency, resource utilization, and overall environmental impact.

Just this week, a new lens catalog was launched, offering more than 40 industry and technology-specific lenses that customers can apply to their workload reviews for deeper analyses in areas such as healthcare, IoT, machine learning, and serverless domains. These lenses not only include core best practices but also delve into considerations specific to particular fields.

In summary, the Well-Architected framework provides best practices across key pillars, while the Tool enables teams to measure their adherence to those best practices and quantify the health of their workloads. Together, they create a mechanism for managing large-scale cloud architectures.

According to the speaker, the framework is divided into six pillars, thirty design principles, more than 100 best practices, and approximately 300 questions. These pillars align with how most organizations structure their teams, including security, operations, finance, etc. The design principles provide logically grouped related best practices. Best practices serve as core guidance on what teams should do. Finally, the questions are intended to encourage open discussions rather than audit-like thinking. Asking “why” typically uncovers improvement opportunities that cannot be identified through a pure checklist approach.

For example, when a Well-Architected tool engineering team undergoes its initial assessment, they need to explain why they named resources in a specific way. This leads them to realize that allowing Amazon Web Services to automatically generate resource names can improve efficiency without introducing additional risks. Well-Architected questions-driven self-reflection allows them to improve their practices.

As for the Well-Architected tool itself, its main functions include identifying risks according to the best practice framework, documenting architectural decisions and trade-offs, tracking long-term improvements, and providing data for making informed decisions across portfolios.

单一团队可以通过该工具来评估自身是否遵循最佳实践,了解各种实践背后的原因,记录架构选择并根据已识别风险采取相应措施。对于负责多个工作负载的中央IT团队,该工具能提供一个跨所有工作负载的风险汇总视图,帮助他们确定具有最高影响力和安全、成本节省或性能改进的优先事项。这个仪表板将汇聚各个工作负载的风险,以便发现潜在的系统漏洞。这使得组织能在整个企业范围内推广和应用亚马逊云科技的良好架构原则,并为部署到云端的工作负载实施集中的管理方式。

要展示如何使用框架和工具实现这一目标,演讲者将通过展示一系列关键功能来说明如何在整个组织中推广良好的架构。首先展示的功能是审查模板。企业通常会制定一套通用的最佳实践或策略,如由中央IT团队执行的安全标准,并将其应用于所有工作负载。审查模板允许用户定义一个可以预填入适用于所有工作负载的亚马逊云科技良好架构框架问题的模板。这样,当任何使用该模板的工作负载被创建时,相关问题将被自动标记为已解决。

此外,模板可以包含来自亚马逊云科技良好架构框架(超过300个问题)的任何自定义问题,以及来自新目录(超过40个)的问题。然后,此模板可以在所有工作负载中共享,以确保一致性,并让团队成员专注于其特定工作负载的常见问题,而无需重复回答问题。

另一个支持推广的功能是工作负载配置文件。这些允许组织根据诸如当前开发阶段或应用程序关键性等标准来定义在审查过程中应关注的优先事项。

例如,如果一个工作负载是为了应对重大发布而准备的,那么其优先级可能会集中在性能和安全上,而非成本。而对于一个遗留系统,成本可能会成为关注的重点。通过调整问题优先级顺序和风险水平,可以充分考虑到这些优先级。这使得中央治理团队能够使工作负载审查与业务目标保持一致。而不是简单地给团队一个需要回答的200个问题列表,根据工作负载的概况,概况可以帮助他们专注于最重要的20个问题。概况将业务背景转化为工作负载团队的实际行动。

最后,对于监管一组工作负载的中央IT团队,该工具提供了一个汇总视图,显示所有工作负载在聚合仪表板中的风险。这允许投资组合分析确定是否有需要解决的系统性问题。例如,如果“对静止数据进行加密”在所有60%的工作负载中都显示为高风险,则可以启动一项安全措施来全面解决加密差距,而无需让每个团队单独处理。该仪表板突出了投资组合中的模式。

总的来说,这些功能展示了Well-Architected框架和工具如何在大企业组织中扩展。通过实现审查模板的一致性,将业务优先级与概况保持一致,以及通过数据驱动的投资组合管理,团队可以合作推动云卓越。

为了提供一个具体的例子,演讲者邀请了来自MuleSoft的Melissa Cazalet来讨论他们的Well-Architected之旅。她解释说,在2022年中期,他们意识到除非立即采取行动,否则他们当年的云预算将超出1200万美元。这使他们陷入了试图在所有团队中实施85个同时节省成本的举措的危机模式。但这种被动的做法导致了严重的破坏。他们认识到需要一个以Well-Architected为核心的成熟的云操作模型,以提供必要的可见性和治理。

他们需要赋予工程师用数据做出良好决策的能力,而不是通过严格的削减来支配他们。他们需要采取更积极的方法来管理他们的云环境。

为了实现这一目标,他们成立了一个负责实施Well-Architected框架的云计算监督团队。一些关键举措包括:

在亚马逊Redshift上构建数据湖架构,以便聚合来自亚马逊云科技Cost Explorer的使用数据以及他们自己的CloudWatch监控数据。这为数据驱动的管理奠定了基础。

  • 为每个团队提供基于Well-Architected最佳实践和他们自己优先级的定制Trusted Advisor建议。这为他们提供了针对其需求定制的可操作优化方案。

  • 创建一个Cloud Central门户,使每个团队能够从其资源库存、使用成本和Well-Architected风险和建议的单一镜面视图中获取信息。该仪表板以自助服务的方式整合数据,以赋予团队权力。

  • 使用亚马逊云科技Systems Manager自动为他们的CloudHub产品执行补丁管理,这是之前的手动过程的替代方法,可以自动修补400,000个实例。这显著改善了他们的安全状况。

  • 参加专注于弹性和可靠性的亚马逊云科技培训工作坊,以提高他们团队的实际教育水平。

通过这些改进措施,例如成本优化、安全、可靠性和可持续性等领域的努力,他们能够收回1200万美元的超支费用。但更重要的是,他们通过Well-Architected框架建立了云计算治理的纪律。他们从反应式管理转向了前瞻性管理。

总的来说,本文全面概述了如何使用Well-Architected框架和工具为组织提供管理云工作负载的结构化方法。该框架定义了行业最佳实践,而工具支持工作负载健康的评估和改进。

企业可以利用审查模板、配置文件和汇总报告等功能,在整个产品组合中推广Well-Architected原则。这将使云采用从孤立的团队转变为集中的治理。

MuleSoft的例子展示了这些概念在实际应用中的作用,展示了他们如何通过框架实现更高的可见性和自动化来控制成本和安全性。

Well-Architected通过调整优先事项、启用数据驱动决策和标准化最佳实践,为整个组织提供了一种机制,使云卓越成为一种文化心态。

下面是一些演讲现场的精彩瞬间:

萨米尔·科帕尔(Samir Kopal)和埃拉娜·莫里斯(Elana Morris)详细介绍了”架构良好”工具和框架,将其视为在云端运营和管理的一种解决方案。

随着新镜头目录功能的推出,人们可以更深入地研究行业和技术最佳实践。

领导者们强调了记录决策和权衡的重要性,以便为未来的选择提供历史背景。

通过亚马逊云科技的Control Tower,用户可以对工作负载的健康状况、安全性、成本优化和风险拥有可见性,从而有组织地进行关于改善云环境的讨论。

将内容、工具和数据相结合,实现了一个结构化的云计算治理方案。

此外,亚马逊云科技的Trusteed Advisor还提供了优化云支出和使用的建议,使工程团队能够追踪成本并进行改进。

亚马逊云科技的领导者强调,架构良好是一种心态,用于构建可靠、安全、经济高效且可持续的解决方案,这些解决方案可以产生积极影响。

总结

这段视频探讨了亚马逊云科技在云计算环境中所提供的Well-Architected框架及工具,如何助力企业拓展最佳实践。自2012年起,亚马逊云科技的Well-Architected框架便致力于分享构建安全、高效、可靠且有弹性的系统的相关经验和客户案例。随着时间的推移,该框架已从最初的四个支柱扩展至现在的六个支柱,包括安全性、可靠性、性能效率、成本优化、运营卓越性和可持续性。2018年推出的Well-Architected工具使得团队能够识别潜在风险、记录决策过程并监控工作负载的运行状况。

总的来说,这一框架、工具及其产生的大量数据为企业在云端管理资源提供了一个有效的途径。该工具的功能有助于将Well-Architected的理念推广至更广泛的应用范围:

  • 审查模板可预先填写常见最佳实践答案,从而减少审查过程中的重复劳动。这些模板可在整个组织内共享。

  • 配置文件将业务需求(如安全和合规)转化为工程团队可以采取的具体行动。这些配置文件明确了需要关注的工作负载重点领域。

  • 汇总视图展示了一组工作负载的风险,使团队能够确定需要进行整体改进而不是仅针对个别工作负载进行优化。

MuleSoft的Melissa Cazalet分享了他们是如何通过实施基于Well-Architected的云计算策略来实现规模扩张的。他们设立了一个云监管团队来推动采纳率。同时,他们还搭建了一个内部数据湖和仪表盘,以便向工程团队展示亚马逊云科技的数据,例如成本等信息。这使得他们成功节省了1200万美元的云费用。他们在各个支柱中开展项目,并借鉴Trusteed Advisor的建议。总之,Well-Architected为企业在组织内实现云资源的统一管理提供了一种有效方法。

演讲原文

https://blog.csdn.net/just2gooo/article/details/135090313

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 – 官方网站

点击此处,一键查看 re:Invent 2023 所有热门发布

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。