3.2.1. Amazon EMR [1]

轻松运行和扩展 Apache Spark、Hadoop、HBase、Presto、Hive 以及其他大数据框架

Amazon EMR 是业界领先的原生云大数据平台,可用于快速且经济高效地大规模处理海量数据。使用 Apache Spark、Apache Hive、Apache HBase、Apache Flink、Apache Hudi(孵化版)和 Presto 等开源工具,结合 Amazon EC2 的动态可扩展性和 Amazon S3 的可扩展存储,EMR 为分析团队提供了运行 PB 级分析的引擎和弹性,而成本仅为传统本地集群的一小部分。EMR 让团队可以灵活地在单一用途的短期集群上运行使用案例,这些集群可以自动扩展以满足需求,或者使用新的多主部署模式在长期运行的高可用集群上运行使用案例。如果您拥有 Apache Spark 和 Apache Hive 等开源工具的现有本地部署,您还可以 在 AWS Outposts 上运行 EMR 集群,以便您同时能够通过 Outposts 进行本地扩展或在云中进行扩展。

[1]https://aws.amazon.com/cn/emr/