Amazon EMR 是一种 Web 服务,让您能够轻松快速并经济高效地处理大量的数据。

Amazon EMR 简化了大数据的处理,提供的托管 Hadoop 框架可以让您轻松、快速、经济高效地在多个动态可扩展的 Amazon EC2 实例之间分发和处理大量数据。您还可以运行其他常用的分发框架(例如 Amazon EMR 中的 Spark 和 Presto)与其他 AWS 数据存储服务(例如 Amazon S3 和 Amazon DynamoDB)中的数据进行互动。

Amazon EMR 能够安全可靠地处理大数据使用案例,包括日志分析、Web 索引、数据仓库、机器学习、财务分析、科学模拟和生物信息。

Amazon EMR 简介 (3:06)

thumb-S6Ja55n-o0M-3

单击放大

Amazon EMR 版本发布速度

Amazon EMR 版本发布速度

借助 Amazon EMR 上受版本控制的发布策略,您可以轻松选择和使用 EMR 集群中最新的开源项目,包括 Apache Hadoop 和 Spark 生态系统中的应用程序。软件由 Amazon EMR 安装和配置,使您能够缩短完成管理任务所需的时间,从而专注在提高数据价值上。


易于使用

您只需几分钟就可以启动 Amazon EMR 集群。您不必担心节点预置、集群设置、Hadoop 配置或集群优化。Amazon EMR 自会处理这些任务,因此您只需集中精力进行分析即可。

成本低廉

Amazon EMR 定价简单,预估轻松:按照每个使用的实例小时以一定的小时费率支付费用。您可以以低至每小时 0.15 USD 的价格启动 10 节点 Hadoop 集群。因为 Amazon EMR 在设计理念上支持 Amazon EC2 竞价和预留实例,您还可以将基础实例成本节省 50-80%。

灵活

使用 Amazon EMR,您可以配置一个、数百个或者甚至数千个计算实例来处理任何规模的数据。您可以轻松增加或减少实例的数量,并且按使用情况支付费用。

可靠

您用于调试和监视集群的时间将更少。Amazon EMR 的 Hadoop 已经针对进行了优化,它还会监控您的集群,重新尝试失败的任务,并自动替换性能不佳的实例。

安全

Amazon EMR 会自动配置 Amazon EC2 防火墙设置以控制对实例的网络访问,并且您可以在 Amazon Virtual Private Cloud (VPC) (由您定义的逻辑隔离的网络) 中启动集群。您可以使用以下配置轻松对静态数据和正在传输的数据进行加密 Amazon EMR 安全配置,其中包括使用 EMRFS 的 Amazon S3 服务器端加密和客户端加密集群上的 HDFS 和本地磁盘加密以及针对各种应用程序的传输中加密的开源功能。

安全

您可以完全掌控您的集群。您拥有每个实例的根访问权限,因此您可以轻松安装额外应用程序和定制每个集群。Amazon EMR 还支持多个 Hadoop 分配和应用程序。

Amazon EMR 可用于分析点击流数据,以便细分用户并了解各种用户偏好。广告客户还可以分析点击流和广告的展示次数日志,从而提供更有效率的广告。

了解 Razorfish 如何使用 EMR 来进行点击流分析 »

Amazon EMR 可迅速、有效地处理大量的基因数据及其他大型科学数据集。研究人员可以访问 AWS 上受管理的免费基因组数据。

阅读更多有关 1 000 个基因项目和 AWS 的信息 »

Amazon EMR 可用于处理 Web 和移动应用程序生成的各种日志。Amazon EMR 可帮助客户将数 PB 的非结构化或者半结构化数据转变为深刻的应用程序或者用户洞察。

了解 Yelp 如何使用 EMR 提升主要网站功能 »

您是否已做好准备来启动首个集群?单击此处查看入门教程。 在教程中,您将创建计算示例文本文件中词语频率的集群。 在几分钟的时间内,您的集群就会正常运行。


Amazon Elastic MapReduce 和 Amazon EMR 是 Amazon Web Services, Inc. 或其附属公司的商标。保留所有权利。