Amazon EMR 是一種 Web 服務,讓您能夠輕鬆快速且經濟實惠地處理大量資料。

Amazon EMR 簡化了大數據處理,提供受管的 Hadoop 框架,讓您以輕鬆、快速且節省成本的方式跨越各個動態可擴展的 Amazon EC2 執行個體,以分發和處理大量資料。您也可以執行其他常用的分散式架構 (例如 Amazon EMR 中的 Apache Spark 和 Presto),並與其他 AWS 資料存放區 (例如 Amazon S3 和 Amazon DynamoDB) 中的資料進行互動。

Amazon EMR 能夠安全可靠地處理大數據使用案例,包括日誌分析、Web 索引、資料倉儲、機器學習、財務分析、科學模擬和生物資訊學。

Amazon EMR 簡介 (3:06)

thumb-S6Ja55n-o0M-3

按一下以放大

Amazon EMR 發行速度

Amazon EMR 發行速度

在 Amazon EMR 上使用版本控制發行功能,您可以輕鬆地在 EMR 叢集選取和使用最新的開放原始碼專案,包括 Apache Hadoop 和 Spark 生態系統中的應用程式。Amazon EMR 會安裝和設定軟體,所以您會花較少的時間在管理任務上,而專注於提高資料的價值。


易於使用

您只需幾分鐘就可以啟動 Amazon EMR 叢集。您不必擔心節點佈建、叢集設定、Hadoop 配置或叢集調校。Amazon EMR 會處理這些任務,您只需集中精力進行分析即可。

低成本

Amazon EMR 定價不僅簡單且可預估:為所使用的執行個體小時數按照小時費率支付費用。您可以用最低每小時 0.15 USD 的價格來啟動 10 節點 Hadoop 叢集。因為 Amazon EMR 原生支援 Amazon EC2 競價型和預留執行個體,您還可以節省 50% 到 80% 的基礎執行個體成本。

彈性

使用 Amazon EMR,您可以佈建一個、數百個或者甚至數千個運算執行個體來處理任何規模的資料。您可以輕鬆增加或減少執行個體的數量,並且按使用情況支付費用。

可靠

您用於調校和監控叢集的時間將更少。Amazon EMR 的 Hadoop 已經針對雲端進行優化,它還會監控您的叢集,重新嘗試失敗的任務,並自動替換效能不佳的執行個體。

安全

Amazon EMR 會自動配置 Amazon EC2 防火牆設定以控制對執行個體的網路存取,並且您可以在 Amazon Virtual Private Cloud (VPC) (由您定義的邏輯隔離網路) 中啟動叢集。您可以使用 Amazon EMR 安全組態輕鬆加密靜態和傳輸中的資料,包含使用 EMRFS 進行 Amazon S3 伺服器端加密和用戶端加密叢集上的 HDFS 和本機磁碟加密,以及各種應用程式的加密傳輸中資料開放原始碼功能。

安全

您可以完全掌控您的叢集。您擁有每個執行個體的根存取權,因此,您可以輕鬆安裝額外的應用程式和自訂每個叢集。Amazon EMR 還支援多個 Hadoop 分發和應用程式。

Amazon EMR 可用於分析點擊流資料,以便細分使用者並了解各種使用者偏好。廣告商還可以分析點擊流和廣告的展示次數日誌,以提供更有效率的廣告。

了解 Razorfish 如何使用 EMR 來進行點擊流分析 »

Amazon EMR 可快速、有效地處理大量的基因體資料及其他大型科學資料集。研究人員可以存取 AWS 上託管的免費基因體資料。

閱讀更多有關 1000 個基因體專案和 AWS 的資訊 »

Amazon EMR 可用於處理 Web 和行動應用程式產生的各種日誌。Amazon EMR 可幫助客戶將數 PB 的非結構化或者半結構化資料轉變為有用的應用程式或使用者見解。

了解 Yelp 如何使用 EMR 提升主要網站功能 »

準備好啟動第一個叢集嗎?按一下此處查看入門教學。在教學中,您將建立可計算範例文字檔案中的詞語出現頻率的叢集。在幾分鐘的時間內,您的叢集就能正常執行。


Amazon Elastic MapReduce 和 Amazon EMR 是 Amazon Web Services, Inc. 或其附屬公司集團的商標。保留所有權利。