Amazon EMR 是一種 Web 服務,讓您能夠輕鬆快速且經濟實惠地處理大量資料。
Amazon EMR 簡化了大數據處理,提供受管的 Hadoop 框架,讓您以輕鬆、快速且節省成本的方式跨越各個動態可擴展的 Amazon EC2 執行個體,以分發和處理大量資料。您也可以執行其他常用的分散式架構 (例如 Amazon EMR 中的 Apache Spark 和 Presto),並與其他 AWS 資料存放區 (例如 Amazon S3 和 Amazon DynamoDB) 中的資料進行互動。
Amazon EMR 能夠安全可靠地處理大數據使用案例,包括日誌分析、Web 索引、資料倉儲、機器學習、財務分析、科學模擬和生物資訊學。
在 Amazon EMR 上使用版本控制發行功能,您可以輕鬆地在 EMR 叢集選取和使用最新的開放原始碼專案,包括 Apache Hadoop 和 Spark 生態系統中的應用程式。Amazon EMR 會安裝和設定軟體,所以您會花較少的時間在管理任務上,而專注於提高資料的價值。
使用 Amazon EMR,您可以佈建一個、數百個或者甚至數千個運算執行個體來處理任何規模的資料。您可以輕鬆增加或減少執行個體的數量,並且按使用情況支付費用。
Amazon EMR 會自動配置 Amazon EC2 防火牆設定以控制對執行個體的網路存取,並且您可以在 Amazon Virtual Private Cloud (VPC) (由您定義的邏輯隔離網路) 中啟動叢集。您可以使用 Amazon EMR 安全組態輕鬆加密靜態和傳輸中的資料,包含使用 EMRFS 進行 Amazon S3 伺服器端加密和用戶端加密、叢集上的 HDFS 和本機磁碟加密,以及各種應用程式的加密傳輸中資料開放原始碼功能。
Amazon EMR 可用於分析點擊流資料,以便細分使用者並了解各種使用者偏好。廣告商還可以分析點擊流和廣告的展示次數日誌,以提供更有效率的廣告。
Amazon EMR 可快速、有效地處理大量的基因體資料及其他大型科學資料集。研究人員可以存取 AWS 上託管的免費基因體資料。
Amazon EMR 可用於處理 Web 和行動應用程式產生的各種日誌。Amazon EMR 可幫助客戶將數 PB 的非結構化或者半結構化資料轉變為有用的應用程式或使用者見解。
準備好啟動第一個叢集嗎?按一下此處查看入門教學。在教學中,您將建立可計算範例文字檔案中的詞語出現頻率的叢集。在幾分鐘的時間內,您的叢集就能正常執行。
Amazon Elastic MapReduce 和 Amazon EMR 是 Amazon Web Services, Inc. 或其附屬公司集團的商標。保留所有權利。