Amazon EMR 使用場景
1擊流分析
Amazon EMR 可用于分析點擊流數據,以便細分用戶、了解各種用戶偏好,并投放更有效的廣告。
2實時分析
借助 Amazon EMR 上的 Spark Streaming,使用和處理來自 Amazon Kinesis、Apache Kafka 或其他數據流的實時數據。采用容錯方式執行流分析,并將相應結果寫入 Amazon S3 或 HDFS 中。
3日志分析
Amazon EMR 可用于處理 Web 和移動應用程序生成的各種日志。Amazon EMR 可幫助客戶將數 PB 的非結構化或者半結構化數據轉變為有用的應用程序或者用戶洞察數據。
4提取、轉換、加載 (ETL)
Amazon EMR 可用于在大型數據集上快速且經濟高效地執行數據轉換工作負載 (ETL),例如分類、聚合和合并。
5預測分析
Amazon EMR 上的 Apache Spark 包括適用于各種可擴展的機器學習算法的 MLlib,您也可以使用自己的庫。通過將數據集存儲在內存中,Spark 可以為常見的機器學習工作負載提供出色的性能。
6基因組學
Amazon EMR 可迅速高效地處理大量的基因組數據及其他大型科學數據集。研究人員可以訪問 AWS 上托管的免費基因組數據。