aws analytical dataset generation:此存储库包含用于处理提取的UCFS数据的内容 源码

上传:significant_67152 浏览: 9 推荐: 0 文件:ZIP 大小:232.85KB 上传时间:2021-02-24 04:49:13 版权申诉
AWS分析数据集生成 分析数据集生成(ADG)集群将指定HBase表中所有记录的最新版本转换为S3上存储的Parquet文件。 然后,它会生成Hive表,以为下游数据处理和分析任务提供对这些数据的便捷SQL访问。 总览 在定义的时间,CloudWatch事件将触发EMR Launcher Lambda函数 EMR Launcher从Config S3存储桶中读取EMR群集配置文件,然后调用EMR服务的RunJobFlow API,这将导致启动Analytical Dataset Generator ( ADG )EMR群集 ADG Cluster配置为Ingest HBase EMR群集的只
上传资源
用户评论