4.5. RedShift¶
4.5.1. 简介¶
Amazon Redshift 是一种可轻松扩展的完全托管型 PB 级数据仓库,它通过使用列存储技术和并行化多个节点的查询来提供快速的查询性能,使您能够更高效的分析现有数据。使用云端 Amazon Redshift 服务,您无需管理庞大的服务器集群,分析数据的成本不到传统解决方案的十分之一。
Amazon Redshift 使用列存储技术改善 I/O 效率并跨过多个节点平行放置查询,从而提供快速的查询性能。Redshift 使用标准的 PostgreSQL JDBC 和 ODBC 驱动程序,从而使您能够使用各种常见 SQL 客户端。数据加载速度与集群大小呈线性关系。
4.5.2. 使用案例¶
商业智能¶
Redshift 支持以简单且经济高效的方式对 PB 级半结构化和结构化数据运行高性能查询,因此您可以使用 QuickSight 或其他商业智能工具构建功能强大的报告和控制面板。
对事件进行运营分析¶
整合来自数据仓库的结构化数据和来自 S3 数据湖的应用程序日志等半结构化数据,以获得有关应用程序和系统的实时运营见解。
数据即服务¶
通过 Redshift 数据共享在组织内部和外部共享数据以安全且可控地就实时数据开展协作。
预测分析¶
通过 Redshift 机器学习(预览版),在数据仓库中的数据上使用 SQL 自动创建、训练和部署 Amazon SageMaker 模型。