解决方案体系结构
新式数据仓库
通过新式数据仓库可轻松将所有数据汇集到一起,并通过分析仪表板、操作报告或所有用户的高级分析获取见解。
- 1 使用 Azure 数据工厂将所有结构化、非结构化和半结构化数据(日志、文件和媒体)结合到 Azure Blob 存储中。
- 2 利用 Azure Blob 存储中的数据,通过 Azure Databricks 执行可缩放分析,并获得清理和转换后的数据。
- 3 可将清理和转换后的数据移动到 Azure SQL 数据仓库,与现有的结构化数据结合,为所有数据创建一个中心。利用 Azure Databricks 和 Azure SQL 数据仓库间的本地连接器来访问和大规模移动数据。
- 4 根据 Azure 数据仓库构建操作报告和分析仪表板,从数据中获取见解,并使用 Azure Analysis Services 为数千名最终用户提供服务。
- 5 直接在 Azure Databricks 中的数据上运行临时查询。
大数据高级分析
使用领先机器学习工具将数据转化为可行见解。通过这种架构,可将任何规模的数据进行组合,且可大规模构建和部署自定义机器学习模型。
- 1 使用 Azure 数据工厂将所有结构化、非结构化和半结构化数据(日志、文件和媒体)汇集到 Azure Blob 存储中。
- 2 使用 Azure Databricks 清理和转换流数据无结构的数据集,并将其与来自操作数据库或数据仓库的结构化数据相结合。
- 3 使用可缩放机器学习/深度学习技术,借助 Python、R 或 Scala 以及 Azure Databricks 中的内置笔记本体验,从这些数据中获得更深入的见解。
- 4 利用 Azure Databricks 和 Azure SQL 数据仓库间的本地连接器来访问和大规模移动数据。
- 5 高级用户利用 Azure Databricks的内置功能来确定根本原因并分析原始数据。
- 6 直接在 Azure Databricks 中的数据上运行临时查询。
- 7 将来自 Azure Databricks 的见解传入 Cosmos DB,使用户可通过 Web 和移动应用进行访问。
实时分析
轻松从实时流数据中获取见解。持续从所有 IoT 设备或网站点击流日志捕获数据,并准实时地处理数据。
- 1 使用 Azure HDInsight 中的 Apache Kafka 集群可轻松提取应用程序的实时流数据。
- 2 使用 Azure 数据工厂可将所有结构化数据汇集到 Azure Blob 存储。
- 3 利用 Azure Databricks 清理、转换和分析流数据,并将其与来自操作数据库或数据仓库的结构化数据相结合。
- 4 使用可缩放机器学习/深度学习技术,借助 Python、R 或 Scala 以及 Azure Databricks 中的内置笔记本体验,从这些数据中获得更深入的见解。
- 5 利用 Azure Databricks 和 Azure SQL 数据仓库间的本地连接器来访问和大规模移动数据。
- 6 根据 Azure 数据仓库构建分析仪表板和嵌入式报表,以便在组织内共享见解,并使用 Azure Analysis Services 将此数据提供给成千上万的用户。
- 7 高级用户利用 Azure Databricks 和 Azure HDInsight 的内置功能来确定根本原因并分析原始数据。
- 8 将来自 Azure Databricks 的见解传入 Cosmos DB,使用户可通过实时应用进行访问。