本文概述
- 目的
- 先决条件
- 目录
- 安装
- SQL
- 样本数据库
- 访问样本数据库
- 设置连接
- 从同一数据库中的多个表中获取数据
目的 除了Tableau提供的各种可视化优点外, 它还具有惊人的开箱即用连接功能。 Tableau可以轻松地与SQL等DBMS集成。这在功能方面提供了更多的优势, 对于习惯于使用SQL的数据科学家来说非常方便。 Tableau为SQL Server提供了优化的实时连接器, 以便我们可以在直接使用数据的同时创建图表, 报表和仪表板。
先决条件 本文假定你对Tableau, 其属性以及如何使用它进行分析有所了解。由于本文将仅着重于Tableau的SQL, 因此建议你阅读以下现有教程, 它们是Tableau和SQL的优秀入门书:
使用Tableau进行数据可视化
SQL教程:如何编写更好的查询
目录
- 1.桌子
- 2.关系数据库:快速概述
- 3.连接到SQL Server
- 4.将SQL数据导入Tableau
- 5.自定义SQL
- 6.数据源过滤器
- 7. Tableau中的分析
- 8.结论
安装 从官方网站下载Tableau Desktop版本。请按照安装说明进行操作, 并且如果在单击Tableau图标时出现以下屏幕, 则可以执行。
文章图片
数据库管理系统(DBMS)是与最终用户, 应用程序和数据库本身进行交互以捕获和分析数据的软件。用于关系数据库的DBMS称为关系数据库管理系统(RDBMS)。
关系数据库由一个或多个信息表组成。表中的行称为记录, 表中的列称为字段或属性。包含两个或多个相关表的数据库称为关系数据库, 即相关数据。主要的RDBMS是Oracle, MySQL, Microsoft SQL Server, PostgreSQL, Microsoft Access和SQLite。
关系数据库背后的主要思想是将你的数据分解为通用主题, 其中一个表专用于描述每个主题的记录。
文章图片
资源
SQL SQL或结构化查询语言是为RDBMS设计的语言。它是一种用于处理数据, 访问数据库的声明性语言。 SQL用于在数据库中插入, 修改, 更新和查询数据。 SQL可以被视为数据库的一种语言。
在我们的Microsoft SQL Server数据中有一个隐藏的价值, 隐藏在标准报告和复杂的BI工具下。 Tableau通过使任何人都可以对SQL Server数据进行复杂的可视化分析来提供洞察力。我们可以将Tableau连接到SQL Server live服务器以进行针对特定平台的优化查询, 也可以将数据直接引入Tableau的分析引擎中以减轻数据库负担。
让我们来看一个示例, 该示例描述如何将SQL Server数据库连接到Tableau Desktop, 然后使用它来创建可视化。
样本数据库 出于演示目的, 我们将使用AWS上可公开访问的SQL Server实例以及基于Tableau内置Superstore数据集创建的数据库。它包含有关产品, 销售, 利润等的信息。我们作为数据分析师的目的是分析数据并找到这家虚构公司的关键改进领域。该SQL Server实例由Ken Flerlage托管, 后者定期为Tableau用户编写博客。
访问样本数据库
- 安装SQL Server Management Studio(SSMS)。 SSMS是用于管理任何SQL基础结构的免费集成环境。使用SSMS, 可以部署, 监视和升级你的应用程序使用的数据层组件, 以及构建查询和脚本。
- 下载并安装到系统上后, 你将看到以下屏幕询问特定的凭证。
文章图片
输入以下凭据:
Server Name: ec2-52-14-205-70.us-east-2.compute.amazonaws.comAuthentication: SQL Server AuthenticationLogin: SQLPassword: SQL
现在, 你将被授予对” SuperStoreUS” 数据库的” 只读” 访问权限。
文章图片
对于我们的示例, ec2–52–14–205–70.us-east-2.compute.amazonaws.com是实例的名称, SuperstoreUS和Test是数据库, 而Orders, Customers等是其中的表。 SuperstoreUS数据库。因此可以有多个实例, 每个实例可以进一步包含许多数据库, 这些数据库也可以具有多个表。
文章图片
设置连接 打开Tableau Desktop, 然后导航到” 开始” 屏幕。在此处, 连接窗格在可以连接到Tableau的数据源方面提供了很多选择。我们将连接到Microsoft SQL Server。
文章图片
单击” Microsoft SQL Server” 选项后, 将打开一个新屏幕, 该屏幕还将要求我们也希望Tableau连接到的服务器。输入详细信息, 将打开一个外观熟悉的Tableau工作区。
文章图片
现在, 我们可以从可用数据库列表中进行选择。在这里, 我们将选择SuperStore US数据库。
文章图片
现在, 你可以单击并将所需的表拖到视图上。让我们拖动订单表进行进一步分析。预览窗格为我们提供了” 立即更新” 选项, 该选项可手动或自动加载预览。
文章图片
从同一数据库中的多个表中获取数据 还可以通过联接从Tableau的多个表中获取数据。连接是合并一些与某些公共字段相关的表。例如, 可以将Orders和Returns表联接在一起, 因为它们具有称为Order-ID的公共列。 Join通过并排添加来自不同表的列来简单地创建虚拟表。
文章图片
加入
文章图片
如果需要分析, 则需要处理来自多个来源的数据。这称为数据混合。你可以在此处阅读有关融合的更多信息。
文章图片
混合
自定义SQL使用户可以控制要导入Tableau的数据。此功能不是特别与编写SQL查询有关, 而是与定义数据集有关。定义新的自定义SQL的过程如下:
- 单击屏幕左侧的自定义SQL选项卡, 然后将打开一个对话框。
- 在对话框中编写要执行的自定义查询
- 更新结果, 我们得到的只是数量大于4的订单。
- 现在移至工作表并开始使用Tableau进行探索。
文章图片
由于数据有限, 因此这是一个简单的查询。但是, 你甚至还可以执行复杂的查询。
就像自定义SQL一样, 也可以使用” 数据源” 过滤器将一些特定的数据导入Tableau。让我们看看如何使用这些过滤器。
- 将” 订单” 选项卡拖到视图上。订单表包含一个名为Region的字段, 表示在美国销售产品的四个地区。
- 假设我们只希望订单仅涉及西部和中部地区。转到右上角的过滤器, 然后单击添加, 然后再次添加
- 填充字段列表。选择” 地区” 字段或你选择的任何字段。
- 现在, 我们看到的是我们选择的字段的可能值列表。选择所需的, 然后单击确定。
- 这将从连接级别返回过滤的数据。
文章图片
将数据从SQL Server获取到Tableau之后, 可以在Tableau中轻松对其进行分析。让我们以多种方式分析工作表中的数据:
- 我们可以分析国家销售
文章图片
- 或者, 我们可以找到那些销售数字超过5000的州。
文章图片
- 另一个分析点可能是” 销售与利润” 情况。
文章图片
因此, 与其他任何标准分析一样, 从SQL Server获取数据之后在Tableau中进行分析非常简单。
一起使用SQL和Tableau, 可以将数据分析提高到一个新的水平。我们可以轻松地将SQL Server连接到Tableau并将数据直接提取到其中。通过Tableau, 用户可以通过单击切换连接, 以将内存中查询应用于更大的数据集。 SQL是一个非常有用的工具, 当结合使用Tableau的专业知识时, SQL可以帮助使分析变得更加强大和深入。
【SQL与Tableau用法教程】如果你想了解有关SQL的更多信息, 请参加srcmini的SQL for Data Science入门课程。
参考文献
- Microsoft SQL Server-表
- 使用SQLite在Python中进行数据库编程
推荐阅读
- 在SQL中使用ORDER BY关键字
- 多重继承和super()简介
- SQL中的ALTER TABLE语句简介
- 如何使用ggplot2制作直方图
- appium环境
- create-react-app里添加less
- android开发(列表listview的实现 | 下拉刷新)
- Android中适配器的notifyDataSetChanged()为何有时不刷新
- Vant Weapp小程序蹲坑之使用submit-bar组件