本文概述
- 1. PowerBI概述
- 2.使用Power BI的优势
- 3. Power BI桌面
- 4.入门
- 5.转换数据
- 6.报告
- 7.仪表板
- 8. Power BI与R&Python的集成
- 9.保存和发布
- 10.结论
Power BI是Microsoft提供的基于云的业务分析服务, 可让任何人以更快的速度和效率可视化和分析数据。它是用于连接和分析各种数据的功能强大且灵活的工具。许多企业甚至认为它对于与数据科学相关的工作必不可少。 Power BI的易用性来自它具有拖放界面的事实。此功能有助于轻松, 快速地执行诸如排序, 比较和分析之类的任务。 Power BI还与多种来源兼容, 包括Excel, SQL Server和基于云的数据存储库, 这使其成为数据科学家的绝佳选择。
本教程将涵盖以下主题:
- Power BI概述
- 使用Power BI的优势
- PowerBI桌面
- 入门
- 转换资料
- 报告制作
- 建立仪表板
- Power BI与R&Python的集成
- 保存和发布
- 总结
Power BI使你能够在本地以及在云中分析和探索数据。 Power BI提供了在同事和组织之间轻松, 安全地协作和共享自定义仪表板和交互式报告的功能。
文章图片
资源
Power BI的组件
Power BI由各种组件组成, 这些组件可以在市场上单独购买, 也可以单独使用。
文章图片
内容来源
选择使用哪个组件主要取决于项目或团队。但是, 我们将使用Power BI桌面, 因为这是主要用于业务报告生成和桌面创建的组件。另外, 所有其他工作通常从Power BI桌面开始, 在该桌面上创建报告。
2.使用Power BI的优势 Power BI具有某些优势, 使其优于现有的分析工具:
- 提供基于云以及桌面的界面。
- 提供诸如数据仓库, 数据发现和交互式仪表板之类的功能。
- 能够加载自定义可视化文件, 以及
- 在整个组织中轻松扩展。
文章图片
来源:https://docs.microsoft.com/zh-cn/learn/modules/get-started-with-power-bi/2-using-power-bi
安装
Power BI仅在Windows计算机上运行。 Mac用户可以在Azure中启动Windows VM并将Power BI加载到其中, 或使用Turbo.net, Turbo.net可以将Power BI直接从云流传输到Mac。
Power BI可以通过两种方式使用:
- 作为Microsoft商店中的应用程序, 只需登录即可开始使用。这是该工具的在线版本。
- 在本地下载软件, 然后安装。确保阅读所有安装说明。
文章图片
4.入门 现在让我们对使用Power BI Desktop有所了解。在本节中, 我们将对其进行一些探索以使其习惯于它的界面。
Power BI工作区
下图突出显示了Power BI工作区的主要组成部分。
文章图片
基本观点
- 报告视图:这是创建仪表板的主视图。
- 数据视图:数据视图提供了整个数据的预览。
文章图片
- 关系视图:关系视图显示各种对象之间的关系。
文章图片
连接到数据源
Power BI可以连接到多个数据源。 “ 获取数据” 图标显示所有可能的可用选项, 可从中将数据导入Power BI。
文章图片
让我们看一些最常用的数据源:
- Excel数据
文章图片
加载后, 可以在” 字段” 窗格中查看数据。
文章图片
- 网页
链接:http://www.bankrate.com/finance/retirement/best-places-retire-how-state-ranks.aspx
只需选择” Web” 作为” 获取数据” 中的选项, 然后输入URL的名称。
文章图片
也尝试使用其他数据源。
5.转换数据 数据加载后, 在” 字段” 选项卡下将可见。在这里, 我们可以借助查询编辑器修改数据集。查询编辑器可用于修改数据集, 而不考虑其数据源。我们可以在查询编辑器中进行诸如重命名数据集, 删除单个或多个列等操作。单击主页功能区上的” 编辑查询” 按钮可以访问查询编辑器。
创建一个自定义列
使用与上面相同的财务数据, 让我们调整数据以满足需求。让我们创建一个名为” 新制造价格” 的自定义列, 该列等于:
([manufacturing Price])*3
文章图片
更改列数据类型
列的数据类型也可以轻松更改。 “ 已售单位” 列的浮点数据类型可以调整为整数。
文章图片
移除列
卸下色谱柱也很容易。只需选择要选择的列, 然后选择” 删除列” 选项, 如下图所示。让我们摆脱” 折扣” 列, 因为它没有为我们的数据集增加任何价值。
文章图片
同样, 还有许多其他功能可以执行, 例如删除和添加行, 转置, 旋转和拆分, 这些功能可以通过查询编辑器轻松实现。请注意, 你要转换数据的所有步骤也会显示在” 查询设置” 面板中。
文章图片
6.报告 报告是可以在一个或多个页面上创建的可视化的集合。这些可视化通常相互关联。
文章图片
7.仪表板 仪表板是多个视图的集合, 使一个视图可以同时比较各种数据。报告可以包含多个页面, 而仪表板是一个页面界面。
创建仪表板
一旦完成所有操作的数据集准备就绪, 就可以继续进行仪表板创建过程。 Power BI仪表板(也称为画布)在一个页面上包含许多可视化内容, 有助于讲述一个故事。这些称为磁贴的可视化文件从报告固定到仪表板。
现在, 让我们尝试了解使用超级市场数据集可以获得哪些见解:
- 国家销售
文章图片
- 分部销售额和利润
文章图片
- 月销售额和利润
文章图片
- 按产品销售
文章图片
- 折扣带利润
文章图片
创建的仪表板是交互式的, 这意味着一个磁贴中的更改会影响另一个。
文章图片
8. Power BI与R&Python的集成 除了Power BI提供的各种可视化优势外, 它还具有惊人的即开即用连接功能。 Power BI可以轻松地与Python, R等语言集成, 甚至可以与SQL等DBMS集成。这在功能方面提供了更多优势, 对于习惯于使用Python或R的数据科学家来说非常方便。他们可以将R和Python脚本直接导入工作区中, 并利用其可视化效果, 而可视化效果远胜于此。这些语言。
在本节中, 我们将学习如何在R中使用Python和R脚本。要了解有关SQL与Power BI集成的信息, 这里有一篇详细的文章:
- 带有Power BI的SQL
R是一种流行的统计语言, 用于执行复杂的分析和预测分析, 例如线性和非线性建模, 统计测试, 时间序列分析, 分类, 聚类等。将Power BI与R结合使用可使用户访问丰富的, 不断扩展的统计分析和数据挖掘库的收集, 以帮助他们从数据中获得更深刻的见解。
先决条件 确保在本地系统上安装并正在运行以下产品:
- [R
- 像R Studio这样的单独的R集成开发环境(IDE)。
- 仅导入数据帧
- 任何运行30分钟以上的R脚本都会自动超时。
文章图片
在选项下, 转到R脚本选项卡, 并确保你可以看到正确的R版本。
文章图片
在Power BI中使用R脚本 在Power BI中使用R脚本是有关此主题的绝佳资源。以下是来自同一来源的概述。
- 用于导入数据的R脚本
对于此演示, 我们将使用CRAN发行版中包含的众所周知的Iris数据集。
文章图片
数据集也可以从文件中导入。这是一个示例, 显示了如何使用以下脚本将CSV文件加载到工作区中。从这里下载文件。
iris_csv <
- read.csv(file="C:/Users/Parul/Desktop/Iris", header=TRUE, sep=", ")
文章图片
仅使用R脚本导入数据并没有什么用。实际用途是在导入时可以操纵数据的时间。以下脚本使用dplyr R软件包中提供的summary和group_by函数对数据进行分组和聚合, 然后再进行导入:
启动R Studio并安装以下软件包:
install.packages("dplyr")
install.packages("data.table")
install.packages("ggplot2")
现在, 使用以下R脚本导入虹膜数据。我们将获得一个名为iris_mean的新数据集, 其中包含四个度量值的平均值, 并根据” 种类” 列中的值进行了分组(来源:Power BI简介)。
library(dplyr)iris_mean <
- summarize(group_by(iris, Species), slength = mean(Sepal.Length), swidth = mean(Sepal.Width), plength = mean(Petal.Length), pwidth = mean(Petal.Width))
文章图片
2.用于转换数据的R脚本
当我们要处理已经导入到工作空间中的数据时, R脚本会派上用场。假设我们要在导入全部数据后应用摘要和分组依据功能。这可以通过在查询编辑器中运行R脚本来实现, 如下所示:
文章图片
3.用于创建可视化效果的R脚本
借助R脚本, 你可以在Power BI中创建可视化。只需键入脚本并加载必要的库, 即可获得类似于任何R IDE中的可视化效果。让我们完成以下步骤:
- 将虹膜数据集导入到工作区中。
- 在可视化选项卡中单击” R脚本可视” , 占位符R可视图像出现在画布上, 脚本编辑器位于底部。
- 选择要包含在脚本中的字段。我们选择PetalLengthCm, PetalWidthCm和Species。所选字段显示在” 值” 选项卡下, 而预填充的R脚本显示在R编辑器中。
- 该脚本使用选定的列创建一个名为dataset的数据框。现在, 你可以在此处编写脚本或在现有脚本中进行更改。让我们粘贴以下代码, 该代码导入ggplot库并创建散点图。
library(ggplot2)
ggplot(data=http://www.srcmini.com/dataset, aes(x=PetalWidthCm, y=PetalLengthCm)) +
geom_point(aes(color=Species), size=2) +
ggtitle("Petal Widths and Lengths") +
labs(x="Petal Width", y="Petal Length") +
theme_bw() +
theme(title=element_text(size=15, color="blue3"))
文章图片
PowerBI和Python
Python是一种广泛使用的通用编程语言, 并且大量Python库可用于使用机器学习算法执行统计分析和预测建模。
微软最近使在PowerBI中集成Python脚本成为可能, 该脚本可在Power BI中运行Python脚本并获得Python视觉效果。让我们看看执行此操作所需的步骤。但在此之前, 有一些先决条件:
- 确保Python已在本地系统上启动并运行。
- 还应加载所有必需的软件包和库, 例如pandas, matplotlib等。
- 当前, 仅支持熊猫数据框。
- 任何运行30分钟以上的Python脚本都会自动超时。
- 必须先启用Python, 然后才能使用它。启动Power BI并转到” 选项和设置-> 选项”
文章图片
在” 选项” 下, 转到” 预览功能” 标签并启用” Python支持” 。
文章图片
重新启动Power BI, 你将在可视化以及” 转换” 选项卡中都获得Python图标。
文章图片
文章图片
在Power BI中有多种运行Python脚本的方法。
- 专门运行Python脚本
- 要运行Python脚本, 请选择” 获取数据” > ” 更多” > ” 其他” > ” Python脚本” , 如下所示。
文章图片
现在, 只需将你的Python脚本粘贴到打开的窗口中即可。选择确定以运行脚本, 然后将生成的数据集导入Power BI Desktop工作区。
文章图片
2.使用Python创建可视化
- 将数据集导入工作空间。使用相同的财务数据集, 该数据集与假设公司的财务信息有关。
- 单击可视化选项卡中的” Python视觉效果” , 占位符Python视觉图像出现在画布上, 而Python脚本编辑器位于底部。
- 选择要包含在脚本中的字段。我们选择” 销售和利润” 。所选字段出现在” 值” 选项卡下, 脚本也出现在Python脚本编辑器中。
- 该脚本使用选定的列创建一个名为dataset的熊猫数据框。你现在可以在此处编写脚本或在现有脚本中进行更改。让我们粘贴以下代码, 该代码导入matplotlib并创建一个绘图。
导入matplotlib.pyplot作为plt数据集.plot()plt.title(“ 销售与利润” )plt.show() - 运行脚本, 可视化效果出现在画布上。可视化效果与在任何Python IDLE中一样。
文章图片
- 接下来, 让我们创建一个相关图。除了前面的字段之外, 选择”
折扣”
, “
销售总额”
和”
售出的单位”
, 然后用以下新脚本替换脚本:
导入matplotlib.pyplot作为plt plt.matshow(dataset.corr(‘ pearson’ ))plt.show()
文章图片
我们还可以导入其他库。让我们导入Seaborn库, 但要确保它已安装在系统上。该数据集称为” 提示” 数据集, 通常会预先加载seaborn。从此处下载数据集并将其加载到工作空间中。然后将下面的代码粘贴到脚本编辑器中, 你将获得最原始的图。
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="darkgrid")sns.relplot(x="total_bill", y="tip", data=http://www.srcmini.com/dataset)
sns.relplot(x="total_bill", y="tip", hue="smoker", data=http://www.srcmini.com/dataset);
sns.relplot(x="total_bill", y="tip", hue="smoker", col="time", data=http://www.srcmini.com/dataset);
plt.show()
文章图片
具有所有Python可视化效果的仪表板最终将像这样显示。
文章图片
Python资讯主页
9.保存和发布 保存和导出文件
你可以将文件另存为Power BI模板。可视化效果也可以导出为PDF文件。
出版
数据仅在可以在人员或组织之间共享时才有用。也可以通过将生成的仪表板或报告发布到Power BI服务来共享它们。然后, 我们可以使用Power BI Apps来查看仪表板/报表或与之交互。
文章图片
10.结论 这就是我们在PowerBI中创建良好的可视化所需的全部知识, 尽管在每个阶段进行的修改可能要比我们在这里做的要多得多。因此, 通过实验和实践, Power BI变得更加熟悉, 并将释放出惊人的功能来帮助我们分析和呈现数据。
【使用Power BI进行数据可视化】参考文献:
- https://docs.microsoft.com/en-us/power-bi/desktop-what-is-desktop
推荐阅读
- android WebView音频关闭的问题
- 充分利用Python和R的优点
- GIT推拉(push和pull)
- Pandas数据准备
- JupyterLab中的SQL接口
- Matplotlib中的直方图
- Pandas移动平均线
- 将数据导入Pandas
- 揭开深度学习数学概念的神秘面纱