pandas dataframe可以实现SQL中的count case吗?( 二 )

pandas dataframe可以实现SQL中的count case吗?
文章插图
现在 。我们已经创建了那些 。我们可以使用内置的数学函数.mean()来快速比较每个DataFrame中的推文 。
我们将使用print()语句使结果更易于阅读 。我们还需要记住使用str()来将.mean()计算结果转换为字符串 。以便可以在我们的打印语句中使用它:

pandas dataframe可以实现SQL中的count case吗?

文章插图
根据这些结果 。似乎包括图像可能会促进AAA教育的更多社群媒体的交互 。有图片的推文的平均赞和转发次数是没有图片的推文的三倍 。
添加条件更复杂的pandas专栏
这种方法效果很好 。但是如果我们想添加一个条件更复杂的新列(超出True和False的条件)怎么办?
例如 。为了更深入地研究这个问题 。我们可能要创建一些交互性“层” 。并评估到达每个层的推文所占的百分比 。为了简单起见 。让我们使用Likes来衡量交互性 。并将tweet分为四个层次:
1)tier_4 -2个或更少的喜欢
2)tier_3 — 3-9个赞
3)tier_2 — 10-15个赞
4)tier_1 — 16个赞
为此 。我们可以使用称为的函数np.select() 。我们给它两个参数:一个条件列表 。以及一个我们想要分配给新列中每一行的值的对应列表 。
这意味着顺序很重要:如果conditions满足列表中的第一个条件 。则列表中的第一个值values将分配给该行的新列 。大数据分析使用numpy在pandas dataframe上添加列https://www.aaa-cg.com.cn/data/2376.html如果满足第二个条件 。则将分配第二个值 。等等 。
让我们看一下它在Python代码中的外观:
pandas dataframe可以实现SQL中的count case吗?

文章插图
pandas dataframe可以实现SQL中的count case吗?

文章插图
太棒了!我们创建了另一个新列 。该列根据我们的(虽然有些武断)层排名系统对每个tweet进行了分类 。
现在 。我们可以使用它来回答有关我们的数据集的更多问题 。例如:1级和4级推文中有多少百分比具有图像?
pandas dataframe可以实现SQL中的count case吗?

文章插图
在这里 。我们可以看到尽管图像似乎有所帮助 。但它们似乎并不是成功所必需的 。
尽管这是一个非常肤浅的分析 。但我们已经在这里实现了我们的真正目标:根据有关现有列中值的条件语句向pandas DataFrames添加列 。
当然 。这是可以以多种方式完成的任务 。np.where()而np.select()只是许多潜在的两种方法 。
https://www.toutiao.com/i6846264263237960204/

推荐阅读