Pandas是一个Python软件包, 提供了各种数据结构和操作, 用于处理数字数据和时间序列。它主要是很容易导入和分析数据的流行。这是一个在NumPy库之上构建的开源库。
groupby()
Pandas dataframe.groupby()函数用于根据给定条件将数据帧中的数据分为几组。
范例1:
# import library
import pandas as pd# import csv file
df = pd.read_csv( "https://bit.ly/drinksbycountry" )df.head()
输出如下:
文章图片
范例2:
# Find the average of each continent
# by grouping the data
# based on the "continent".
df.groupby([ "continent" ]).mean()
输出如下:
文章图片
agg()
Pandas dataframe.agg()函数用于基于指定的轴对数据执行一项或多项操作
例子:
# here sum, minimum and maximum of column
# beer_servings is calculatad
df.beer_servings.agg([ "sum" , "min" , "max" ])
【Pandas如何组合Groupby和多个聚合函数()】输出如下:
文章图片
一起使用这两个功能:我们可以找到特定列的另一列的多个聚合函数。
例子:
# find an aggregation of column "beer_servings"
# by grouping the "continent" column.
df.groupby(df[ "continent" ]).beer_servings.agg([ "min" , "max" , "sum" , "count" , "mean" ])
输出如下:
文章图片
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。
推荐阅读
- 如何使用单个Dockerfile合并多个基本镜像()
- 如何在C#中检查线程是否处于活动状态()
- Git的安装初次配置以连接github,在第三方软件中配置使用git 命令,提交项目到github的远程仓库出现bug的解决
- win10插入耳机后有电流声怎么办电脑出现回声怎么办
- 网络传输时既有管道流(PipedInputStream 与 PipedOutStream)又有序列化对象反序列化对象(ObjectOutputStream与 ObjectInputStream)
- 安装选择msi格式还是zip(windows下Nodejs zip版下载安装及环境变量配置)
- github项目托管方式(看项目自身是否自带有 .git)
- 安装工具小日记
- 虚拟机VMware 安装centos常规配置共享文件等