Pandas库介绍--统计相关

【Pandas库介绍--统计相关】数据应用上节读取的CSV;
1.值分类汇总

counts = df['hGrade'].value_counts() print counts

Pandas库介绍--统计相关
文章图片

2.绘制柱形图,并保存
plt = counts.plot(kind='bar').get_figure() plt plt.savefig('/Users/baidu/Downloads/plot.png')

Pandas库介绍--统计相关
文章图片

3.数据分组
#数据准备 import pandas as pd import numpy as np df = pd.DataFrame({'A':['foo', 'bar','foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B':['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C':np.random.randn(8), 'D':np.random.randn(8)}) print df

Pandas库介绍--统计相关
文章图片
#根据列A进行分组,取每组第一行数据 grouped = df.groupby('A') print grouped.first()

Pandas库介绍--统计相关
文章图片
#根据多列进行分组A,B列 grouped = df.groupby(['A', 'B']) print grouped.last()

Pandas库介绍--统计相关
文章图片
根据列进行分组
def get_type(letter): if letter.lower() in 'abem': return 'vowel' else: return 'consonant'grouped = df.groupby(get_type, axis=1) print grouped.first()

Pandas库介绍--统计相关
文章图片

    推荐阅读