pandas求平均数和中位数的方法实例

目录

  • 准备
  • 1.求平均数
    • 1.1对全表进行操作
      • 1.1.2 求取每行的平均数
    • 1.2 对单独的一行或者一列进行操作
      • 1.2.1 求取单独某一列的平均数
    • 1.3 对多行或者多列进行操作
      • 1.3.1 求取多列的平均数
      • 1.3.2 求取多行的平均数
  • 2 求中位数
    • 2.1对全表进行操作
      • 2.1.1对每一列求中位数
      • 2.1.2 对每一行求中位数
    • 2.2 对单独的一行或者一列进行操作
      • 2.2.1 对某一列求中位数
      • 2.2.2 对某一行求中位数
    • 2.3 对多行或者多列进行操作
      • 2.3.1 对多列求中位数
      • 2.3.2 对多行求中位数
  • 总结

    准备 pandas是一个强大的Python数据分析的工具包。

    pandas是基于NumPy构建的。
    pandas的主要功能
    • 具备对其功能的数据结构DataFrame、Series
    • 集成时间序列功能
    • 提供丰富的数学运算和操作
    • 灵活处理缺失数据
    本文用到的表格内容如下:
    pandas求平均数和中位数的方法实例
    文章图片

    先来看一下原始情形:
    import pandas as pd?df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df)

    result:
    分类货品实体店销售量线上销售量成本售价
    0水果苹果342341245
    1家电电视机5678434156
    2家电冰箱7834524785
    3书籍python从入门到放弃25341389
    4水果葡萄789567398

    1.求平均数

    1.1对全表进行操作
    1.1.1求取每列的平均数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.mean())

    result:
    实体店销售量196.4
    线上销售量290.6
    成本18.0
    售价294.6
    dtype: float64

    1.1.2 求取每行的平均数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.mean(axis=1))

    result:
    081.25
    1257.50
    2308.00
    340.25
    4312.50
    dtype: float64
    先看运行结果,我们可以看到,每一行求平均数的时候直接忽略文本字符类型的列,只对数字类型的列进行求平均数。就比如第一行的数据
    分类货品实体店销售量线上销售量成本售价
    0水果苹果342341245
    上面的81.25=(34+234+12+45) / 4,,其他的行也是如此

    1.2 对单独的一行或者一列进行操作

    1.2.1 求取单独某一列的平均数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df['实体店销售量'].mean())

    result:
    【pandas求平均数和中位数的方法实例】196.4
    1.2.2 求取单独某一行的平均数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.iloc[[0]].mean())

    result:
    实体店销售量34.0
    线上销售量234.0
    成本12.0
    售价45.0
    dtype: float64

    1.3 对多行或者多列进行操作

    1.3.1 求取多列的平均数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df[['实体店销售量', "线上销售量"]].mean())

    result:
    实体店销售量196.4
    线上销售量290.6
    dtype: float64

    1.3.2 求取多行的平均数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.iloc[[0, 1]].mean())

    result:
    实体店销售量45.0
    线上销售量509.0
    成本23.0
    售价100.5
    dtype: float64

    2 求中位数

    2.1对全表进行操作

    2.1.1对每一列求中位数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.median())

    result:
    实体店销售量56.0
    线上销售量234.0
    成本13.0
    售价156.0
    dtype: float64
    可以看到,中位数的概念只对数字有效

    2.1.2 对每一行求中位数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.median(axis=1))

    result:
    039.5
    1106.0
    2211.5
    329.5
    4227.0
    dtype: float64

    2.2 对单独的一行或者一列进行操作

    2.2.1 对某一列求中位数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df['实体店销售量'].median())

    result:
    56.0

    2.2.2 对某一行求中位数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.iloc[[0]].median())

    result:
    实体店销售量34.0
    线上销售量234.0
    成本12.0
    售价45.0
    dtype: float64

    2.3 对多行或者多列进行操作

    2.3.1 对多列求中位数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df[['实体店销售量', "线上销售量"]].median())

    result:
    实体店销售量56.0
    线上销售量234.0
    dtype: float64

    2.3.2 对多行求中位数
    df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.iloc[[0, 1]].median())

    result:
    实体店销售量45.0
    线上销售量509.0
    成本23.0
    售价100.5
    dtype: float64

    总结 到此这篇关于pandas求平均数和中位数的文章就介绍到这了,更多相关pandas求平均数中位数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

      推荐阅读