Python数据分析的数学运算指南

Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的Python软件包具有奇妙的生态系统。大熊猫是这些软件包之一, 使导入和分析数据更加容易。
熊猫系列可以执行一些重要的数学运算, 以简化使用Python的数据分析并节省大量时间。
要获取使用的数据集, 请单击这里.

s=read_csv("stock.csv", squeeze=True) #reading csv file and making seires

函数 采用
s.sum() 返回序列中所有值的总和
s.mean() 返回序列中所有值的平均值。等于s.sum()/ s.count()
s.std() 返回所有值的标准偏差
s.min()或s.max() 返回序列的最小值和最大值
s.idxmin()或s.idxmax() 返回序列的最小值或最大值的索引
s.median() 返回所有值的中位数
s.mode() 返回系列的模式
s.value_counts() 返回具有每个值的频率的序列
s.describe() 根据所传递数据的dtype返回带有平均值, 众数等信息的序列
代码1:
# import pandas for reading csv file import pandas as pd#reading csv file s = pd.read_csv( "stock.csv" , squeeze = True )#using count function print (s.count())#using sum function print (s. sum ())#using mean function print (s.mean())#calculatin average print (s. sum () /s.count())#using std function print (s.std())#using min function print (s. min ())#using max function print (s. max ())#using count function print (s.median())#using mode function print (s.mode())

输出如下:
3012 1006942.0 334.3100929614874 334.3100929614874 173.18720477113115 49.95 782.22 283.315 0291.21

【Python数据分析的数学运算指南】代码2:
# import pandas for reading csv file import pandas as pd#reading csv file s = pd.read_csv( "stock.csv" , squeeze = True )#using describe function print (s.describe())#using count function print (s.idxmax())#using idxmin function print (s.idxmin())#count of elements having value 3 print (s.value_counts().head( 3 ))

输出如下:
dtype: float64 count3012.000000 mean334.310093 std173.187205 min49.950000 25%218.045000 50%283.315000 75%443.000000 max782.220000 Name: Stock Price, dtype: float643011 11 291.215 288.473 194.803 Name: Stock Price, dtype: int64

意外的输出和限制:
.sum()、. mean()、. mode()、. median()和其他此类数学运算不适用于字符串或数字值以外的任何其他数据类型。
字符串系列上的.sum()会提供意外的输出, 并通过串联每个字符串返回一个字符串。
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。

    推荐阅读