文章目录
- numpy & Pandas
-
- ndarray
-
- array创建方法
- ndarray访问和修改
- ndarray删除和插入
- ndarray切片
- ndarray过滤
- ndarray集合运算
- ndarray运算与广播
- Pandas
-
- Series
-
- 创建Series
- Serie访问、修改和删除
- DataFrame
-
- 创建和保存dataframe
- 读取csv为dataframe并查看
- 访问、修改和删除dataframe
- 缺失值NaN
- dataframe分组
- apply进行批量操作
- pd.concat()
- pd.get_dummies()
- dtype,astype,type
numpy & Pandas ndarray ndarray:存放相同类型元素的多维数组,每个元素在内存中有相同存储大小的区域。
文章图片
array创建方法
np.array[1,2,3,4,5,6]
np.arange(6)np.arange(2,8, step=2,dtype = np.int64) #可限定范围和步长,指定dtype
np.ones((2,2))#全为1的矩阵
np.zeros((2,2))#全为0的矩阵
np.eye(3)#n维单位矩阵
np.random.rand(size)#[0,1)的随机值
np.random.randn(size) #返回值具有标准正态分布
np.random.randint(low,high,size) #[low,high)的随机整数组成的矩阵
x.reshape(3,2)#变更shape
np.save('filename',x)
np.load('filename.npy')
ndarray访问和修改
文章图片
文章图片
ndarray删除和插入
文章图片
文章图片
ndarray切片
文章图片
ndarray过滤
文章图片
ndarray集合运算
文章图片
ndarray运算与广播
文章图片
文章图片
文章图片
文章图片
Pandas Series
Series是一个类似于array的一维对象,与array不同的是,Series的每一个元素都可以给它分配索引标签
创建Series
文章图片
Serie访问、修改和删除 loc:通过index索引访问
iloc:通过行号索引访问
loc是指location的意思,iloc中的i是指integer
文章图片
DataFrame
创建和保存dataframe
文章图片
读取csv为dataframe并查看
文章图片
.head()
.describe()
.info()
文章图片
访问、修改和删除dataframe 【python|numpy,pandas学习笔记】
文章图片
文章图片
缺失值NaN NaN与任何值做比较计算都是false,甚至和NaN==NaN也是false
文章图片
文章图片
文章图片
dataframe分组
文章图片
文章图片
文章图片
apply进行批量操作
文章图片
文章图片
文章图片
分段制作交叉表
文章图片
文章图片
pd.concat()
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
keys=None, levels=None, names=None, verify_integrity=False)
输入的objs需要为dataframe组成的列表
pd.get_dummies()
pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False)
需要制定生成列名的前缀,prefix=
dtype,astype,type
文章图片
推荐阅读
- Python|【Python 实战基础】Pandas如何将数据处理后保存csv文件
- Python全栈基础教程|31.Python面向对象(四)【str和repr原理、魔法方法__call__和__new__方法、单例模式】
- Machine|最新Anaconda3的安装配置及使用教程(详细过程)
- python|想去看演唱却总是抢不到票(教你用Python制作一个自动抢票脚本)
- python面试题|python自动化测试面试题(二)(持续更新)
- python|python面试题——抽象基类和接口
- #|神经元的结构
- 计算机视觉|模板匹配与像素统计
- 字符串|7行代码让B站崩溃3小时,竟因“一个诡计多端的0”