python筛选数据函数如何用python进行数据筛选 _盒子

Python数据处理：筛选、统计、连表、拼接、拆分、缺失值处理file1_path ='E:/Users/lenovo/Desktop/中视/622召回.csv'# 源数据
格式：file1=pd.read_csv(file1_path)
pd.read_csv(file1_path,encoding='gbk')
pd.read_csv(file1_path,encoding='gbk',skiprows=[2,3])
pd.read_csv(file1_path,encoding='gbk',skiprows=lambda x:x%2==1)
pd.read_csv(file1_path,encoding='gbk',keep_default_na=False)
new=pd.DataFrame()
new.new[[0,1,2]]
new.new[0:2]
查询结果同上
new.loc[new['激活数']1000]
loc和iloc的区别：
loc：纯标签筛选
iloc：纯数字筛选
#筛选出new的某两列
new=new.loc[:,['phone','收件人姓名']]
#筛选new的第0，1列
new.iloc[:,[0,1]]
使用‘==’筛选-筛查“崔旭”的人（只能筛查指定明确的）
#new=file1.loc[(file1['收件人姓名']=='崔旭')|(file1['收件人姓名']=='崔霞')]
#print(new)
#使用loc函数筛选-str.contains函数-筛查名字中包含'亮'和'海'的人
#new=file1.loc[file1['收件人姓名'].str.contains('亮|海')]
#print(new)
#使用loc函数筛选-str.contains函数-筛查'崔'姓的人
#new=file1.loc[file1['收件人姓名'].str.startswitch('崔')]
#print(new)
df = df[(df['DEPOSIT_PAY_TIME_x'] .notnull() )(df['DEPOSIT_PAY_TIME_x']!= "" )]
print("during_time(number)=0的个数：",newdata[newdata['during_time(number)'] ==0].count()['during_time(number)'])
print("during_time(number)=1,2,3的个数：",newdata[(newdata['during_time(number)'] 0)(newdata['during_time(number)'] 4)].count()['during_time(number)'])
print(newdata[newdata['during_time(number)'] ==0])
newdata[newdata['Team']. isin (['England','Italy','Russia'])][['Team','Shooting Accuracy']]
df.年龄.value_counts()
1.修改指定位置数据的值（修改第0行，’创建订单数‘列的值为3836）
new.loc[0,'创建订单数']=3836
2.替换‘小明’-‘xiaoming’
df.replace({'name':{'小明':'xiaoming'}})
3.批量替换某一列的值（把‘性别’列里的男-male ，女-felmale）
方法一：df['性别']=df['性别'].map({'男':'male','女':'female'})
方法二：df['性别'].replace('female','女',inplace=True)
或df['性别']=df['性别'].replace('female','女')这就是inplace的作用
+df['性别'].replace('male','男',inplace=True)
4.替换列索引
df.columns=['sex','name','height','age']
或者：df.rename(columns={'性别':'sex','姓名':'name','身高':'height','年龄':'age'})
5.删除某一列
del df['player']
6. 删除某一列（方法二），删除某一行（默认axis=0删除行，为1则删除列）
删除某一列（方法二）
df.drop('性别',axis=1)
删除某一行
df.drop(1,axis=0)
file1=pd.read_csv(file1_path)
file2=pd.read_csv(file2_path)
new1=pd.DataFrame()
new1['phone']=file1['phone']
new1['contact_time']=file1['contact_time']
new2=pd.DataFrame()
new2['phone']=file2['phone']
new2['submission_audit_time']=file2['提交审核时间']
newdata=https://www.04ip.com/post/pd.merge(new1,new2,on='phone',how='left')
df=pd.concat([df1,df2],axis=0)
【python筛选数据函数如何用python进行数据筛选】 4.2.2 横向表连接
df=pd.concat([df1,df2],axis=1)
df1['地区'].str.split('·',3,expand=True)
df1:
df1[['城市', '城区','地址']] = df1['地区'].str.split('·', 3, expand = True)
5.1 缺失值删除
data.dropna(axis=0,subset = ["Age", "Sex"])# 丢弃‘Age’和‘Sex’这两列中有缺失值的行
data.dropna(how = 'all')# 传入这个参数后将只丢弃全为缺失值的那些行
data.dropna(axis = 1)# 丢弃有缺失值的列（一般不会这么做，这样会删掉一个特征）

python筛选数据函数如何用python进行数据筛选

推荐阅读

su日照分析教程,su怎么做日照分析插件sunshine

大金空调出现代码反复出现是怎么回事,你遇到过这种情况吗？

蠕行系统应该在什么时候用

n95口罩能持续戴多久

嫂子在家炸鲫鱼怎么做家庭炸鲫鱼做法

C语言|C语言 OpenCV实现柱面投影

油葵怎么脱粒手工

剧荒了！有人能推荐什么好看的电影电视剧吗？综艺也行？

noteexpress官网，noteexpress怎么申请试用

肠粉配方你都学会了吗

《魔兽世界》幻化瓦里安国王的武器,这会是比“风剑”更拉风的神器外观吗？

2019年,你觉得哪些生意的前景比较好？

脸上有胎记有什么讲究吗脸上有胎记有什么讲究吗女生

酒精能杀墙上的霉菌吗

杭州西湖的灵隐禅踪景点怎么样？

k50|120W快充+性能铁三角，极致性价比的Redmi K50，你期待么？

家装app竞品分析报告,APP竞品分析报告

关于介绍学习方法的讲座结束语

阿里云主从mysql 阿里云mysql优势

法兰绒是什么材质? 法兰绒是什么材质

python筛选数据函数 如何用python进行数据筛选

推荐阅读

python筛选数据函数如何用python进行数据筛选