python中的采样函数 numpy下采样( 三 )


将dataframe中,某列进行清洗的命令
删除换行符:misc['product_desc'] = misc['product_desc'].str.replace('\n', '')
删除字符串前后空格:df["Make"] = df["Make"].map(str.strip)
如果用模糊匹配的话,命令是:
rpt[rpt['STK_ID'].str.contains(r'^600[0-9]{3}$')]
对dataframe中元素,进行类型转换
df['2nd'] = df['2nd'].str.replace(',','').astype(int) df['CTR'] = df['CTR'].str.replace('%','').astype(np.float64)
#时间变换主要依赖于datemie和time两个包
#其他的一些技巧
df2[df2['A'].map(lambda x:x.startswith('61'))]#筛选出以61开头的数据
df2["Author"].str.replace(".+", "").head()#replace(".+", "")表示将字符串中以””开头;以””结束的任意子串替换为空字符串
commits = df2["Name"].head(15)
print commits.unique(), len(commits.unique())#获的NAME的不同个数,类似于sql里面count(distinct name)
#pandas中最核心 最经典的函数applymapapplymap
满满干货!20个Python使用的小技巧本节对一些 Python 易混淆的操作进行对比 。
1.1 有放回随机采样和无放回随机采样
1.2 lambda 函数的参数
1.3 copy 和 deepcopy
复制和变量别名结合在一起时 , 容易混淆:
对别名的修改会影响原变量,(浅)复制中的元素是原列表中元素的别名,而深层复制是递归地进行复制,对深层复制的修改不影响原变量 。
1.4 == 和 is
1.5 判断类型
1.6 字符串搜索
1.7 List 后向索引
这个只是习惯问题,前向索引时下标从0开始,如果反向索引也想从0开始可以使用~ 。
2.1 读写 CSV 文件
注意,当 CSV 文件过大时会报错:_csv.Error: field larger than field limit (131072) , 通过修改上限解决
csv 还可以读以分割的数据
2.2 迭代器工具
itertools 重新定义了很多迭代器工具,例如子序列工具:
序列排序:
多个序列合并:
2.3 计数器
计数器可以统计一个可迭代对象中每个元素出现的次数 。
2.4 带默认值的 Dict
当访问不存在的 Key 时 , defaultdict 会将其设置为某个默认值 。
2.5 有序 Dict
3.1 输出错误和警告信息
向标准错误输出信息
输出警告信息
控制警告消息的输出
3.2 代码中测试
有时为了调试,我们想在代码中加一些代码,通常是一些 print 语句,可以写为:
一旦调试结束,通过在命令行执行 -O 选项 , 会忽略这部分代码:
3.3 代码风格检查
使用 pylint 可以进行不少的代码风格和语法检查,能在运行之前发现一些错误
3.4 代码耗时
耗时测试
测试某代码块耗时
代码耗时优化的一些原则
4.1 argmin 和 argmax
argmax同理 。
4.2 转置二维列表
4.3 一维列表展开为二维列表
python中的采样函数的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于numpy下采样、python中的采样函数的信息别忘了在本站进行查找喔 。

推荐阅读