python聚合函数详解 python聚合函数有哪些( 三 )


本文将这68个内置函数综合整理为12大类,正在学习Python基础的读者一定不要错过,建议收藏学习!
(1)列表和元组
(2)相关内置函数
(3)字符串
frozenset 创建一个冻结的集合,冻结的集合不能进行添加和删除操作 。
语法:sorted(Iterable, key=函数(排序规则), reverse=False)
语法:fiter(function. Iterable)
function: 用来筛选的函数. 在?lter中会自动的把iterable中的元素传递给function. 然后根据function返回的True或者False来判断是否保留留此项数据 , Iterable: 可迭代对象
搜索公众号顶级架构师后台回复“面试”,送你一份惊喜礼包 。
语法 : map(function, iterable)
可以对可迭代对象中的每一个元素进行映射. 分别去执行 function
hash : 获取到对象的哈希值(int, str, bool, tuple). hash算法:(1) 目的是唯一性 (2) dict 查找效率非常高, hash表.用空间换的时间 比较耗费内存
利用Python进行数据分析(9)-重采样resample和频率转换Python-for-data-重新采样和频率转换
重新采样指的是将时间序列从一个频率转换到另一个频率的过程 。
但是也并不是所有的采样方式都是属于上面的两种
pandas中使用resample方法来实现频率转换,下面是resample方法的参数详解:
将数据聚合到一个规则的低频上,例如将时间转换为每个月,"M"或者"BM" , 将数据分成一个月的时间间隔 。
每个间隔是半闭合的,一个数据只能属于一个时间间隔 。时间间隔的并集必须是整个时间帧
默认情况下,左箱体边界是包含的 。00:00的值是00:00到00:05间隔内的值
产生的时间序列按照每个箱体左边的时间戳被标记 。
传递span class="mark"label="right"/span可以使用右箱体边界标记时间序列
向loffset参数传递字符串或者日期偏置
在金融数据中,为每个数据桶计算4个值是常见的问题:
通过span class="girk"ohlc聚合函数/span能够得到四种聚合值列的DF数据
低频转到高频的时候会形成缺失值
ffill() :使用前面的值填充,limit 限制填充的次数
python--pandas分组聚合groupby 方法是pandas中的分组方法,对数据框采用 groupby 方法后,返回的是 DataFrameGroupBy 对象,一般分组操作后会进行聚合操作 。
对数据框按 A 列进行分组,产生分组数据框 。分组数据框是可迭代对象,可以进行循环遍历,可以看出在循环中,每个元素的类型是元组 , 
元组的第一个元素是分组值 , 第二个元素是对应的分组数据框 。
可以对分组后的数据框直接使用聚合方法 agg,对分组数据框的每一列计算统计函数值 。
可以根据数据框外的序列数据对数据框进行分组,需要注意 序列长度需要与数据框行数相同。
可以根据数据框的多列对数据框进行分组 。
根据 A , B 列进行分组 , 然后求和 。
可以根据索引对数据框进行分组 , 需要设置 level 参数 。
数据框只有一层索引,设置参数 level=0。
当数据框索引有多层时 , 也可以根据需求设置 level 参数,完成分组聚合 。
设置 level 参数 , 如需要根据第一层索引,即 id1 进行分组,可以设置 level=0 或 level='id1' 完成分组聚合 。
分组后一般会进行聚合操作,用 agg 方法进行聚合 。
对分组后数据框使用单个函数进行聚合,单个聚合函数会对每列进行计算,然后合并返回 。聚合函数以字符串的形式传入 。
可以对分组后的数据指定列进行分组聚合 。需要注意 子列需要用[]包裹。
聚合函数也可以传入自定义的匿名函数 。

推荐阅读