Hive 函数使用(一)(datediff,row_number,partition)

datediff: 返回天数的差值
示例:datediff(a,b) 返回b-a的天数


row_number():对排序内容添加编号,多与over(partition by)等函数联用
【Hive 函数使用(一)(datediff,row_number,partition)】

over (partition by a):进行分组,常与聚合函数sum()、count()、avg()等结合使用,实现聚合分组
示例:function over (paritition by a)

sum(b) over (paritition by a)返回根据a进行分组的b的叠加值,如a为日期,b为登录记录,则返回每日的登录次数。
备注:使用的时候会有重复的现象,暂不知该如何处理11


group by:也是分组函数的一种,与partition的区别在于,group by 仅能显示与分组有联系的字段
示例: group by a,以a字段为基准进行分组

    推荐阅读