datediff: 返回天数的差值
示例:datediff(a,b) 返回b-a的天数
row_number():对排序内容添加编号,多与over(partition by)等函数联用
【Hive 函数使用(一)(datediff,row_number,partition)】
over (partition by a):进行分组,常与聚合函数sum()、count()、avg()等结合使用,实现聚合分组
示例:function over (paritition by a)
sum(b) over (paritition by a)返回根据a进行分组的b的叠加值,如a为日期,b为登录记录,则返回每日的登录次数。
备注:使用的时候会有重复的现象,暂不知该如何处理11
group by:也是分组函数的一种,与partition的区别在于,group by 仅能显示与分组有联系的字段
示例: group by a,以a字段为基准进行分组
推荐阅读
- 大数据|大数据开发技术hive篇
- Hive中order by,sort by,distribute by,cluster by的区别
- SCD|一种基于SparkSQL的Hive数据仓库拉链表缓慢变化维(SCD2+SCD1)的示例实现
- Hive ORC和Parquet
- HiveQL执行过程
- hive-LanguageManual
- 关于Hive数据查询的18种方
- 大数据Hive系列之Hive API
- hive|使用Hive-JDBC遇到的一些问题解决