文章目录
- Hive shell脚本企业实战用法,定时调度
-
- 建立分区表
- 增加分区
- 查看某个表的所有分区
- 往分区中插入数据
- 在shell命令中运行Hive的SQL
-
- 使用hive -e
- 使用hive -f
- 使用Shell脚本定时调度
-
- 新建.sh脚本文件
- 编辑hql.sh
- 修改hql.sh权限
- 新建并编辑stu_pt.sql文件
- 新建logs目录
- 编辑定时器
- 运行
- 查看logs目录下的日志文件
Hive shell脚本企业实战用法,定时调度 【hadoop|13、Hive数据仓库——结合shell脚本企业实战用法,定时调度】??在我们日常的工作中,肯定不会一条一条的使用SQL去取出你想要的数据,这个时候我们就可以用Linux中的定时器Shell脚本。我们可以编写一个定时任务,一小时或者一天将SQL写入脚本,让SQL自动执行然后取出数据即可,这样我们就可以实现了数据的定时调度。
建立分区表
create external table students_pt1
(
id bigint
,name string
,age int
,gender string
,clazz string
)
PARTITIONED BY(pt string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LOCATION '/student/input1';
增加分区
alter table students_pt1 add partition(pt='20220220');
alter table students_pt1 add partition(pt='20220219');
alter table students_pt1 add partition(pt='20220218');
alter table students_pt1 add partition(pt='20220221');
alter table students_pt1 add partition(pt='20220222');
alter table students_pt1 add partition(pt='20220223');
alter table students_pt1 add partition(pt='20220224');
查看某个表的所有分区
show partitions students_pt1;
往分区中插入数据
insert into table students_pt1 partition(pt='20220220') select * from student1;
load data local inpath '/usr/local/soft/data/students.txt' into table students_pt1 partition(pt='20200221');
在shell命令中运行Hive的SQL 使用hive -e
hive -e "select * from test1.students limit 10"
文章图片
使用hive -f
??在/usr/local/soft/目录下创建scripts目录,并创建stu.sql文件
cd /usr/local/soft/
mkdir scripts
vim stu.sql
??在stu.sql里编辑一条SQL(这里写最简单的),注意这里不带分号;
select * from test1.students limit 10
文章图片
[root@master scripts]# hive -f stu.sql
文章图片
使用Shell脚本定时调度 新建.sh脚本文件
vim hql.sh
编辑hql.sh
#!/bin/sh
#date="2022-02-22"
date=$(date"+%Y%m%d")
#sql1="select * from test1.students_pt1 where pt='${date}'"
#hive -e "${sql1}"
sed -i "s/!everydate!/${date}/" /usr/local/soft/scripts/stu_pt.sql
cat/usr/local/soft/scripts/stu_pt.sql
hive -f/usr/local/soft/scripts/stu_pt.sql
sed -i "s/${date}/!everydate!/" /usr/local/soft/scripts/stu_pt.sql
cat /usr/local/soft/scripts/stu_pt.sql
修改hql.sh权限
chmod a+x hql.sh
新建并编辑stu_pt.sql文件
vim stu_pt.sql
select * from test1.students_pt where pt='!everydate!';
新建logs目录
[root@master scripts]# mkdir logs
编辑定时器
crontab -e
*/1 * * * * /usr/local/soft/scripts/hql.sh >> /usr/local/soft/scripts/logs/1.log
运行
- 在scripts目录下运行脚本
sh hql.sh或./hql.sh
查看logs目录下的日志文件
cd /usr/local/soft/scripts/logs/cat 1.log
文章图片
到底啦!关注靓仔学习更多的大数据技术!( ?? ω ?? )?
推荐阅读
- 电商数仓|电商数据仓库系统
- hadoop|5、Hive数据仓库——Hive分区及动态分区
- 大数据|为什么要做数仓分层,不做行吗()
- hive|面试官(hive表有数据,但为什么impala查询不到数据())
- Hive|Hive-sql连续登陆问题
- 大数据|大数据计算框架与平台--深入浅出分析
- kafka|kafka 基础知识 第一讲
- #|用户行为采集平台搭建
- 大数据|15道经典大数据面试题