Docker安装Presto连接Hive的详细过程
1、简介
Presto 是一个开源分布式 SQL 查询引擎,用于针对从千兆字节到 PB 级的各种规模的数据源运行交互式分析查询。Presto 允许查询数据所在的位置,包括 Hive、Cassandra、关系数据库甚至专有数据存储。单个 Presto 查询可以组合来自多个来源的数据,从而允许对整个组织进行分析。
2、下载安装
1)下载镜像
docker pull starburstdata/presto
【Docker安装Presto连接Hive的详细过程】2)下载客户端jar
因为pull下来的镜像是server,是没有presto-cli命令的,所以需要下载presto-cli-0.260.1-executable.jar,然后将下载好的jar包拉入Linux系统中。
下载完成后,run容器:
#端口号为8080,请自行修改,名字为prestodocker run -d -p 8080:8080--name presto starburstdata/presto
将客户端jar包拷贝到容器中的bin目录下:
docker cp [客户端jar包所在的linux路径] [容器名]:/bin
进入到hadoop配置文件目录,将core-site.xml和hdfs-site.xml复制到容器中
cd ${HADOOP_HOME}/etc/hadoopdocker cp core-site.xml presto:/usr/lib/presto/etc/docker cp core-site.xml presto:/usr/lib/presto/etc/
进入容器(以下不标注都是在容器中进行的操作):
#以root用户进入容器,防止没有权限操作文件docker exec --user=root -it presto /bin/bash
将客户端jar包改名并赋予可执行权限:
cd binmv presto-cli-0.260.1-executable.jar presto-clichmod a+x presto-cli
3、配置文件 进入配置文件目录,创建hive配置文件:
cd /usr/lib/presto/etc/catalogvi hive.properties
hive.properties:
#连接名,固定connector.name=hive-hadoop2#hive元数据uri,在hive-site.xml里能够找到,请自行修改ip和端口hive.metastore.uri=thrift://192.168.10.51:9083#hive配置的资源 core-site.xml和hdfs-site.xml,请根据自己集群中的配置文件路径进行修改,中间用逗号隔开hive.config.resources=/usr/lib/presto/etc/core-site.xml,/usr/lib/presto/etc/hdfs-site.xml
wq保存退出
重启容器(在linux命令行下):
docker restart presto
4、测试连接 进入容器:
#以root用户进入容器,防止没有权限操作文件docker exec --user=root -it presto /bin/bash#进入bin目录cd bin#执行命令行脚本并测试hive连接,连接到hive配置文件,数据库是default./presto-cli --server localhost:8080 --catalog hive --schema defaultpresto>show tables;
到此这篇关于Docker安装Presto连接Hive的详细过程的文章就介绍到这了,更多相关Docker安装Presto内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
推荐阅读
- Docker应用:容器间通信与Mariadb数据库主从复制
- Mac安装Chromedriver
- MongoDB,Wondows下免安装版|MongoDB,Wondows下免安装版 (简化版操作)
- MAC安装Mongo
- 【Hadoop踩雷】Mac下安装Hadoop3以及Java版本问题
- react|react 安装
- VueX--VUE核心插件
- python-安装sublime遇到异常
- typeScript入门基础介绍
- docker镜像探索----dive工具