大数据笔记（HDFS权限和Java的api使用） _大数据

宝剑锋从磨砺出，梅花香自苦寒来。这篇文章主要讲述大数据笔记：HDFS权限和Java的api使用相关的知识，希望能为你提供帮助。
HDFS权限和 java的api使用前言博主语录：一文精讲一个知识点，多了你记不住，一句废话都没有
经典语录：别在生活里找你想要的，要去感受生活里发生的东西
一、HDFS的权限1、启蒙案例
Permission Owner Group Size Replication Block Size Name
drwxr-xr-x root supergroup 0 B 0 0 B user
-rw-r--r-- root supergroup 8.61 KB 2 128 MB install.log
2、基本特征

HDFS是一个文件系统
类似unix、linux有用户概念
HDFS有相关命令和接口去创建用户
有超级用户的概念

linux系统中超级用户：root
hdfs系统中超级用户：是namenode进程的启动用户

有权限概念

hdfs的权限是自己控制的来自于hdfs的超级用户
3、实操
注意：一般在企业中不会用root做什么事情
面向操作系统
root是管理员其他用户都叫【普通用户】
面向操作系统的软件
谁启动，管理这个进程，那么这个用户叫做这个软件的管理员
实操案例
切换我们用root搭建的HDFS
用god这个用户来启动
重复操作node01~node04:

sh stop-dfs.sh

3.1、添加用户：root

useradd god
passwd god

3.2、将资源与用户绑定

chown -R godsrc
chown -R god /opt/bigdata/hadoop-2.6.5
chown -R god /var/bigdata/hadoop

3.3、切换到god去启动

sh start-dfs.sh

为了拿到.ssh

ssh localhost

给god做免密
注意：我们是HA模式：免密的2中场景都要做的

# node01~node02:
cd /home/god/.ssh
ssh-keygen -t dsa -P-f./id_dsa

# node01:
ssh-copy-id -i id_dsa node01
ssh-copy-id -i id_dsa node02
ssh-copy-id -i id_dsa node03
ssh-copy-id -i id_dsa node04

# node02
cd /home/god/.ssh
ssh-copy-id -i id_dsa node01
ssh-copy-id -i id_dsa node02

修改hdfs-site.xml

< property>
< name> dfs.ha.fencing.ssh.private-key-files< /name>
< value> /home/god/.ssh/id_dsa< /value>
< /property>

分发给node02~04
3.4、使用god用户重启HDFS

sh start-dfs.sh

4、用户权限验证实操
在node01执行操作

su god
hdfs dfs -mkdir/temp
hdfs dfs -chown god:ooxx/temp
hdfs dfs -chmod 770 /temp

在node04执行操作

useradd good
groupadd ooxx
usermod -a -G ooxx good
id good
su good
hdfs dfs -mkdir /temp/abc# 失败
hdfs groups

用户good操作失败因为hdfs已经启动了，不知道你操作系统又偷偷摸摸创建了用户和组
成功操作命令

useradd good
groupadd ooxx
usermod -a -G ooxx good
su god
hdfs dfsadmin -refreshUserToGroupsMappings

注意需要在namenode的节点执行，其他节点是无效的

执行上面命令就可以刷新用户权限

结论：默认hdfs依赖操作系统上的用户和组
二、hdfs中Java的api使用windows idea eclips 叫什么？
集成开发环境
语义：
开发hdfs的client
权限：
1）参考系统登录用户名；
2）参考环境变量；
3）代码中给出；
HADOOP_USER_NAME god
这一步操作优先再启动idea

JDK版本：
集群和开发环境jdk版本一致
maven：
构建工具
【大数据笔记（HDFS权限和Java的api使用）】文件操作代码

package com.lanson.bigdata.hadoop.hdfs;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.io.IOUtils;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.net.URI;

public class TestHDFS

public Configuration conf = null;
public FileSystem fs = null;

//C/S
@Before
public void conn() throws Exception
conf = new Configuration(true); //true
//fs = FileSystem.get(conf);
//< property>
//< name> fs.defaultFS< /name>
//< value> hdfs://mycluster< /value>
//< /property>
//去环境变量 HADOOP_USER_NAMEgod
fs = FileSystem.get(URI.create("hdfs://mycluster/"),conf,"god");

@Test
public void mkdir() throws Exception

Path dir = new Path("/lanson01");
if(fs.exists(dir))
fs.delete(dir,true);

fs.mkdirs(dir);

@Test
public void upload() throws Exception

BufferedInputStream input = new BufferedInputStream(new FileInputStream(new File("./data/hello.txt")));
Path outfile= new Path("/lanson/out.txt");
FSDataOutputStream output = fs.create(outfile);

IOUtils.copyBytes(input,output,conf,true);

@Test
public void blocks() throws Exception

Path file = new Path("/user/god/data.txt");
FileStatus fss = fs.getFileStatus(file);
BlockLocation[] blks = fs.getFileBlockLocations(fss, 0, fss.getLen());
for (BlockLocation b : blks)
System.out.println(b);

//0,1048576,node04,node02A
//1048576,540319,node04,node03B
//计算向数据移动~！
//其实用户和程序读取的是文件这个级别~！并不知道有块的概念~！
FSDataInputStream in = fs.open(file); //面向文件打开的输入流无论怎么读都是从文件开始读起~！

//blk01: he
//blk02: llo lanson 66231

in.seek(1048576);
//计算向数据移动后，期望的是分治，只读取自己关心（通过seek实现），同时，具备距离的概念（优先和本地的DN获取数据--框架的默认机制）
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((char)in.readByte());
System.out.println((

推荐阅读

马纳西·索加瓦雷|所罗门群岛“沦陷”，世界只剩9块无新冠“最后的净土”

科目三考试16个项目雷区科目三考试16个项目雷区是什么

男性长出疣体会自愈么,男性尖锐湿疣平时注意卫生能痊愈么

考普通三轮摩托车证需要什么

高像素|小米全新高像素屏下前摄正在测试

vivox21i和x21ia手机壳有什么区别 vivox21i和x21有什么区别

技师学院是什么学历技师学院毕业后是什么学历?

路书是什么

楼梯间纪文|楼梯间纪文 -序

生姜可以放在冰箱吗？影响和保鲜方法详解

嵩阳景区什么时候开放 2023郑州嵩阳景区免门票吗？

情感签名说说心情短语大全情感签名说说心情短语大全女生

甘草和什么一起吃容易中毒？

苹果手机为什么总是突然卡，苹果手机突然老卡什么原因

宾利哪个好劳斯莱斯和玛莎拉蒂哪个好

怎样清除热点资讯怎样清除热点资讯记录

有关元旦节祝福语

三伏天艾灸的最佳时间？

节假日加班费怎么计算节假日加班费

iOS内存分析（静态分析）

Android平台音视频RTMP推送|GB28181对接之动态水印设计

布隆过滤器 - Redis 布隆过滤器，Guava 布隆过滤器 BloomFilter

Redisson 概述（什么是Redisson ，Redisson 能干什么）

Kubernetes水平自动扩缩容Hpa-超详细文档

我读《异类》 - 马尔科姆 · 格兰德威尔 / 马太效应

通过Everything 快速搭建局域网内文件服务器

Calico BGP RR Model

Maven 指令 install 和 package 的区别

OpenOffice配置成Windows服务