识字粗堪供赋役,不须辛苦慕公卿。这篇文章主要讲述大数据笔记:HDFS-伪分布式模式相关的知识,希望能为你提供帮助。
HDFS集群搭建-伪分布式模式前言【大数据笔记(HDFS-伪分布式模式)】博主语录:一文精讲一个知识点,多了你记不住,一句废话都没有
经典语录:美好的事情不是没有裂痕,而是满是裂痕而没有崩开
一、实操&
理论验证
- HDFS安装配置
- HDFS命令行使用
- 理论知识点验证
文章图片
https://hadoop.apache.org/docs/r2.6.5/??
- 支持最好的平台:GNU/Linux
- 依赖的软件:java,ssh
- 部署模式:
- Local (Standalone) Mode
- Pseudo-Distributed Mode
- Fully-Distributed Mode
- 基础设施
- 部署配置
- 初始化运行
- 命令行使用
1、设置IP及主机名
注意:大家看看自己的vm的编辑-> 虚拟网络编辑器-> 观察 NAT模式的地址
设置网络和设置IP
vi /etc/sysconfig/network-scripts/ifcfg-eth0
文章图片
http://node01:50070??
4、简单使用
hdfs dfs -mkdir /bigdata
hdfs dfs -mkdir-p/user/root
5、验证知识点
观察 editlog的id是不是再fsimage的后边
cd/var/bigdata/hadoop/local/dfs/name/current
SNN 只需要从NN拷贝最后时点的FSimage和增量的Editlog
cd /var/bigdata/hadoop/local/dfs/secondary/current
验证上传的大文件是否分块,分块最大文件是否128M
hdfs dfs -put hadoop*.tar.gz/user/root
cd/var/bigdata/hadoop/local/dfs/data/current/BP-281147636-192.168.150.11-1560691854170/current/finalized/subdir0/subdir0
for i in `seq 100000`; doecho "hello hadoop $i"> > data.txt; done
hdfs dfs -D dfs.blocksize=1048576-putdata.txt
cd/var/bigdata/hadoop/local/dfs/data/current/BP-281147636-192.168.150.11-1560691854170/current/finalized/subdir0/subdir0
检查data.txt被切割的块,数据是什么样子的
可以看到两个文件的数据直接切开,一行数据被切成一小段,这样的数据到计算会有问题吗?
其实是不影响的,至于什么原理,会在后面的笔记里详细给大家说明
推荐阅读
- OSPF路由重分发配置实例
- socket编程与线程的结合
- Pyhacker编写指南端口扫描器
- Python学习(自动化测试selenium的指定截图文件名(动态时间))
- 揭秘反射真的很耗时吗,射 10 万次用时多久
- 阿里云镜像迁移到Harbor详细的操作步骤
- 如何使用Python实现图像融合及加法运算()
- 大话数据结构溢彩加强版绪论篇
- Approximate Graph Propagation