【Hadoop|HDFS篇】HDFS概述

1. HDFS产出背景及定义

1.1 HDFS产生背景

随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系
统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这
就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。


1.2 HDFS 定义


HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目
录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务
器有各自的角色。
HDFS 的使用场景:适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭
之后就不需要改变。

2. HDFS的优缺点

2.1 HDFS的优点

高容错性:

  • 数据自动保存多个副本。它可以通过增加副本的形式,提高容错率。
  • 某个副本丢失后,它可以自动恢复。

适合处理大数据:

  • 数据规模:能够处理数据规模达到GB,TB,甚至是PB级别的数据。
  • 文件规模:能够处理百万规模以上的文件数量,数量相当之大。 

可构建在廉价的机器上,通过多副本机制,提高可靠性。

2.2 HDFS的缺点

1) 不适合低延时数据访问,比如毫秒级的存储数据,是做不到的。
2) 无法高效的对大量小文件进行存储。

  • 存储大量小文件的话,它会占用NameNode大量的内存来存储文件目录和块信息。这样是不可取的,因为NameNode的内存总是有限的;
  • 小文件存储的寻址时间会超过读取时间,它违反了HDFS的设计目标。

3) 不支持并发写入、文件随机修改。

  • 一个文件只能有一个写,不允许多个线程同时写,
  • 仅支持数据append(追加),不支持文件的随机修改

3. HDFS的组成架构

1)NameNode(nn):就是master,它是一个主管,管理者。

  • 管理HDFS的名称空间。
  • 配置副本策略。
  • 管理数据块(Block)的映射信息。
  • 处理客户端读写请求。

2)DateNode:就是slave。NameNode下达命令,DateNode执行操作。

  • 存储实际的数据块。
  • 执行数据块的读写操作。

3)Client:就是客户端。

  • 文件切分。文件上传HDFS的时候,Client将文件切分成一个一个的Block,然后进行上传。
  • 与NameNode交互,获取文件的位置信息。
  • 与DataNode交互,读取或写入数据。
  • Client提供一些命令来管理HDFS,比如NameNode的格式化。
  • Client可以通过一些命令来访问HDFS,比如对HDFS的增删改查。

4)Secondary NameNode:并非NameNode热备。当NameNode挂掉的时候,并不能马上替换NameNode并提供服务。

  • 辅助NameNode,分担其工作量,比如定期合并Fsimage和Edits,并推送给NameNode。
  • 在紧急情况下,可辅助恢复NameNode。

4. HDFS文件块大小

HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs blocksize)来规定,默认大小在Hadoop3.x/2.x版本是128M,1.x版本是64M.

为什么块的大小不能设置太大,也不能设置太小。

(1)HDFS的块设置太小,会增加寻址时间,程序一直在找块的开始位置。

(2)如果块设置的太大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。导致程序在处理这块数据的时候,会非常慢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1522305.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

智能化升级:AI在客服知识库中的应用

引言 在数字化时代,客户服务已成为企业竞争的关键一环。随着人工智能(AI)技术的飞速发展,传统客服模式正经历着前所未有的变革。AI与客服知识库的深度融合,不仅极大地提升了客服处理的效率与准确性,还为用…

vue3集成sql语句编辑器

使用的是codemirror 安装 pnpm add codemirror vue-codemirror --savepnpm add codemirror/lang-sqlpnpm add codemirror/theme-one-dark使用 <template><codemirror v-model"configSql" placeholder"Code goes here..." ref"codemirrorR…

MIPI(Mobile Industry Processor Interface)

MIPI是指Mobile Industry Processor Interface&#xff0c;移动产业处理器接口&#xff0c;MIPI包含了多种接口&#xff0c;比如DSI显示屏接口、CSI摄像头接口、I3C、RFFE射频前端控制接口和SPMI系统电源管理接口。 车载液晶屏的接口主要使用RGB和LVDS&#xff0c;MIPI接口主要…

html+css+js网页设计 故宫7个页面 ui还原度100%

htmlcssjs网页设计 故宫7个页面 ui还原度100% 网页作品代码简单&#xff0c;可使用任意HTML编辑软件&#xff08;如&#xff1a;Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作&#xff09;。 获取源码 1…

汉诺塔的最简单讲解

##从印度佬哥那里学来&#xff0c;所以我想直接引用他画出来的树图 上图为一个经典的三碟盘的汉诺塔的递归树形图。 我们为了将所有碟盘按照从小到大的方式排列在目标处 --- 3 只用三步: 1. 将最小的碟盘和倒数第二的碟盘 全都移动到 2处 也就是中间那个棍子。 2.将最大的碟…

【服务对接】✈️SpringBoot 项目整合华为云 obs 对象存储服务

目录 &#x1f44b;前言 &#x1f440;一、环境准备 &#x1f331;二、整合实现 1.依赖引入 2.准备 AK 和 SK ​ 3.配置类 4.obs 工具类封装 &#x1f49e;️三、测试使用 &#x1f37b;四、 obs 客户端 &#x1f4eb;五、章末 &#x1f44b;前言 小伙伴们大家好&…

ini文件中的节点如何删除?

1、在某些场合中&#xff0c;会将某些数据记录本地情况&#xff0c;会有“保存/加载”过程。 比如&#xff1a; 第一次Write节点信息&#xff08;2个&#xff09;&#xff0c;如下节点 第二次Write节点信息&#xff08;1个&#xff09;&#xff0c;如下节点。会发现本来想写入…

《实战AI大模型》从入门到精通,彻底掌握AI技术

前言 《实战AI大模型》是一本兼具深度和广度的大模型入门书籍&#xff0c;它深入浅出地诠释了AI大模型的核心概念和技术。以大模型为代表的AI2.0是有史以来最重要的技术革命&#xff0c;如果你渴望了解和应用大模型&#xff0c;这本书是一份可贵的“知识基座” 无论你是NLP新手…

使用控制台与键盘进行输入输出

1、控制台简介与初始化 计算机在上电启动后&#xff0c;显示器被默认配置成80x25列的文本显示模式 。其使用从0xb8000开始&#xff0c;一共32KB的显存用于显示。如要在屏幕上指定位置显示特定的字符&#xff0c;则只需找到该位置对应的显存地址&#xff0c;写入2字节的数据&am…

海外直播对网速、带宽、安全的要求

要满足海外直播的要求&#xff0c;需要拥有合适的网络配置。在全球化的浪潮下&#xff0c;海外直播正逐渐成为企业、个人和各类组织的重要工具。不论是用于市场推广、品牌宣传&#xff0c;还是与观众互动&#xff0c;海外直播都为参与者带来了丰富的机会。然而&#xff0c;确保…

【C++从练气到飞升】19---哈希:哈希冲突 | 哈希函数 | 闭散列 | 开散列

&#x1f388;个人主页&#xff1a;库库的里昂 ✨收录专栏&#xff1a;C从练气到飞升 &#x1f389;鸟欲高飞先振翅&#xff0c;人求上进先读书&#x1f389; 目录 ⛳️推荐 一、unordered 系列关联式容器 二、unordered_map 1.1 unordered_map 介绍 1.2 unordered_map 的…

5大专业措施确保源代码防泄密

深信达的SDC防泄密软件通过一系列创新技术和方法来实现源代码的安全保护&#xff0c;以下是一些关键点和注意事项&#xff1a; 1. **内核级虚拟沙盒技术**&#xff1a;SDC沙盒创建一个与外部环境隔离的执行空间&#xff0c;源代码的编译、运行和调试过程完全隔离于外部操作系统…

部标JT808标准下的视频汇聚新方案:EasyCVR平台助力推动车辆监管智能化进程

在数字化转型的浪潮中&#xff0c;智慧城市的建设正以前所未有的速度推进&#xff0c;而市政车载设备作为城市运行的重要“神经末梢”&#xff0c;其智能化、联网化水平直接影响着城市管理效率与服务质量。近年来&#xff0c;随着部标协议&#xff08;即国家行业标准协议&#…

如何录制黑神话悟空的游戏BGM导入iPhone手机制作铃声?

在游戏的世界里&#xff0c;总有那么一些旋律&#xff0c;能够触动玩家的心弦&#xff0c;让人难以忘怀。《黑神话悟空》以其精美的画面和动人的背景音乐&#xff0c;赢得了无数玩家的喜爱。如果你也想将游戏中的背景音录制下来&#xff0c;制作成个性化的m4r格式铃声&#xff…

实例分割【YOLOv8版】

参考文档 Segment - Ultralytics YOLO Docs​docs.ultralytics.com/tasks/segment/ 何为实例分割&#xff1f; 实例分割比目标检测更进一步&#xff0c;涉及识别图像中的各个对象并将它们与图像的其余部分分割开来。 实例分割模型的输出是一组用于勾勒图像中每个对象的掩码…

element-plus表单项循环的得到的。并且一个项里面有多个子项需要校验。

数据内容循环得到。并且还可以自己增加减少。怎么给他写校验呢&#xff1f; <el-formref"ruleFormRef":rules"rules":model"row" > <el-form-item:label"index>0?:资质及职称"v-for"(item,index) in row!.userTitl…

EE trade:区块链工程专业是什么

区块链技术&#xff0c;作为近年来最具颠覆性的技术之一&#xff0c;正在深刻地改变着我们的生活方式和商业模式。区块链工程专业&#xff0c;应运而生&#xff0c;旨在培养能够胜任区块链领域技术开发、应用和管理的专业人才&#xff0c;为数字经济发展提供强有力的人才支撑。…

HTB-bike(SSTI模版注入)

前言 大家好&#xff0c;我是qmx_07,今天给大家讲解bike靶场 渗透过程 信息搜集 服务器开放了 22 ssh 和 http80端口 Wappalyzer 介绍&#xff1a;Wappalyzer是一种浏览器扩展程序&#xff0c;用于识别正在访问的网站所使用的技术栈和工具&#xff0c;比如使用的web框架&…

算法设计与分析:实验1 排序算法性能分析

1.常见排序算法分析 &#xff08;1&#xff09;选择排序 算法原理&#xff1a; 从数组 a[1--n] 中找到最小的元素&#xff0c;将其与第一个元素 a[1] 进行值的交换&#xff0c;这样数组中第一个位置就是最小的元素&#xff0c;即第一个位置变得有序。接着从数组 a[2--n] 中找…

Codeforces Round 969 (Div. 2 ABCDE题) 视频讲解

A. Dora’s Set Problem Statement Dora has a set s s s containing integers. In the beginning, she will put all integers in [ l , r ] [l, r] [l,r] into the set s s s. That is, an integer x x x is initially contained in the set if and only if l ≤ x ≤…