hadoop大数据平台

java环境 java-1.8.0-openjdk-devel

jvm虚拟机

hadoop软件解压即可用

JAVA_HOME是java的安装路径

hadoop对主机名强依赖，意思是主机名hostname要能ping通

jar命令是运行一个jar文件

hadoop要运行，主要依赖两个的配置

JAVA_HOME

HADOOP_CONF_DIR

hadoop里面client是切分文件

分片、副本，和es差不多

namenode管理数据分片之后存储到哪里

fsimage 名称空间与数据块的映射信息

副本策略也是namenode负责

hadoop三大核心组件

HDFS

Mapreduce

Yarn

.xml 是可扩展标记语言

配置hadoop是在做填空题

jsp命令查询java系统的角色

hdfs是hadoop的文件系统

yarn是分布式计算框架

datanode所消耗的资源主要为磁盘的io

也就是说使用raid阵列可以优化磁盘的io消耗

zookeeper 应用程序协调服务

hadoop\zookeeper\kafka都是java写的，也都是apache基金会的开源项目

hadoop的namenode有点像k8s的etcd

haproxy可以走tcp也可以走http

Haproxy对于后端服务器的健康检查默认是用tcp三次握手，可以选http状态码检查

nginx\haproxy\lvs\keepalived负载均衡反向代理健康检查，这些功能，在云平台都用一个ELB给解决了。如果在物理机上部署服务的话，keepalived高可用感觉很实用，装个软件，配个虚拟ip，就跟那个虚拟路由器是一个工作原理。

批量操作的时候，感觉ansible还有点绕，直接在命令行写循环，也挺好用的，有的也可以用windterm等软件的同步输入。

看了hadoop的视频，感觉其他软件的配置都简单多了，hadoop是真的步骤多。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/14433.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

hadoop大数据平台

相关文章

每日OJ题_牛客_奇数位丢弃_找规律/模拟_C++_Java

解决table下tr或td选中不生效的问题

学籍拍照助手，中小学新生学籍证件照电脑端拍照教程

SE30 程序运行时间评估

T-Rex Label标注

部署zabbix遇到问题: cannot find a valid baseurl for repo：centos-sclo-rh/x86 64 怎么解决？

小程序+公众号统一账号unionid，实现pc+公众号+小程序统一身份

LeetCode【0037】解数独

零碎02-接口文档管理

指标体系构建：如何设计北极星指标设计？

三菱FX5UPLC以太网Socket通信功能Passive开放的程序示例

【MATLAB源码-第292期】基于matlab的4ASK调制解调窄带通信系统仿真，输出各节点波形图以及误码率曲线图。

【搜索结构】AVL树的学习与实现

【专题】2024年中国消费者消费意愿调查报告汇总PDF洞察（附原数据表）

推荐一款游戏玩家性能优化工具：Razer Cortex

人工智能（AI）对于电商行业的变革和意义

1435：【例题3】曲线一本通代替三分

英伟达Isaac Manipulator产品体验

“非法”操控lambda（python）

[ 网络安全介绍 5 ] 为什么要学习网络安全？