终究在说什么 当咱们说大数据Hadoop

  • 电脑网络维修
  • 2024-11-15

​前言

提到大数据,大致逃不过两个疑问,一个是海量的数据该如何存储,另外一个就是那么少数据该如何启动查问计算呢。好在这些疑问先人都有了处置方案,而Hadoop就是其中的佼佼者,是目前市面上最盛行的一个大数据软件,那它包含哪些内容呢?有什么特点呢?

Hadoop引见

提到Hadoop,大家的了解是什么?

狭义上了解,Hadoop指的是Apache软件基金会的一款用java言语成功,开源的软件,准许用户经常使用繁难的编程模型成功跨机器集群对海量数据启动散布式计算处置。

狭义上,Hadoop指的是围绕Hadoop打造的大数据生态圈,如下图所示, 其中Hadoop是整个生态圈的底座、地基,构建出整个大数据的生态系统。

Hadoop怎样来的?

Hadoop之父:Doug Cutting

《The Google file system》:谷歌散布式文件系统GFS

《MapReduce: Simplified>《Bigtable: A Distributed Storage System for Structured>Hadoop三大外围组件

hadoop重要由3大局部组成,俗称Hadoop三剑客:

Hadoop HDFS(散布式文件存储系统)

全称散布式文件系统,实质是一个文件系统,因为数据量很大,总不能将将一切数据存储到一台"电脑"上,哪有那么大磁盘的电脑,那么是不是可以存储到多个不同的"电脑"上,也就是散布式的,把文件存储在不同的节点中,重要是为了处置海量数据存储的疑问,它处在生态圈的底层与外围肠位。

Hadoop MapReduce(散布式计算框架)

MapReduce作为大数据生态圈第一代散布式计算框架,重要是处置了海量数据的计算疑问。

传统的计算模式普通都是将数据从各个节点上加载上来,而后一致计算。这样有个最大的弊病就是计算十分慢,只要一个节点上班。而MapReduce计算框架可以散布在各个节点上并行计算,最后启动归并。

留意,MapReduce只是一个计算框架,或许说编程模型,不是一个软件,无需部署。

Hadoop YARN(集群资源治理和义务调度平台)

YARN是散布式通用的集群资源治理系统和义务调度平台,怎样了解呢?

大数据的很多计算义务,比如MapReduce义务、或许其余的Spark义务等等,他们在计算的时刻须要CPU、内存、磁盘等资源,那么多个义务启动运算的时刻须要有个治理者去给他们启动资源调配、调度等,这个治理员就是YARN。

Hadoop好处

Hadoop为什么这么盛行,这和它的泛滥好处罚不开。

扩容才干

Hadoop是在可用的计算机集群间调配数据并成功计算义务的,这些集群可繁难灵敏的模式裁减到数以千计的节点。

老本低

Hadoop集群准许经过部署普通便宜的机器组成集群来处置大数据,以致于老本很低。看重的是集群全体才干。

效率高

经过并发数据,Hadoop可以在节点之间灵活并行的移动数据,使得速度十分快。

牢靠性

能智能保养数据的多份复制,并且在义务失败后能智能地从新部署(redeploy)计算义务。所以Hadoop的按位存储和处置数据的才干值得人们信任。

开源

因为Hadoop开源,所以整个社区生动度很高,很多企业都是基于Hadoop构建他们的大数据平台。

Hadoop架构变迁

Hadoop也不时在迭代更新,如今曾经到了3.0时代了,那么每个大版本有什么差异呢?

1.Hadoop 1.0时代

Hadoop1.0时代只要HDFS​(散布式文件存储)和MapReduce(资源治理和散布式数据处置)两局部。

2.Hadoop 2.0时代

Hadoop2.0时代引入了YARN作为一致的集群资源治理和义务调度平台,它不只可以提交自己的义务,还可以提交其余的一些义务,是一个很大的改革,也是保障Hadoop的统治位置的一大要素。

3.Hadoop 3.0时代

Hadoop 3.0架构组件和Hadoop 2.0相似, 然而3.0着重于性能优化。

Hadoop初体验

好了,上方基本讲清楚Hadoop的基本内容,那Hadoop终究长啥样呢?至于装置这边就不引见了。

Hadoop散布式文件系统

咱们可以在web上看到hadoop的文件系统,其实和咱们的目录没啥差异。

YARN集群资源治理和义务调度平台

咱们也可以在阅读器输入指定的地址看到之前都提交过上方样的计算义务。

至于MapReduce是看不到的,它只是一个计算框架,提交到这个Yarn上。

总结

本文解说了大数据开发中最盛行的软件Hadoop, 它重要分为3局部,治理文件存储的hdfs, 一致治理资源和义务的调度平台Yarn,以及提供了一种计算引擎MapReduce, 基于这三个"磐石",可以构建出整个大数据生态。

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/8033.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号