的好 你俩不行 流 大数据技术之Flink 还是我

  • 电脑网络维修
  • 2024-11-15

关于 MapReduce 和 Spark 来讲,这些数据是一少量数据,也称之为有界数据,对这些数据的计算就称为批计算。

随着移动互联网、物联网的兴起,每分每秒都在发生少量的数据,例如传感器发生的数据、订单买卖数据、用户行为记载等。这些无时不刻都在发生的数据,咱们称之为无界数据或流数据。通常被用于用户行为剖析启动实时介绍、开售数据实时剖析启动营销战略调整等场景。

MapReduce 和 Spark 这样的批计算系统就满足不了实时计算的需求。所以就降生了 Storm、Spark Streaming、Flink这些流计算系统。

批计算和流计算全体上班流程大体分歧,都有义务调度、计算结果聚合等环节。只不过由于数据源的要素,口头细节上会有所不同。这里有几个概念须要启动辨别,防止混杂:

批计算是对一批数据启动一次性计算,所以在每次调度计算义务时调配资源,计算成功后,对应的资源就会被监禁,下次在口头时从新调配资源。

流计算是对实时流进系统的数据启动不连续的计算,所以计算资源会一次性调配成功,后续的计算义务会不时运转,直到程序意外义务中止才会监禁资源。

由于 Spark Streaming 是建设在 Spark 基础上,所以义务口头还是 Spark 的逻辑,所以 Spark Streaming 算是一个“伪”流计算系统,属于批计算这一波。

便捷来说 Spark Streaming 经过很小的时时期隔(例如1秒)将实时数据搜集为“微批”数据,而后而后交给 Spark 处置。

Spark Streaming 微批数据

由于是距离一段时期再去计算,所以在实时性方面,Spark Streaming 就不如 Flink,如今说起流计算基本上就是在探讨 Flink 了。不过两者的架构和概念有很多相似的中央,也都是函数式编程。假设把握了 Spark ,学习 Flink 也就十分便捷轻松了。

至于 Storm ,作为早期的实时计算引擎并不允许有形态计算和exactly-once的语义,以及编码相对复杂,所以如今也缓缓被大家忘记。

假设有“Spark Streaming 搜集的数据是怎样分区的?”、“什么是有形态计算和exactly-once语义?”、“Flink 是如何做到数据、计算本地化?”

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/6620.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号