当前位置: 首页 > article >正文

02.Flink内存模型以及细粒度的资源管理

本文主要介绍下Flink对内存是怎么分配的以及相应的配置优化,还会介绍下Flink对资源更细粒度的管理策略

1. Flink的内存组成

Flink的内存从功能上包括Flink总内存和JVM特定内存两部分,其中重要的是Flink总内存的构成,它的构成分为heap memory 和off-heap memory。heap memory又分为framework memory和task memory。off-heap memory 分为managed memory(托管内存)和Direct memory,其中direct memory又分为,network memory,framework off-heap memory ,task off-heap memory,具体如下图所示

在这里插入图片描述

  • Flink总内存: 在yarn部署模式下通过taskmanager.memory.process.size指定大小(必须指定),这个指定大小是TM的总体大小,Flink总内存大小还需要减去JVM特定内存大小
  • Flink堆内存: 主要有framework和task memory,它们主要是运行用户程序代码的时候使用,它通过taskmanager.memory.framework.heap.size(默认128M)和taskmanager.memory.task.heap.size(没有默认值,不指定会通过计算得到)
  • Managed memory: managed memory用于代码中状态后端的存储开销,通过taskmanager.memory.managed.size没有默认值一般不指定,一般会根据比例参数来修改taskmanager.memory.managed.fraction(默认flink总内存的0.4)
  • direct memory: 它主要作用是减少GC压力,并提升性能和效率,其中包括framework off-heap,task off-heap以及network
    • 其中framework off-heap memory,task off-heap memory跟堆上的framework,taskmemory功能类似
    • network: 它用于网络数据交换,数据传输的本地缓存,例如:TM之间的shuffle,广播,与外部组件的数据传输。它通过taskmanager.memory.network.min(默认64M),taskmanager.memory.network.max(默认1G),taskmanager.memory.network.fraction(默认是Flink总内存的0.1)这些参数来控制,用的最多的是通过调整比例来控制
  • JVM特定内存: 它用来存储JVM加载类的元数据信息

2.Flink的精细化资源管理

flink默认情况下是通过粗粒度的方式管理资源,也就是TM在分配slot的资源时,每个slot中的资源是一样的,这在大多数的情况下是没有问题的,如果在整个pipeline中,各个Task的并行度差异很大的情况下,粗粒度的方式的资源利用率就会 很低下,就以如下的图所示,上游需要128个并行度而下游只需要8个并行度,如果按照粗粒度的管理方式,128个slot中有112个slot只需要运行kafka对应的task,而它拥有的资源是跟跑完整个pipeline所在的槽是一样的,而且slot之间资源是不共享的(subtask是可以共享slot达到资源高效利用的目的),这就会导致资源的浪费。

在这里插入图片描述
所有就需要更加细粒度的资源管理方案,就是TM在通过按需来分配slot给到对应的任务运行,如下图所示,按照各个算子链并发度和对应的资源需求分成了四组,每组给他们分配不同资源的slot,这样就能使资源更高效的利用

在这里插入图片描述

  • 具体实现
    代码中通过创建不同的SlotSharingGroup对象,然后在不同的SlotSharingGroup对象中配置相应需要的资源即可,SlotSharingGroup对象中可根据需求配置CPU cores,Task Heap Memory,Task off-heap memory,Managed Memory,以及额外的自定义资源如GPU资源

http://www.kler.cn/a/514070.html

相关文章:

  • C++语言的区块链
  • [答疑]这个消息名是写发送数据还是接收数据
  • [HCTF 2018]WarmUp
  • day 21
  • 计算机网络 (54)系统安全:防火墙与入侵检测
  • GS论文阅读--GeoTexDensifier
  • Python 模拟真人鼠标轨迹算法 - 防止游戏检测
  • 【Prometheus】PromQL进阶用法
  • MAC 地址转换为标准大写格式
  • YOLOv9改进,YOLOv9检测头融合DiverseBranchBlock(多样分支块),适合目标检测、分割任务
  • 支持向量机SVM的应用案例
  • Python爬虫获取微店商品详情时如何设置请求头
  • Java毕设项目:基于Springboo校园足球社团网站系统设计与实现开题报告
  • Go项目实战-让自定义Error支持Go的errors.Is判定以及原型模式的应用
  • 高并发内存池_各层级的框架设计及ThreadCache(线程缓存)申请内存设计
  • 使用递归处理无限自关联表
  • 如何使用Python爬虫按关键字搜索AliExpress商品:代码示例与实践指南
  • go读取excel游戏配置
  • 第四天 深入学习JavaScript,包括函数、数组、对象、闭包等
  • VUE3 vite下的axios跨域
  • React 中hooks之 React.memo 和 useMemo用法总结
  • 红外热成像之无人机载荷
  • 跨站脚本攻击(XSS)原理及防护方案
  • 优秀代码段案例__笔记
  • C++11的多线程
  • 亚博microros小车-原生ubuntu支持系列:1 键盘控制